弱引用TWeakObjectPtr原理
弱引用的原理从通用思路到 UE TWeakObjectPtr原理总结!!#ff0000 UE 的 GC 体系有一张全局对象表 GUObjectArray弱引用存了一个索引以及这个物体创建时的序列号简单来说是不是弱引用先拿着索引去序列号找一下然后看看这个对象的序列号和我之前存的对不对得上如果对上了再看看对象是否存活!!零、问题从哪来我们先把弱引用要解决的问题讲清楚。强引用普通智能指针、UPROPERTY()字段等的语义很简单只要我还指着这个对象它就不能死。这种引用的代价是会绑架对象的生命周期谁都不肯松手对象就活着容易出引用环、容易让对象超期存活。弱引用的目标恰好相反它要做到两件看似矛盾的事我能指向一个对象但绝不阻止它被销毁。对象死了之后我能立刻识别出它没了而不是踩到野指针。第一点容易——存个裸指针就行。难点在第二点。一旦对象被销毁它原来占的那块内存可能马上就被分配给别的对象。这种情况下T0对象 A 活着地址 0x1234 T1A 被销毁 T2新对象 B 创建出来碰巧也分到 0x1234 我手里有个指向 0x1234 的指针此时它指的是 A 还是 B裸指针对此一无所知。这就是弱引用需要解决的核心难题在对象可能被销毁、内存可能被复用的前提下如何判断我指的那一个还在不在。业界的弱引用实现归根结底都是在回答这一个问题只是回答的方式各有不同。一、通用层面三种弱引用实现思路思路一控制块 引用计数C std::weak_ptr┌──────────┐ ┌────────────────┐ ┌──────────┐ │ weak_ptr ├─────►│ Control Block ├─────►│ Object │ └──────────┘ │ strong: 3 │ │ (Data) │ │ weak: 2 │ └──────────┘ └────────────────┘ 强引用归零 → 销毁 Object控制块保留 弱引用归零 → 控制块也销毁这种思路的精髓是把是否还活着这个信息从对象身上剥离出来单独放到一个控制块里。对象死了控制块还在所以弱引用通过查控制块就能稳稳判断。它的代价是每个被弱引用追踪的对象都要多出一个控制块的内存和分配开销。同时多线程下控制块的引用计数得是原子操作。对于大量小对象的场景这个开销不小。思路二句柄表 序列号全局对象表: 索引 [0] [1] [2] [3] 对象指针ObjA ObjB null ObjC 版本号 gen5 gen2 gen8 gen1 弱引用本身 (Index, Generation) WeakRef{ Index1, Gen2 } → 查表槽位 gen 也是 2 → 有效 对象 B 销毁、槽位被新对象 D 复用后 gen3 WeakRef{ Index1, Gen2 } → 槽位 gen 现在是 3对不上 → 失效不维护单独的控制块而是借助一张全局的对象表。每个槽位除了存对象指针还存一个版本号。弱引用不存裸指针而是存在表的哪一格 当时的版本号。校验是否还活着的逻辑变得极其简单拿自己记的版本号和表里当前槽位的版本号一比就行。类比你说3 号宿舍的现住户。3 号是位置Index“现住户是个会变的概念。光记位置不够——位置上的人可能换了。要精确指认一个人得说3 号宿舍 2024 届那批人里的某某”那个届就是 Generation。这种思路的优点是弱引用本身极轻量两个整数不侵入对象本身也不需要每个对象多一个控制块。缺点是每次解引用要查表多一次间接寻址。UE 的TWeakObjectPtr走的就是这条路下一章会详细讲。思路三侵入式标记让对象自己带一个全局唯一 ID 和是否还活着的标记弱引用记下 ID 用来比对。这种思路单独使用问题不少对象死后访问内存本身就是 UB实际方案里很少见。它的思路通常会和句柄表结合演变成思路二的变种。二、UE 的实现选择为什么走句柄表 序列号UE 的 GC 体系本身就有一张全局对象表GUObjectArray——所有 UObject 创建出来都登记进去UObject 自己也记着自己在表里的索引。也就是说这张表是已经存在的基础设施不是为弱引用专门建的。在这个前提下选择句柄表 序列号几乎是顺理成章的——只要给表里的每个槽位加一个版本号字段弱引用机制就成了。如果走控制块路线反倒要给每个 UObject 多分配一个控制块对一个动辄上万 UObject 的引擎来说开销显然不可接受。这是合理推论UE 选择这套方案的根本动机是要让弱引用机制复用现有的对象表基础设施把单个弱引用的存储成本压到最低8 字节。三、TWeakObjectPtr的内部结构只看数据成员的话它简单得有点出乎意料structFWeakObjectPtr{int32 ObjectIndex;// 对象在 GUObjectArray 里的索引int32 ObjectSerialNumber;// 创建弱引用时记下的序列号};templateclassTstructTWeakObjectPtr:publicFWeakObjectPtr{// 模板参数 T 只是用来做类型安全不占额外存储};就这两个int32加起来 8 字节。和一个 64 位裸指针一样大但能力完全不同。这两个字段的语义是ObjectIndex—— 这个对象在全局对象表里坐第几格ObjectSerialNumber—— 我创建这个弱引用的时候那一格上的对象是哪一代光有 Index 不够因为槽位会被复用。光有 SerialNumber 也不够因为序列号是按槽位走的。两个合起来才能唯一定位哪个槽位的哪一代对象。四、它依赖的基础设施GUObjectArray要看懂TWeakObjectPtr怎么工作必须先理解它依赖的全局对象表。UE 所有 UObject 创建出来都会被登记到GUObjectArray里。每个槽位的结构大致是structFUObjectItem{UObjectBase*Object;// 对象本体指针int32 Flags;// 状态标志PendingKill、Unreachable、RootSet...int32 ClusterRootIndex;int32 SerialNumber;// ★ 关键这个槽位当前的版本号};整张表的状态可能长这样GUObjectArray 全景 索引: [0] [1] [2] [3] [4] Object: PlayerA ItemX null EnemyZ WidgetY Serial: 100 57 — 88 42 ↑ 槽位空着下次新对象进来时 Serial 会变成一个新的值有几个关键事实需要先建立认知这张表是进程级的、永久存在的。只要 UE 进程还在跑读这张表就是安全的——这是弱引用能安全地检测对象死活的底层保证。即便槽位上的对象已经被销毁了表本身、槽位本身、SerialNumber 字段都还在。UObject自己记着自己在表里的索引。所以从UObject*反查到ObjectIndex是 O(1) 操作。SerialNumber 是懒分配的。只有在第一次有弱引用要指向某个对象时那个槽位才会被分配一个 SerialNumber对那些从来没人弱引用过的对象不浪费空间。每次新对象占用一个槽位时槽位的 SerialNumber 都会变成一个全新的值来自一个全局递增的计数器保证不会和历史值碰撞。第 4 点是整套机制能成立的关键。它意味着Index SerialNumber 这对组合唯一标识 UObject 的一次完整生命周期。生命周期结束后这对组合永远不会再有效哪怕同一个槽位上长出新对象。五、构造一个TWeakObjectPtr时发生了什么当你写UMyObj*ObjNewObjectUMyObj();TWeakObjectPtrUMyObjWeakObj;内部大致执行这样的逻辑voidFWeakObjectPtr::operator(constUObject*Object){if(Object){// 1. 从对象拿到它在全局表里的索引ObjectIndexGUObjectArray.ObjectToIndex(Object);// 2. 确保这个槽位有 SerialNumber懒分配并把当前值复制下来ObjectSerialNumberGUObjectArray.AllocateSerialNumber(ObjectIndex);}else{ObjectIndex0;ObjectSerialNumber0;}}要理解后面机制的关键在这一句ObjectSerialNumber存的是赋值那一刻的快照。槽位以后发生什么变化弱指针自己保留的这份数字都不会跟着变——这是后面能做对比检测的前提。六、解引用核心校验逻辑弱引用最关键的逻辑都在Get()里UObject*FWeakObjectPtr::Get()const{// 0. 空弱引用快速路径if(ObjectSerialNumber0)returnnullptr;// 1. 用索引去全局表拿槽位永远安全表本身不会消失FUObjectItem*ItemGUObjectArray.IndexToObject(ObjectIndex);if(!Item)returnnullptr;// 2. ★ 关键校验槽位当前的序列号还是不是我当初记的那个if(Item-SerialNumber!ObjectSerialNumber)returnnullptr;// 对不上 当年那个对象已经没了// 3. 检查对象当前状态即使序列号还对对象也可能正在销毁中if(Item-IsUnreachable()||Item-IsPendingKill())returnnullptr;// 4. 全过了返回对象指针returnstatic_castUObject*(Item-Object);}整套机制最精髓的就是第 2 步Item-SerialNumber ! ObjectSerialNumber。一切失效检测都在这里完成。第 3 步是对对象状态的额外校验。有种细微情况是对象进入销毁流程、被打上PendingKill或Unreachable标记但还没真正从槽位移除——这种半死状态下序列号还是老的但你已经不能正常使用这个对象了。所以多加这一层检查。七、用一条时间轴看清楚它怎么自动失效抽象的解释看完了落到具体场景上感受一下。时刻 T0PlayerA 被创建分配到 42 号槽位 ──────────────────────────────────────────────── GUObjectArray[42] { ObjectPlayerA, SerialNumber未分配 } TWeakObjectPtrAPlayer Weak PlayerA; → 触发懒分配槽位拿到 SerialNumber 100 → GUObjectArray[42] { ObjectPlayerA, SerialNumber100 } → Weak.ObjectIndex 42 → Weak.ObjectSerialNumber 100 此时 Weak.Get() 比较 100 100 ✓ 通过 返回 PlayerA ✓ 时刻 T1PlayerA 被销毁 ──────────────────────────────────────────────── GC 处理后 GUObjectArray[42] { Objectnull, SerialNumber100 } ↑ 注意序列号还是 100 暂时还没变 此时 Weak.Get() 比较 100 100 ✓ 但 Objectnull 或对象处于 Unreachable 第 3 步检查拦下来 → 返回 nullptr ✓ 时刻 T2新对象 PlayerB 创建复用 42 号槽位 ──────────────────────────────────────────────── GUObjectArray[42] { ObjectPlayerB, SerialNumber新值 } ↑ ★ 关键分配新对象时 序列号变成一个全新的值 比如 247来自全局递增计数器 绝不会回退、绝不重复 此时 Weak.Get() 比较 247 100 ✗ 不匹配 立刻在第 2 步返回 nullptr ✓整个过程的精妙之处在于T1 阶段对象死了但槽位还没复用靠状态标志检测出失效T2 阶段槽位被复用、内存可能就是同一块、对象指针看起来有效但靠序列号不匹配识别出那已经不是我当初指的那个了。哪怕新对象的地址和老对象一字不差地一样弱引用也能可靠区分。这是裸指针完全做不到的事。八、和std::weak_ptr对比两套机制都是弱引用但实现思路截然不同。把对比拉出来看一下设计权衡维度UETWeakObjectPtrCstd::weak_ptr失效感知机制全局对象表 序列号控制块 引用计数单个实例大小8 字节2 × int3216 字节指针 控制块指针解引用代价一次表查找 一次比较一次原子读 一次条件分支是否需要为每个对象分配额外内存否只用 1 个 int32 字段且懒分配是每个对象一个控制块多线程安全解引用本身需要在 GameThread 上做内置原子操作跨线程安全适用对象必须是 UObject任何shared_ptr管的对象UE 的方案胜在轻量、零额外分配标准库的方案胜在通用、跨线程友好。本质上是不同生态的不同取舍——UE 的所有 UObject 本来就要进全局表那索性把弱引用建在这张表上。九、几个常见疑问澄清Q1为什么 SerialNumber 是按槽位走的而不是按对象走的因为弱引用记的索引是槽位索引。如果序列号跟着对象走对象死了序列号也跟着死了弱引用就没东西可以对比了。版本号必须留在槽位上对象走了版本号也要继续待在那儿、并在下次对象进来时变更。这样老的弱引用才能通过槽位当前的版本号 ≠ 我记的版本号识别出失效。Q2为什么不直接判断槽位的Object指针就行不行。考虑这种情况T0弱引用指向 PlayerA槽位 42、ObjectPlayerAT1PlayerA 死了T2PlayerB 复用槽位 42碰巧 PlayerB 的地址和 PlayerA 一样如果只比对 Object 指针弱引用解引用会拿到 PlayerB 当成还活着的 PlayerA——这是灾难性错误。序列号校验在这种情况下能立刻识别出来。Q3序列号会不会用完不会。SerialNumber 是int32配合全局递增计数器每秒分配几千个也能用几十年。实际工程里完全够用UE 的代码里也没看到过回绕处理。Q4跨线程能不能用读TWeakObjectPtr通常需要在 GameThread 上做因为 UE GC 假设大多数 UObject 操作在 GameThread 上发生。TWeakObjectPtr本身的两个 int32 不会撕裂但解引用涉及的全局表状态、对象状态都假设 GameThread 协议。如果你想在其他线程持有 UObject 引用需要查阅 UE 关于线程安全的具体文档不是TWeakObjectPtr单方面能保证的。Q5和TSoftObjectPtr是什么关系完全不同的东西。TWeakObjectPtr是针对已加载的 UObject 实例的弱引用靠对象表机制。TSoftObjectPtr是针对资源路径的引用存的是资源的 path 字符串用于现在不加载需要时再加载机制差别非常大。十、一句话总结TWeakObjectPtr内部就是两个 int32槽位索引 创建时的序列号。它的精髓在于不存裸指针、不存控制块而是把对象活在哪个槽位、哪一代这件事编码成两个数字。解引用时拿这两个数字去全局对象表对一下对得上就活着对不上就失效——既不阻止对象死亡又能可靠识别对象已死存储成本还只有 8 字节。这套设计是 UE 在GC 已经维护全局对象表这个前提下做出的最优工程选择。它能告诉我们一个普遍道理好的内存安全机制不一定要依赖运行时开销巨大的引用计数关键在于找到一组合适的、不变的身份编码。