1OS底层-对象本质&联合体&isa关联
之前一直讲述对象本质,它的底层又做了什么。
在探索对象本质之前我们需要了解一下clang
- Clang是一个C语言、C++、Objeactive-C语言的轻量级编译器,源代码发布于BSD协议下。
- Clang 将支持其普通lambda表达式、返回类型的简化处理以及更好的处理constexpr关键字
- Clang是一个由
Applez
主导编写,基于LLVM
的C/C++/Objective-C编译器 - 主要用于
底层编译
,将一些编译文件编译成.cpp文件,方便观察底层
的一些结构
和实现逻辑,方便理解底层
。
Clang创建.cpp文件
首先我们需要打开终端,cd main文件目录下的路径
然后输入clang -rewrite-objc main.m -o main.cpp
创建main.cpp文件。
通过搜索
LGPerson
定位到到struct 结构体
,通过name
我们可以知道对象编译的底层就是结构体。mian.cpp文件中有多处都使用了NSObject_IVARS
,其实它就是就是一个指针。
mian.cpp文件文件中的_I_LGPerson_name
是一个get方法,_I_LGPerson_setName
是set方法
set方法
有一个objc_setProperty
方法,所有set的方法都会调用,它类似一个工厂模式。
在objc4-781编译源码中
搜索objc_setProperty
方法
跳转objc_setProperty
源码中
跳转reallySetProperty
源码中,可以看到objc_setProperty
方法的具体实现,对新值的return
,对旧值的release
。
每个属性的set
方法,都做同样的事情(对新值的return
,对旧值的release
),因为每个属性对接下层 ,系统llvm会生成很多的临时变量,很难查找,所以所有的set
方法,都会走objc_setProperty
函数。
我们可以根据cmd
区分属性
oc的对象
就是结构体本质
,继承于NSObject的isa
,同时我们分析到了非常重要且非常著名的objc的initinstanceIsa
,在开始讲之前我们先扩展一个内容就是联合体位域
。
首先对象内存的开辟来自于属性,LGCar
类有四个属性,假如四个属性都是int类型
,那么4*4 = 16字节
,16 * 8位 = 128位
这四个只是简单的标识,128位实在是太浪费了,所以为了节省空间,我们不需要属性,而是通过set和get方法。set方法通过1字节 = 8位存储,在0000 1111
中对应front,back,left,right属性(结构体的顺序是从前往后),如果是位运算进行处理就是char+位域
。
@interface LGCar : NSObject
@property (nonatomic, assign) BOOL front;
@property (nonatomic, assign) BOOL back;
@property (nonatomic, assign) BOOL left;
@property (nonatomic, assign) BOOL right;
- (void)setFront:(BOOL)isFront; // 存储 : 1字节 = 8位 0000 1111 char + 位域 bit 结构体
- (BOOL)isFront;
- (void)setBack:(BOOL)isBack;
- (BOOL)isBack;
@end
-
结构体(struct)
中所有变量是共存
的--优点是有容乃大
全面;缺点是struct内存空间的分配是粗放的,不管用不用,全分配。 -
联合体位域(union)
中是各变量是互斥
--缺点就是不够包容
;但优点是内存使用更为精细灵活,也节省了内存空间
。
结构体存在共存的关系,LGCar
类的属性中,例如:向前就没有必要向后,同时为了更为精细灵活以及节省空间,我们就引入了联合体位域。
isa的类型isa_t
以下是isa指针类型的isa_t
定义,从定义可以看出使用了联合体(union)
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
isa_t
类型使用联合体(union)
,是因为内存优化
的考虑,这里的内存优化是char+位域
的实现,通常说一个isa指针
占用8
字节,即64
位,已经足够存储很多信息,极大的节省内存,提高性能。
在isa中定义可以看出:
-
提供了两个成员
cls
和bits
,根据联合体
,它们是互斥
的关系,也就意味着,当初始化isa指针,有两种初始化关系。- 通过
cls
初始化,bits
无默认值 - 通过
bits
初始化,cls
有默认值
- 通过
-
提供一个结构体定义的位域,用于存储类信息和其他信息,结构体的成员是一个宏定义
ISA_BITFIELD
,有两个版本:- 移动端
__arm64__
- mac OS
__x86_64__
位域宏定义--借用Style_月月
- 移动端
NONPOINTER_ISA
-
nonpointer
:表示是否对 isa 指针开启指针优化
* 0:纯isa指针,
* 1:不止是类对象地址,isa 中包含了类信息、对象的引用计数等 -
has_assoc
:关联对象标志位- 0:
没有关联
对象 - 1:
存在关联
对象
- 0:
-
has_cxx_dtor
:该对象是否有 C++ 或者 Objc 的析构器(类似delloc)- 如果有析构函数,则需要做
析构逻辑
- 如果没有,则可以更快的
释放对象
- 如果有析构函数,则需要做
-
shiftcls
:存储类指针的值即类信息- arm64占
33
位,开启指针优化的情况下,在 arm64 架构中有 33 位用来存储类指针 - x86_64占用
44
位
- arm64占
-
magic
:用于调试器判断当前对象是真的对象还是没有初始化
的空间 -
weakly_referenced
:志对象是否被指向或者曾经指向一个 ARC 的弱变量,
没有弱引用
的对象可以更快释放
。 -
deallocating
:标志对象是否正在释放内存
-
has_sidetable_rc
:当对象引用技术大于 10 时,则需要借用该变量存储进位
-
extra_rc
:当表示该对象的引用计数值,实际上是引用计数值减 1, 例如,如果对象的引用计数为 10,那么extra_rc
为 9。如果引用计数大于 10, 则需要使用到下面的has_sidetable_rc
。
isa存储情况 --借用Style_月月图
原理探索
通过alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone方法路径,查找到initInstanceIsa,并进入其原理实现
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
跳转进入initIsa
源码中
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {
isa = isa_t((uintptr_t)cls);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
验证isa指针位域
根据前文提及的0-64位域,可以在这里通过initIsa方法中证明有isa指针中有这些位域(目前是处于macOS,所以使用的是x86_64)
-
main中的LGPerson 断点 --> initInstanceIsa --> initIsa --> 走到else中的 isa初始化
-
通过lldb,输入
p newisa
,打印isa信息
-
断点进入
newisa.bits
,执行p newisa
lldb命令的打印结果
通过newsize的信息对比,发现isa指针中有一些变化,如下图所示
isa 和bits数据比对.jpg
其中magic
的值是59,是由于isa指针地址转为二进制
,从47位开始读取6位,再转为二进制
isa和类的关联
cls 与 isa 关联原理就是isa指针中的shiftcls位域中存储了类信息,其中initInstanceIsa的过程是将 calloc 指针 和当前的 类cls 关联起来,有以下几种验证方式:
-
【方式一】通过initIsa方法中的newisa.shiftcls = (uintptr_t)cls >> 3验证
-
【方式二】通过isa指针地址与ISA_MSAK 的值 & 来验证
-
【方式三】通过runtime的方法object_getClass验证
-
【方式四】通过位运算验证
方法一:通过initIsa方法
-
运行至
newisa.shiftcls = (uintptr_t)cls >> 3;
代码段,shiftcls
存储当前类的值信息- 查看
cls
,是LGPerson
类 -
shiftcls
赋值的逻辑是将LGPerson
进行编码后,右移3位
- 查看
-
执行lldb命令
p (uintptr_t)cls
,得到的是(uintptr_t) $2 = 4294975720,有以下两种方式(二选一),对newisa
的shiftcls
进行赋值- p (uintptr_t)cls >> 3
- 输入
p (uintptr_t)cls
获得$3 = 4294975728
,然后p $3>>3
获得
-
继续执行程序到isa = newisa;部分,此时执行p newisa
与bits赋值结果对比,有两处发生改变
-
cls
由默认值,变成LGPerson
,将isa与cls完美关联
-
shiftcls
由0变成了536871965
isa 和bits数据比对.jpg
由此可以观察isa初始化
到isa的shiftcls
的赋值过程即值的改变过程,如图
为什么在shiftcls赋值时需要类型强转?
因为内存的存储不能存储字符串,机器码只能识别 0 、1这两种数字,所以需要将其转换为uintptr_t
数据类型,这样shiftcls
中存储的类信息才能被机器码理解, 其中uintptr_t是long
为什么需要右移3位?
主要是由于shiftcls
处于isa指针地址的中间部分,前面还有3个位域,为了不影响前面的3个位域的数据,需要右移
将其抹零。
方式二:通过isa & ISA_MSAK
继续执行,回到_class_createInstanceFromZone方法,此时cls 与 isa已经关联完成,执行po objc
- 执行x/4gx obj,得到isa指针的地址0x001d8001000021fd
-
将isa指针地址 & ISA_MASK (处于macOS,使用x86_64中的宏定义),即 po 0x001d8001000021fd & 0x00007ffffffffff8 ,得出LGPerson
方式三:通过 object_getClass
通过查看object_getClass的源码实现,同样可以验证isa与类关联的原理,有以下几步:
main中导入#import <objc/runtime.h>
通过runtime的api,即object_getClass函数获取类信息
-
跳转进入object_getClass 底层实现
-
跳转进入
getIsa
源码
-
点击
ISA()
进入源码,可以看到如果是indexed类型,执行if流程,反之 执行的是else流程
-
在else流程中,拿到isa的bits这个位,再 & ISA_MASK,这与方式二中的原理是一致的,获得当前的类信息
-
从这里也可以得出 cls 与 isa 已经完美关联
方式四:通过位运算
- 回到
_class_createInstanceFromZone
方法。通过x/4gx obj 得到obj的存储信息,当前类的信息存储在isa指针中,且isa中的shiftcls
此时占44位(因为处于macOS环境)
-
想要读取中间的44位 类信息,就需要经过位运算 ,将右边3位,和左边除去44位以外的部分都抹零,其相对位置是不变的。其位运算过程如图所示,其中shiftcls即为需要读取的类信息
将isa地址右移3位:p/x 0x001d8001000021fd >> 3 ,得到0x0003b0002000043f -
在将得到的0x0003b0002000043f``左移20位:p/x 0x0003b0002000043f << 20 ,得到0x0002000043f00000
-
为什么是左移20位?因为先右移了3位,相当于向右偏移了3位,而左边需要抹零的位数有17位,所以一共需要移动20位
将得到的0x0002000043f00000 再右移17位:p/x 0x0002000043f00000 >> 17 得到新的0x00000001000021f8 -
获取cls的地址 与 上面的进行验证 :p/x cls 也得出0x00000001000021f8,所以由此可以证明 cls 与 isa 是关联的