Runtime源码 类、对象、isa
OC做为一门动态语言,runtime是其最大的特点,它是一套底层的 C 语言 API,是 iOS 系统的核心之一。开发者在编码过程中,可以给任意一个对象发送消息,在编译阶段只是确定了要向接收者发送这条消息,而接受者将要如何响应和处理这条消息,那就要看运行时来决定了。在日常开发过程中类、对象、属性算是最常见的了,今天以对象为切入点,分析一下对象和类在runtime层面的表示。
类
类在runtime的表示为:
struct objc_object {
private:
isa_t isa;
...
}
最关键的就是isa_t这个类型和一系列的构造函数,点击查看isa_t发现这是一个联合体:
union isa_t
{
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
}
可以看到这个联合体里面有个Class类型的属性cls,看起来里面应该是关于这个对象的类的相关信息,那我们再看看Class包含了哪些内容。
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
...
}
由此可见Class是一个objcclass类型的结构体,而objc_class继承自objc_object,说明类也是一个对象,只是比普通的对象多了一些属性,比如superclass等。
先不看这些属性,这里还有一个很奇怪的问题,既然类也是一个objc_object,那就是说类也有一个isa指针,那类的isa指针指向哪里呢?查看了不少资料,这篇讲的挺好:Classes and metaclasses
大致意思是在class之上还有叫做元类(meta class)的存在,而class的isa指针就是指向对应的meta class。
我们都知道class中存储的是描述对象的相关信息,那么相应的meta class中存放的就是描述class相关信息。说的更直白一点,在我们写代码时,通过对象来调用的方法(实例方法)都是存储在class中的,通过类名来调用的方法(类方法)都是存储在meta class中的。
到这里对象和类的关系已经比较清楚了,但是如果细细思考一下,会发现还有一个问题,就是meta class也是有isa指针的,那么这个isa又指向了哪里呢?在上面给出的那篇文章里面有这么一张图:
class diagram
由图可知:meta class的isa指向root meta class(绝大部分情况下是NSObject),root meta class的isa指针指向自己。
isa_t
先看看完整的isa_t,因为运行环境是osx,所以只截取x86_64部分,arm64的区别只在于部分字段的位数不同,字段是完全相同的:
union isa_t
{
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
# __x86_64__
# define ISA_MASK 0x00007ffffffffff8ULL
# define ISA_MAGIC_MASK 0x001f800000000001ULL
# define ISA_MAGIC_VALUE 0x001d800000000001ULL
struct {
uintptr_t nonpointer : 1;
uintptr_t has_assoc : 1;
uintptr_t has_cxx_dtor : 1;
uintptr_t shiftcls : 44;
uintptr_t magic : 6;
uintptr_t weakly_referenced : 1;
uintptr_t deallocating : 1;
uintptr_t has_sidetable_rc : 1;
uintptr_t extra_rc : 8;
# define RC_ONE (1ULL<<56)
# define RC_HALF (1ULL<<7)
};
}
看这个定义只能大概看出个框架,下面从isa的初始化过程来看看isa_t究竟是如何存储类或者元类的相关信息。
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
initIsa(cls, true, hasCxxDtor);
}
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
if (!nonpointer) {
isa.cls = cls;
} else {
isa_t newisa(0);
newisa.bits = ISA_MAGIC_VALUE;
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
isa = newisa;
}
}
上来就看不懂,nonpointer是个什么,为什么在这里传的是true?在之前那位大神的另一篇文章中也有解释:Non-pointer isa。
大概的意思是在64位系统中,为了降低内存使用,提升性能,isa中有一部分字段用来存储其他信息。这也解释了上面isa_t的那部分结构体。
这有点像taggedPointer,两者之间有什么区别?备注一下后面再研究。
现在知道了nonpointer为什么是true,那么把initIsa方法先简化一下:
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
isa_t newisa(0);
newisa.bits = ISA_MAGIC_VALUE;
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
isa = newisa;
}
# define ISA_MAGIC_VALUE 0x001d800000000001ULL
一共三部分:
-
newisa.bits = ISA_MAGIC_VALUE;
从ISA_MAGIC_VALUE的定义中可以看到这个字段初始化了两个部分,一个是magic字段(6位:111011),一个是nonpointer字段(1位:1),magic字段用于校验,nonpointer之前已经详细分析过了。 -
newisa.has_cxx_dtor = hasCxxDtor;
这个字段存储类是否有c++析构器。 -
newisa.shiftcls = (uintptr_t)cls >> 3;
将cls右移3位存到shiftcls中,从isa_t的结构体中也可以看到低3位都是用来存储其他信息的,既然可以右移三位,那就代表类地址的低三位全部都是0,否则就出错了,补0的作用应该是为了字节对齐。
因为nonpointer的缘故,isa并不只是用来存储类地址了,所以需要提供一个额外的方法来返回真正的地址:
inline Class
objc_object::ISA()
{
return (Class)(isa.bits & ISA_MASK);
}
# define ISA_MASK 0x00007ffffffffff8ULL
其实就是取isa_t结构体的shiftcls字段。
还有一些其他的字段,把上面那篇文章中相关部分翻译过来放在下面:
// 是否曾经或正在被关联引用,如果没有,可以快速释放内存
uintptr_t has_assoc : 1;
// 对象是否曾经或正在被弱引用,如果没有,可以快速释放内存
uintptr_t weakly_referenced : 1;
// 对象是否正在释放内存
uintptr_t deallocating : 1;
// 对象的引用计数太大,无法存储
uintptr_t has_sidetable_rc : 1;
// 对象的引用计数超过1,比如10,则此值为9
uintptr_t extra_rc : 8;
class_data_bits_t bits
通过注释(class_rw_t * plus custom rr/alloc flags)可以看到:class_data_bits_t其实是class_rw_t* 加上自定义的rr/alloc标志,rr/alloc标志是指含有的retain/release/autorelease/retainCount/alloc等。
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
Class firstSubclass;
Class nextSiblingClass;
char *demangledName;
}
里面有个很相似的结构体class_ro_t,其定义如下:
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
method_list_t *baseMethods() const {
return baseMethodList;
}
};
rw是指readwrite,ro是指readonly。也就是说在可读可写的结构体中存放了一个只读的结构体,而且这两个结构体很相似。
- 在编译期,类的相关方法,属性,协议会被添加到class_ro_t这个只读的结构体中。
- 在运行时,类第一次被调用的时候,class_rw_t会被初始化,category中的内容依然是这个时候被添加进来的。
- class_rw_t不仅仅用来存放运行时添加的信息,编译期确定下来的信息也会被拷贝进去。