iOS底层之类的重要组成部分-isa结构体分析
前言
iOS
中每个OC对象
都有一个isa指针
,那么这个isa指针
又是什么呢,里面都有什么信息呢?
接下来让我们一起探索一下。
一、探索对象的本质
都说OC对象
的本质是结构体
,之前我们都是通过查看objc源码来判断对象的本质是结构体,那么有没有更直接的方式呢?
答案当然是有的,下面我们用一个例子来证明一下。
现在有一个main.m
文件,文件中的代码如下:
#import <Foundation/Foundation.h>
@interface WJPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation WJPerson
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
// insert code here...
NSLog(@"Hello, World!");
}
return 0;
}
现在咱们把这个main.m
文件编译成c++
文件,看一下main.m
的底层实现。
首先咱们先打开终端,然后cd
进入到main.m
所在的文件目录,通过Clong
命令将main.m
文件编译成main.cpp
clang -rewrite-objc main.m -o main.cpp
这句命令的意思是把目标文件编译成c++
文件。接下来我们会看到这个目录下多出了一个main.cpp
文件
//2、将 ViewController.m 编译成 ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot / /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真机文件编译
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp
打开main.cpp
文件可以看到里面有将近12万行代码
,相信你们和我一样没有耐心一行一行的看,那么我们直接搜索关键内容来查看我们想要查看的代码。我们直接搜索WJPerson
,会看到以下代码:
#ifndef _REWRITER_typedef_WJPerson
#define _REWRITER_typedef_WJPerson
typedef struct objc_object WJPerson;
typedef struct {} _objc_exc_WJPerson;
#endif
extern "C" unsigned long OBJC_IVAR_$_WJPerson$_name;
struct WJPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
// @property (nonatomic, copy) NSString *name;
/* @end */
// @implementation WJPerson
static NSString * _I_WJPerson_name(WJPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_WJPerson$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
static void _I_WJPerson_setName_(WJPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct WJPerson, _name), (id)name, 0, 1); }
// @end
int main(int argc, const char * argv[]) {
/* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
NSLog((NSString *)&__NSConstantStringImpl__var_folders_1q_9d991v_j3bvfs3nvsmpq5_d40000gn_T_main_c1238e_mi_0);
}
return 0;
}
看着是不是特别熟悉,没错,这就是我们的main
方法和我们定义的类还有属性name
的getter
方法_I_WJPerson_name
、setter
方法_I_WJPerson_setName_
。从以上代码中可以看出我们的对象的定义是这部分
struct WJPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
可以看到是由struct
修饰的,所以说对象的本质就是结构体。但是这里有一个问题,我们明明只定义了一个属性name
,这里为什么还有struct NSObject_IMPL NSObject_IVARS;
呢。我们知道c++
中的struct
的继承方式是struct
的第一个元素。我们来全局搜索下NSObject_IMPL
,会发现有下面这行代码
struct NSObject_IMPL {
Class isa;
};
由此可以得知WJPerson_IMPL
的第一个元素是一个isa指针
。从前文iOS alloc&init&new源码解析中得知OC会在alloc的时候会将类与isa指针进行绑定。那么到底是怎么进行绑定的呢,接下来让我们详细分析一下。
二、isa底层分析
从前文iOS alloc&init&new源码解析中得知OC会在这步obj->initInstanceIsa(cls, hasCxxDtor);
将类与isa指针进行关联绑定。
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {
isa = isa_t((uintptr_t)cls);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
从上面代码中可以看出isa
是isa_t
的一个实例,接下来我们看下isa_t
的组成
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
可以看出isa_t
这里采用的是联合体&位域
的搭配。
为什么要用联合体呢,因为联合体有以下特点:
- 联合体中可以定义多个成员,联合体的大小由最大的成员大小决定
- 联合体的成员公用一个内存,一次只能使用一个成员
- 对某一个成员赋值,会覆盖其他成员的值
- 存储效率更高,可读性更强,可以提高代码的可读性,可以使用位运算提高数据的存储效率
所以苹果为了节省内存空间,这里使用了联合体的形式。
接下来我们看下isa_t
的位域
// arm64 真机
# if __arm64__
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 19
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
// x86_64 模拟器
# elif __x86_64__
# define ISA_MASK 0x00007ffffffffff8ULL
# define ISA_MAGIC_MASK 0x001f800000000001ULL
# define ISA_MAGIC_VALUE 0x001d800000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 8
# define RC_ONE (1ULL<<56)
# define RC_HALF (1ULL<<7)
# else
# error unknown architecture for packed isa
# endif
可以看到这里的位域区分arm64
架构和x86_64
架构,一般真机上我们使用的是arm64
架构,模拟器上我们使用的是x86_64
架构。
我们先来了解下位域下的每一位都存储的什么信息
-
nonpointer
:表示是否对 isa 指针开启指针优化
0:纯isa指针,1:不⽌是类对象地址,isa 中包含了类信息、对象的引⽤计数等 -
has_assoc
:关联对象标志位,0没有,1存在 -
has_cxx_dtor
:该对象是否有 C++ 或者 Objc 的析构器,如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象。 -
shiftcls
: 存储类指针的值。开启指针优化的情况下,在 arm64 架构中有 33 位⽤来存储类指针。 -
magic
:⽤于调试器判断当前对象是真的对象还是没有初始化的空间 -
weakly_referenced
:志对象是否被指向或者曾经指向⼀个 ARC 的弱变量,没有弱引⽤的对象可以更快释放。 -
deallocating
:标志对象是否正在释放内存 -
has_sidetable_rc
:当对象引⽤技术⼤于 10 时,则需要借⽤该变量存储进位 -
extra_rc
:当表示该对象的引⽤计数值,实际上是引⽤计数值减 1,
例如,如果对象的引⽤计数为 10,那么 extra_rc 为 9。如果引⽤计数⼤于 10,则需要使⽤到下⾯的 has_sidetable_rc。
为了更好的理解isa_t
的位域,咱们用图来表示下
arm64
为例,一个isa_t
代表一个64
位二进制,位域中的每个元素都顺序排放,所以得出如下结论
-
nonpointer
存储在二进制第一位:0
的位置 -
has_assoc
存储在二进制第二位:1
的位置 -
has_cxx_dtor
存储在二进制第三位:2
的位置 -
shiftcls
存储在二进制第四到三十六位:3~35
的位置 -
magic
存储在二进制第三十七到四十二位:36~41
的位置 -
weakly_referenced
存储在二进制第四十三位:42
的位置 -
deallocating
存储在二进制第四十四位:43
的位置 -
has_sidetable_rc
存储在二进制第四十五位:44
的位置 -
extra_rc
存储在二进制第四十六到六十四位:45~63
的位置
下面我们通过例子来了解下isa_t
存储的信息,位域下的其他信息我们不知道,但是我们可以知道当前创建的类的指针,而存储类指针的值的是shiftcls
,所以我们可以提前shiftcls
的值与类指针的值对比,看看结果。
首先我们先在main
函数中创建一个对象
int main(int argc, const char * argv[]) {
@autoreleasepool {
WJPerson *p = [[WJPerson alloc] init];
NSLog(@"%@",p);
}
return 0;
}
在WJPerson *p = [[WJPerson alloc] init];
这步打个断点
之后在这里再打个断点
isa
指针地址,然后我们就要获取shiftcls
的信息了
位移运算
位移运算图解
经过上面的位移运算我们最后得到这样一个地址,按照上文所说这个地址就是
shiftcls
的信息了,也就是我们类的地址,接下来我们打印下类的地址来验证下
当前的cls
最终结果 看到没有最后的结果,两个地址一模一样。
这是我们通过源码一步步推导出来的,那么有没有快速获取的方式呢,苹果是怎么获取类的信息的呢
# define ISA_MASK 0x00007ffffffffff8ULL
inline Class
objc_object::ISA()
{
ASSERT(!isTaggedPointer());
#if SUPPORT_INDEXED_ISA
if (isa.nonpointer) {
uintptr_t slot = isa.indexcls;
return classForIndex((unsigned)slot);
}
return (Class)isa.bits;
#else
return (Class)(isa.bits & ISA_MASK);
#endif
}
看到return (Class)(isa.bits & ISA_MASK);
的地方了吗,这个地方返回的就是类的信息。我们再来验证一下
isa的指针&ISA_MASK
与我们之前得出的结论一模一样,由此我们可以得出对象在
alloc
的时候通过obj->initInstanceIsa(cls, hasCxxDtor);
或obj->initIsa(cls);
方法将 cls
类 与 obj
指针(即isa
) 关联。