iOS底层探究-06:isa与类关联的原理
先来了解一个编译器:clang
-
clang
是一个由Apple
主导编写,基于LLVM
的C/C++/OC的编译器
-
主要是用于
底层编译
,将一些文件输出
成c++文件
,例如main.m
输出成main.cpp
,其目的是为了更好的查看底层
的一些结构
及实现
的逻辑,方便理解底层原理
对象的本质是什么
- 在
main
中自定义一个类LCPerson
,有一个属性name
@interface LCPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation LCPerson
@end
- 通过终端,利用
clang
将main.m
编译成main.cpp
,有以下几种编译命令,这里使用的是第一种
//1、将 main.m 编译成 main.cpp
clang -rewrite-objc main.m -o main.cpp
//2、将 ViewController.m 编译成 ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot / /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真机文件编译
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp
- 可能会报如下图所示错误:
- 终端执行如下命令,完美解决:
clang -x objective-c -rewrite-objc -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator.sdk main.m
- 打开编译好的
main.cpp
,找到LCPerson
的定义,发现LCPerson
在底层会被编译成struct 结构体
#ifndef _REWRITER_typedef_LCPerson
#define _REWRITER_typedef_LCPerson
typedef struct objc_object LCPerson;
typedef struct {} _objc_exc_LCPerson;
#endif
extern "C" unsigned long OBJC_IVAR_$_LCPerson$_name;
// 定义的类在底层编译成了结构体
struct LCPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
// @property (nonatomic, copy) NSString *name;
/* @end */
// @implementation LCPerson
// name的get方法
static NSString * _I_LCPerson_name(LCPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_LCPerson$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
// name的set方法
static void _I_LCPerson_setName_(LCPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct LCPerson, _name), (id)name, 0, 1); }
// @end
结论:OC对象的本质
其实就是 结构体
objc_setProperty 源码探索
除了LCPerson的底层定义,我们发现还有属性 name
对应的set
和 get
方法,如下图所示,其中set方法
的实现依赖于runtime
中的objc_setProperty
- 在
objc4-781
中全局搜索 objc_setProperty
,找到objc_setProperty
的源码进行查看
- 进入
reallySetProperty
的源码,其原理就是retain新值
,release旧值
通过对objc_setProperty
的底层源码探索,有以下几点说明:
-
objc_setProperty
方法的目的适用于关联上层
的set方法
以及底层
的set方法
,其本质就是一个接口
-
这么设计的原因是,上层的
set方法
有很多
,如果直接调用底层set方法中,会产生很多
的临时变量
,当你想查找一个sel时,会非常麻烦 -
基于上述原因,苹果采用了
适配器设计模式(即将底层接口适配为客户端需要的接口)
,对外
提供一个接口
,供上层的set方法使用,对内
调用底层的set方法,使其相互不受影响,即无论上层怎么变,下层都是不变的,或者下层的变化也无法影响上层,主要是达到上下层接口隔离的目的
下图是上层、隔离层、底层之间的关系
cls 与 类 的关联原理
在此之前,先了解什么是联合体
,为什么isa
的类型isa_t
是使用联合体定义
联合体(union)
构造数据类型的方式有以下两种:
-
结构体
(struct
) -
联合体
(union
,也称为共用体
)
结构体
结构体
是指把不同的数据组合成一个整体
,其变量是共存
的,变量不管是否使用,都会分配内存。
-
优点
:存储容量较大,包容性强,且成员之间不会相互影响 -
缺点
:所有属性都分配内存,比较浪费内存
,假设有4个int成员,一共分配了16字节的内存,但是在使用时,你只使用了4字节,剩余的12字节就是属于内存的浪费
联合体
联合体
也是由不同的数据类型组成
,但其变量
是互斥的
,所有的成员共占一段内存。而且共用体采用了内存覆盖技术
,同一时刻只能保存一个成员的值
,如果对新的成员赋值
,就会将原来成员的值覆盖掉
优点
:所有成员共用一段内存,使内存的使用更为精细灵活
,同时也节省
了内存空间
缺点
:包容性弱
两者的区别
-
内存占用情况
- 结构体的各个成员会
占用不同的内存
,互相之间没有影响
- 共用体的所有成员
占用同一段内存
,修改一个成员会影响其余所有成员
- 结构体的各个成员会
-
内存分配大小
- 结构体 内存
>= 所有成员占用的内存总和
(成员之间可能会有缝隙) - 共用体 占用的内存
等于
最大的成员占用的内存
- 结构体 内存
isa的类型 isa_t
以下是isa
指针的类型isa_t的定义
,从定义中可以看出是通过联合体
(union)定义的。
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
isa_t
类型使用联合体
的原因也是基于内存优化
的考虑,这里的内存优化是指在isa指针中通过char + 位域
(即二进制中每一位均可表示不同的信息)的原理实现。通常来说,isa
指针占用的内存大小是8字节
,即64位,已经足够存储很多的信息了,这样可以极大的节省内存,以提高性能
从isa_t
的定义中可以看出:
-
提供了两个成员,
cls
和bits
,由联合体的定义所知,这两个成员是互斥
的,也就意味着,当初始化isa指针时,有两种初始化方式-
通过
cls初始化
,bits 无默认值
-
通过
bits初始化
,cls 无默认值
-
-
还提供了一个结构体定义的
位域
,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD
,这是一个宏定义
,有两个版本__arm64__
(对应ios 移动端) 和__x86_64__
(对应macOS),以下是它们的一些宏定义,如下图所示
-
nonpointer
有两个值,表示自定义的类等,占1
位-
0
:纯isa指针
-
1
:不只是类对象地址
,isa中包含了类信息
、对象的引用计数
等
-
-
has_assoc
表示关联对象
标志位,占1
位-
0
:没有
关联对象 -
1
:存在
关联对象
-
-
has_cxx_dtor
表示该对象是否有C++/OC的析构器
(类似于dealloc
),占1
位- 如果
有析构函数
,则需要做析构逻辑
- 如果
没有
,则可以更快的释放对象
- 如果
-
shiftclx
表示存储类
的指针
的值(类的地址), 即类信息
-
arm64
中占33位
,开启指针优化的情况下,在arm64架构中有33位用来存储类指针 -
x86_64
中占44位
-
-
magic
用于调试器判断当前对象是真的对象
还是没有初始化的空间
,占6
位 -
weakly_refrenced
是 指对象是否被指向
或者曾经指向一个ARC的弱变量
- 没有弱引用的对象可以更快释放
-
deallocating
标志对象是是否正在释放内存
-
extra_rc
表示该对象的引用计数值
,实际上是引用计数值减 1
- 如果对象的
引用计数为10
,那么extra_rc 为 9
- 如果引用计数大于
10
, 则需要使用到下面的has_sidetable_rc
- 如果对象的
-
has_sidetable_rc
表示 当对象引用计数大于10时
,则需要借用该变量存储进位
针对两种不同平台,其isa
的存储情况如图所示