iOS 底层探索:类的结构分析
前言
- 这篇主要内容探索 类的结构分析。
- 通过上篇iOS 探索 isa与类关联的原理,知道了isa关联了当前的类信息之后,类的属性、方法列表等存在哪里呢?抱着疑问我们开始类的结构的探索。
准备工作
一、引入元类
我们通过LLDB调试, 先探索类的内存信息。
类的内存分析
注:其实图中第二个打印的指针指向的HJPerson的元类。
打印内存分析图
那么我们按照上图的打印分析,我们继续寻找元类的上层是啥呢?如下图
探索元类的终点
如图2、3、4中 打印元类还有根元类NSObject ,图中3和4的又不一样,分析可知一个是
NSObject类 一个是 NSObject的元类,NSObject的元类又是HJPerson的元类的根元类, 根源类再次查看地址还是自己,说明已经到底了。
先梳理一下isa指向流程:isa对象——> 类HJPerson ——>元类HJPerson ——> 根元类NSObject <=> 根元类NSObject
从图片上可以看出,NSObject的元类、根元类,根根元类的指针地址都是一模一样的
总结一下对元类的理解:
元类就是类对象所属的类。所以,实例是类的实例,类作为对象又是元类的实例。OC中所有的类都是一种对象,所以元类也是对象,那么元类是根元类的实例,同时根元类是其自身的实例。
二、 分析isa、对象、类和元类的关系
对象、类和元类跟随isa指针走向关系简单流程如下图
- 元类也有isa指针,它的isa指针最终指向的是一个根元类(root metaClass);
- 根元类的isa指针指向本身,这样形成了一个封闭的内循环;
最终各个类实例变量的继承关系如图:
isa经典流程图
isa流程图 注:
- superClass是一层层集成的,到最后NSObject的superClass是nil。而NSObject的isa指向根元类,这个根元类的isa指向它自己,而它的>superClass是NSObject,也就是最后形成一个环。
- metaClass也是相互继承的。
三、源码分析 isa的来源:objc_class与objc_object
struct HJPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
};
struct NSObject_IMPL {
Class isa;
};
查看HJPerson类的编译后的结构体,我们发现NSObject_IMPL也是个结构体,结构体内部的isa是一个class类型的,说明isa也是一个class的对象,那么class又是啥?
再次查看class 的来源
//class又是objc_class的对象
typedef struct objc_class *Class;
//objc_object结构体里面有isa
struct objc_object {
Class _Nonnull isa OBJC_ISA_AVAILABILITY;
};
//objc_class 继承objc_object
struct objc_class : objc_object {
// Class ISA; //默认有个 ISA
Class superclass; //父类
cache_t cache; //缓存
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() const {
return bits.data();
}
void setData(class_rw_t *newData) {
bits.setData(newData);
}
......
可以看出:
-
Class是一个objc_class结构类型的对象,id是一个objc_object结构类型的对象。 -
objc_object结构体中可以看出来,这个结构体只有一个成员变量,这是一个Class类型的变量isa。 -
objc_class又继承objc_object,其中// Class ISA;,这里其实就是isa指向的终点。这里注释不是表示没有,而是代表本身自带一个isa。 - 从
objc_class结构体可以看出来,里面有个isa属性,还有个super_class属性,它俩都是指针,其实在objc_class的定义中也能看出来,每一个objc_class都有isa,但是不一定会有super_class。
总结:
- 所有的对象 + 类 + 元类 都有isa属性
- 所有的对象都是由objc_object继承来的,所以常说万物皆对象
- 在结构层面可以通俗的理解为上层OC 与 底层的对接:
- 下层是通过 结构体 定义的 模板,例如objc_class、objc_object
- 上层 是通过底层的模板创建的 一些类型,例如HJPerson
四、针对数组指针进行内存平移拓展
数组指针的平移推导流程:
数组指针
说明:
- 发现数组地址和数组的值1的地址一样。说明了
数组值的首地址即为数组的地址。并且数组的第二个值的地址 跟第一个值的地址的偏移量是4个字节,也就是int的长度。所以数组中的值的地址是相对平移
-偏移:指针变量的偏移, 用数组的指针访问数组元素 可以反向推导数组的值 - 拓展:类似结构体,我们是否也可以通过地址的偏移拿到类的结构体内部的值呢?
五、类的内存结构分析
- 通过源码拿到类对象的结构体
objc_class在最新版(objc4-781版本)定义
struct objc_class : objc_object {
// Class ISA; //默认含有一个8字节isa指针
Class superclass; //父类指针 8字节
cache_t cache; // 缓存 16字节
class_data_bits_t bits; //类的信息
class_rw_t *data() const {
return bits.data();
}
void setData(class_rw_t *newData) {
bits.setData(newData);
}
.......
-
bits里面存的是 各种方法协议的信息。通过内存平移原理我们可以通过底层的方法获取到类的信息。
1. 通过偏移计算类的bits,
分析如图
偏移计算类的bits
注:
32字节的由来
两个class 都是isa 指针是8+8个字节 这个好理解
我们来看 cache_t cache 为什么是16字节呢?
2.查看源码分析 cache_t结构体大小
struct cache_t {
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_OUTLINED
explicit_atomic<struct bucket_t *> _buckets; //bucket_t * 这是一个指针 8 字节
explicit_atomic<mask_t> _mask; //mask_t的定义:typedef uint32_t mask_t; mask_t 是 unsigned int 的别名,占4字节
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
explicit_atomic<uintptr_t> _maskAndBuckets; //typedef unsigned long uintptr_t;(unsigned long) 占8字节
mask_t _mask_unused; //mask_t 是 unsigned int 的别名,占4字节
// 以下 static 修饰的变量不在结构体内存中 所以忽略
static constexpr uintptr_t maskShift = 48;
static constexpr uintptr_t maskZeroBits = 4;
static constexpr uintptr_t maxMask = ((uintptr_t)1 << (64 - maskShift)) - 1;
static constexpr uintptr_t bucketsMask = ((uintptr_t)1 << (maskShift - maskZeroBits)) - 1;
static_assert(bucketsMask >= MACH_VM_MAX_ADDRESS, "Bucket field doesn't have enough bits for arbitrary pointers.");
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
explicit_atomic<uintptr_t> _maskAndBuckets; // uintptr_t;(unsigned long) 占8字节
mask_t _mask_unused;//mask_t 是 unsigned int 的别名,占4字节
static constexpr uintptr_t maskBits = 4;
static constexpr uintptr_t maskMask = (1 << maskBits) - 1;
static constexpr uintptr_t bucketsMask = ~maskMask;
#else
#error Unknown cache mask storage type.
#endif
#if __LP64__
uint16_t _flags; //unsigned short 2个字节
#endif
uint16_t _occupied; //unsigned short 2个字节
根据源码中注释进行计算:分析if else中的判断条件
最后结果: 8+4+2+2 = 16
3.通过源码查看属性 方法 协议:
通过查看class_rw_t定义的源码发现,跳转class_rw_t到源码中查看,可以看到如图
image.png
通过lldb查看属性列表property_list
lldb查看属性列表
打印方法解释:
-
p $9.properties():命令中的propertoes方法是由class_rw_t提供的,方法中返回的实际类型为property_array_t; -
p $10.list:list是properties的成员; -
p *$13:直接获取property_list_t的指针内容; -
p $14.get(0):通过get方法获取属性;
4.lldb 查看方法列表methods_list:
lldb查看方法列表打印
注:
- 类方法
+ (void)playByteRoll;获取到的name = ".cxx_destruct"说明了类方法不存在类中,调用类方法需要底层操作一波儿; - 对象方法、set 、get方法自动生成在方法列表中。
5.查找类的类方法:
其实元类中储存着类的类方法 ,在lldb中查找如图:
lldb类的类方法分析图.png
6.查找类的成员变量:
我们知道属性 = 成员变量 + set方法 + get方法,所以我们猜成员变量估计也在类中。
我们在源码中查找
成员变量查找流程
注:实例变量ivars 是成员变量的一部分。所以ivars 存的就是成员变量。
再来通过lldb查找
lldb查找类的成员变量
五、总结
这篇内容思路:
引入元类——>查看isa走势图——>isa的指向的根源objc_class——>输出objc_class的bits属性——>在bits中找到属性、方法、成员变量、并在元类中找到类方法——>从而清晰的分析了大致的类的结构