iOS 底层探索:类的结构分析
前言
- 这篇主要内容探索 类的结构分析。
- 通过上篇iOS 探索 isa与类关联的原理,知道了isa关联了当前的类信息之后,类的属性、方法列表等存在哪里呢?抱着疑问我们开始类的结构的探索。
准备工作
一、引入元类
我们通过LLDB调试, 先探索类的内存信息。 类的内存分析注:其实图中第二个打印的指针指向的HJPerson的元类。
那么我们按照上图的打印分析,我们继续寻找元类的上层是啥呢?如下图
探索元类的终点如图2、3、4中 打印元类还有根元类NSObject ,图中3和4的又不一样,分析可知一个是
NSObject类
一个是 NSObject的元类
,NSObject的元类
又是HJPerson的元类
的根元类
, 根源类再次查看地址还是自己,说明已经到底了。
先梳理一下isa指向流程:isa对象
——> 类HJPerson
——>元类HJPerson
——> 根元类NSObject
<=> 根元类NSObject
从图片上可以看出,NSObject的元类、根元类,根根元类的指针地址都是一模一样的
总结一下对元类的理解:
元类就是类对象所属的类。所以,实例是类的实例,类作为对象又是元类的实例。OC中所有的类都是一种对象,所以元类也是对象,那么元类是根元类的实例,同时根元类是其自身的实例。
二、 分析isa、对象、类和元类的关系
对象
、类
和元类
跟随isa指针
走向关系简单流程如下图
- 元类也有isa指针,它的isa指针最终指向的是一个根元类(root metaClass);
- 根元类的isa指针指向本身,这样形成了一个封闭的内循环;
最终各个类实例变量的继承关系如图: isa经典流程图
isa流程图 注:
- superClass是一层层集成的,到最后NSObject的superClass是nil。而NSObject的isa指向根元类,这个根元类的isa指向它自己,而它的>superClass是NSObject,也就是最后形成一个环。
- metaClass也是相互继承的。
三、源码分析 isa的来源:objc_class与objc_object
struct HJPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
};
struct NSObject_IMPL {
Class isa;
};
查看HJPerson类
的编译后的结构体,我们发现NSObject_IMPL
也是个结构体,结构体内部的isa
是一个class
类型的,说明isa
也是一个class
的对象,那么class
又是啥?
再次查看class
的来源
//class又是objc_class的对象
typedef struct objc_class *Class;
//objc_object结构体里面有isa
struct objc_object {
Class _Nonnull isa OBJC_ISA_AVAILABILITY;
};
//objc_class 继承objc_object
struct objc_class : objc_object {
// Class ISA; //默认有个 ISA
Class superclass; //父类
cache_t cache; //缓存
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() const {
return bits.data();
}
void setData(class_rw_t *newData) {
bits.setData(newData);
}
......
可以看出:
-
Class
是一个objc_class
结构类型的对象,id
是一个objc_object
结构类型的对象。 -
objc_object
结构体中可以看出来,这个结构体只有一个成员变量,这是一个Class
类型的变量isa
。 -
objc_class
又继承objc_object
,其中// Class ISA;
,这里其实就是isa
指向的终点。这里注释不是表示没有,而是代表本身自带一个isa。 - 从
objc_class
结构体可以看出来,里面有个isa
属性,还有个super_class
属性,它俩都是指针,其实在objc_class
的定义中也能看出来,每一个objc_class
都有isa
,但是不一定会有super_class
。
总结:
- 所有的对象 + 类 + 元类 都有isa属性
- 所有的对象都是由objc_object继承来的,所以常说万物皆对象
- 在结构层面可以通俗的理解为上层OC 与 底层的对接:
- 下层是通过 结构体 定义的 模板,例如objc_class、objc_object
- 上层 是通过底层的模板创建的 一些类型,例如HJPerson
四、针对数组指针进行内存平移拓展
数组指针的平移推导流程:
数组指针
说明:
- 发现数组地址和数组的值1的地址一样。说明了
数组值的首地址即为数组的地址
。并且数组的第二个值的地址 跟第一个值的地址的偏移量是4个字节,也就是int的长度。所以数组中的值的地址是相对平移
-偏移
:指针变量的偏移, 用数组的指针访问数组元素 可以反向推导数组的值 - 拓展:类似结构体,我们是否也可以通过地址的偏移拿到类的结构体内部的值呢?
五、类的内存结构分析
- 通过源码拿到类对象的结构体
objc_class
在最新版(objc4-781版本)定义
struct objc_class : objc_object {
// Class ISA; //默认含有一个8字节isa指针
Class superclass; //父类指针 8字节
cache_t cache; // 缓存 16字节
class_data_bits_t bits; //类的信息
class_rw_t *data() const {
return bits.data();
}
void setData(class_rw_t *newData) {
bits.setData(newData);
}
.......
-
bits
里面存的是 各种方法协议的信息。通过内存平移原理我们可以通过底层的方法获取到类的信息。
1. 通过偏移计算类的bits,
分析如图
注:
32字节的由来
两个class 都是isa 指针是8+8个字节 这个好理解
我们来看 cache_t cache 为什么是16字节呢?
2.查看源码分析 cache_t结构体大小
struct cache_t {
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_OUTLINED
explicit_atomic<struct bucket_t *> _buckets; //bucket_t * 这是一个指针 8 字节
explicit_atomic<mask_t> _mask; //mask_t的定义:typedef uint32_t mask_t; mask_t 是 unsigned int 的别名,占4字节
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
explicit_atomic<uintptr_t> _maskAndBuckets; //typedef unsigned long uintptr_t;(unsigned long) 占8字节
mask_t _mask_unused; //mask_t 是 unsigned int 的别名,占4字节
// 以下 static 修饰的变量不在结构体内存中 所以忽略
static constexpr uintptr_t maskShift = 48;
static constexpr uintptr_t maskZeroBits = 4;
static constexpr uintptr_t maxMask = ((uintptr_t)1 << (64 - maskShift)) - 1;
static constexpr uintptr_t bucketsMask = ((uintptr_t)1 << (maskShift - maskZeroBits)) - 1;
static_assert(bucketsMask >= MACH_VM_MAX_ADDRESS, "Bucket field doesn't have enough bits for arbitrary pointers.");
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
explicit_atomic<uintptr_t> _maskAndBuckets; // uintptr_t;(unsigned long) 占8字节
mask_t _mask_unused;//mask_t 是 unsigned int 的别名,占4字节
static constexpr uintptr_t maskBits = 4;
static constexpr uintptr_t maskMask = (1 << maskBits) - 1;
static constexpr uintptr_t bucketsMask = ~maskMask;
#else
#error Unknown cache mask storage type.
#endif
#if __LP64__
uint16_t _flags; //unsigned short 2个字节
#endif
uint16_t _occupied; //unsigned short 2个字节
根据源码中注释进行计算:分析if else中的判断条件
最后结果: 8+4+2+2 = 16
3.通过源码查看属性 方法 协议:
通过查看class_rw_t定义的源码发现,跳转class_rw_t到源码中查看,可以看到如图 image.png通过lldb查看属性列表property_list
打印方法解释:
-
p $9.properties()
:命令中的propertoes方法是由class_rw_t提供的,方法中返回的实际类型为property_array_t; -
p $10.list
:list是properties的成员; -
p *$13
:直接获取property_list_t的指针内容; -
p $14.get(0)
:通过get方法获取属性;
4.lldb 查看方法列表methods_list
:
注:
- 类方法
+ (void)playByteRoll;
获取到的name = ".cxx_destruct"
说明了类方法不存在类中,调用类方法需要底层操作一波儿; - 对象方法、set 、get方法自动生成在方法列表中。
5.查找类的类方法:
其实元类中储存着类的类方法 ,在lldb中查找如图: lldb类的类方法分析图.png6.查找类的成员变量:
我们知道属性 = 成员变量 + set方法 + get方法
,所以我们猜成员变量估计也在类中。
我们在源码中查找
注:实例变量ivars
是成员变量的一部分。所以ivars 存的就是成员变量
。
再来通过lldb查找
五、总结
这篇内容思路:
引入元类
——>查看isa
走势图——>isa
的指向的根源objc_class
——>输出objc_class
的bits
属性——>在bits
中找到属性
、方法
、成员变量
、并在元类
中找到类方法
——>从而清晰的分析了大致的类的结构