iOS-底层原理7:isa与类关联的原理

2020-11-16  本文已影响0人  AcmenL

问题

OC对象的本质到底是什么?里面到底是什么结构呢?

探索

在探索oc对象本质前,先了解一个编译器:clang

clang

操作指令

//1、将 main.m 编译成 main.cpp
clang -rewrite-objc main.m -o main.cpp

//2、将 ViewController.m 编译成  ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m

//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp 

//4、真机文件编译
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp 

代码分析

Step1: 在main中自定义一个类LBHPerson,有一个属性name

@interface LBHPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end

@implementation LBHPerson
@end

step2:打开终端,cdmain.m的文件夹,输入clang指令: clang -rewrite-objc main.m -o main.cppmain.m编译成 main.cpp

step3:找到main.cppLBHPerson定义相关的代码

//LGPerson的底层编译
struct LBHPerson_IMPL {
    struct NSObject_IMPL NSObject_IVARS;
    NSString *_name;
};

//NSObject 的底层编译
struct NSObject_IMPL {
    Class isa;
};

总结:

OC对象的本质是结构体,每一个结构体都有一个Class isa

探究属性get、set方法

isa

C++源码中得知类中存在一个isa,那么isa又是什么?有什么作用呢?

objc4源码分析

通过alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone方法路径,查找到initInstanceIsa

step1:在objc4源码中找到initInstanceIsa函数

inline void 
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
    ASSERT(!cls->instancesRequireRawIsa());
    ASSERT(hasCxxDtor == cls->hasCxxDtor());
    //调用initIsa函数
    initIsa(cls, true, hasCxxDtor);
}

step2:进入initIsa函数

inline void 
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
{ 
    ASSERT(!isTaggedPointer()); 
    
    if (!nonpointer) {
        isa = isa_t((uintptr_t)cls);
    } else {
        ASSERT(!DisableNonpointerIsa);
        ASSERT(!cls->instancesRequireRawIsa());

        isa_t newisa(0);

#if SUPPORT_INDEXED_ISA
        ASSERT(cls->classArrayIndex() > 0);
        newisa.bits = ISA_INDEX_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
        newisa.bits = ISA_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.shiftcls = (uintptr_t)cls >> 3;
#endif

        // This write must be performed in a single store in some cases
        // (for example when realizing a class because other threads
        // may simultaneously try to use the class).
        // fixme use atomics here to guarantee single-store and to
        // guarantee memory order w.r.t. the class index table
        // ...but not too atomic because we don't want to hurt instantiation
        isa = newisa;
    }
}

initIsa()函数里面,如果是!nonpointer, 通过初始化函数isa_t((uintptr_t)cls)并赋值给isa,否则新建isa_t,并对isa_t的位域里面的变量进行赋初始值

step3:进入isa_t,如果无法跳转进入,则直接全局搜索

union isa_t {
    isa_t() { }
    isa_t(uintptr_t value) : bits(value) { }

    Class cls;
    uintptr_t bits;
#if defined(ISA_BITFIELD)
    struct {
        ISA_BITFIELD;  // defined in isa.h
    };
#endif
};

这个出现一个新的类型union,联合体。

联合体(union)

构造数据类型的方式有以下两种:

结构体

结构体是指把不同的数据组合成一个整体,其变量是共存的,变量不管是否使用,都会分配内存。

联合体

联合体也是由不同的数据类型组成,但其变量是互斥的,所有的成员共占一段内存。而且共用体采用了内存覆盖技术,同一时刻只能保存一个成员的值,如果对新的成员赋值,就会将原来成员的值覆盖掉

两者的区别

isa_t

isa_t类型使用联合体的原因也是基于内存优化的考虑,这里的内存优化是指在isa指针中通过char + 位域(即二进制中每一位均可表示不同的信息)的原理实现。

isa_t的定义中可以看出:

提供了两个成员,clsbits,由联合体的定义所知,这两个成员是互斥的,也就意味着,当初始化isa指针时,有两种初始化方式

还提供了一个结构体定义的位域,用于存储类信息及其他信息,结构体的成员ISA_BITFIELD,这是一个宏定义,有两个版本 arm64(对应ios 移动端) 和 x86_64(对应macOS),以下是它们的一些宏定义,如下图所示

名称 内容 长度 说明
nonpointer 表示自定义的类等 1 0:纯isa指针 1:不只是类对象地址,isa中包含了类信息、对象的引用计数等(自定义的类nonpointer为1)
has_assoc 关联对象标志 1 0:没有关联对象 1:存在关联对象
has_cxx_dtor 该对象是否有C++/OC的析构器(类似于dealloc) 1 如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象
shiftcls 存储类的指针的值(类的地址) arm64中占33x86_64中占44
magic 判断当前对象是真的对象还是没有初始化的空间 6
weakly_refrenced 指对象是否被指向 或者 曾经指向一个ARC的弱变量 1 没有弱引用的对象可以更快释放
deallocating 对象是否正在释放内存 1
has_sidetable_rc 当对象引用计数大于10时,则需要借用该变量存储进位 1
extra_rc 表示该对象的引用计数值 arm64中占19x86_64中占8 实际上是引用计数值减 1, 例如,如果对象的引用计数为 10,那么 extra_rc 为 9。如果引用计数大于 10, 则需要使用到 has_sidetable_rc

针对两种不同平台,其isa的存储情况如图所示

isa存储情况

isa指针 位域分析(0-64)

step1:找到initIsa函数源码(上面已经讲过步骤),打上断点,并将程序执行到isa_t初始化之后

initIsa源码

step2:执行lldb命令,p newisa,得到newisa的信息

通过lldb命令查看newisa

step3:继续执行,走到newisa.bits = ISA_MAGIC_VALUE;下一行

step4:重新执行lldb命令p newisa

重新执行llvm命令
对比step2step4中llvm命令输出结果,发现isa指针中有一些变化,如下图所示
magic为什么是59?

magic是59是由于将isa指针地址转换为二进制,从47(在x86_64上,因为前面有4个位域,共占用47位,地址是从0开始)位开始读取6位,再转换为十进制,如下图所示

将宏ISA_MAGIC_VALUE对应的16进制数据复制到计算器,转换成二进制数据为:110111
10进制的59转换成二进制为:110111

step5:执行到最后一步,重新执行lldb命令

根据打印结果,clsshiftcls有了新值, isa指针与cls类成功关联

isa成员值变化

问题 :为什么要强制转换成uintptr_t类型?

因为内存的存储不能存储字符串,机器码只能识别 0 、1这两种数字,所以需要将其转换为uintptr_t数据类型,这样shiftcls中存储的类信息才能被机器码理解, 其中uintptr_tlong

问题 :为什么需要右移三位,直接赋值不行吗?

因为bits的成员shiftcls不是在起始位置而是在中间位置,低位有三位存储其他信息,所以需要右移3位后开始存储,存到44位满了就停止存储。这样才能准确的存储到类的信息。

isa 与 类 的关联

clsisa 关联原理:isa指针中的shiftcls位域中存储了类信息,其中initInstanceIsa的过程是将 isa 指针 和当前的 类cls 关联起来,有以下几种验证方式:

way1: 通过initIsa方法中的newisa.shiftcls = (uintptr_t)cls >> 3;验证

way2: 通过isa指针地址与ISA_MSAK 的值 & 来验证

way3: 通过runtime的方法object_getClass验证

way4: 通过位运算验证

way1: 通过initIsa方法验证

step1:initIsa函数中运行至newisa.shiftcls = (uintptr_t)cls >> 3;

当前的clsLBHPerson,强制转换成uintptr_t类型后得到 (uintptr_t)cls = 4295000296,然后右移三位得到的数据赋值给shiftcls

cls右移三位

step2: 继续执行,在控制台执行lldb 命令p newisa

会发现cls变成了LBHPersonshiftcls变成一串数字

截屏2020-11-16 上午11.44.28.png

way2: 通过isa指针地址与ISA_MSAK 的值 & 来验证

step1:_class_createInstanceFromZone函数的如下位置打上断点

step2:在控制台执行x/4gx obj,得到isa指针的地址0x001d8001000080e9,然后&0x00007ffffffffff8

架构 ISA_MASK的值
arm64 0x0000000ffffffff8ULL
x86_64 0x00007ffffffffff8ULL

way3: 通过runtime的方法object_getClass验证

step1: main中导入#import <objc/runtime.h>

step2: 通过runtimeapi,即object_getClass函数

step3:进入object_getClass函数

step4: 进入getIsa()函数

step5: 进入ISA()函数

截屏2020-11-16 下午12.22.03.png

step6:ISA()函数中打上断点,等程序执行到此处,在控制台调用lldb命令

way4: 通过位运算

step1:_class_createInstanceFromZone函数的如下位置打上断点

step2:找到isa指针地址

step3: 我们要先了解isa指针的位域,其中shiftcls存储的是类信息,位置为(3,44)

上一篇 下一篇

猜你喜欢

热点阅读