七、消息流程之快速查找
1、方法调用本质
如下图中展示的对象调用方法,在底层是怎么调的呢:
image.png为了探索这个问题,用clang
将main.m
文件编译为C++
文件,指令为:
clang -x objective-c -rewrite-objc -isysroot /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator.sdk xxxxx.m
编译后生成一个后缀为.cpp
的文件,这个文件代码非常多,只需看main
函数里面即可,可以看到main
函数编译后变为:
可以看到所有的方法调用都转化为objc_msgSend
,也就是经常听到的消息转发,导入头文件#import <objc/message.h>
,我们先看看定义:
默认有两个参数:第一个是消息接受者,第二个参数是SEL
,了解这个可以改一下main函数的方法调用方式:
这里报一个参数的错误,需要修改一下配置:
image.png修改之后运行一下:
image.png跟直接调用方法效果是一样的。
子类怎么调父类的方法呢,这个要介绍另一个消息发送方式objc_msgSendSuper
,从其定义来看他也需要两个参数:第一个是结构体objc_super
的指针,第二个是sel
,结构体objc_super
的定义如下:
struct objc_super {
/// Specifies an instance of a class.
__unsafe_unretained _Nonnull id receiver;
/// Specifies the particular superclass of the instance to message.
#if !defined(__cplusplus) && !__OBJC2__
/* For compatibility with old objc-runtime.h header */
__unsafe_unretained _Nonnull Class class;
#else
__unsafe_unretained _Nonnull Class super_class;
#endif
/* super_class is the first class to search */
};
使用方法如下:
image.png2、objc_msgSend流程
objc_msgSend
使用汇编写的,主要目的是为了快,因为方法的调用是非常频繁的,直接用汇编可以缩短调用时间。
简单分析其流程,可以全局搜索找到调用入口:
来逐行分析一下其含义:
1、ENTRY _objc_msgSend
:进入objc_msgSend流程
2、cmp p0, #0
:cmp(compare)代表比较,就是用p0和0比较。p0表示第一个寄存器的值,根据objc_msgSend的定义其第一个参数是消息接受者,也就是说如果消息接收者为nil,就走到下面的跳转流程了。
3、
#if SUPPORT_TAGGED_POINTERS
b.le LNilOrTagged // (MSB tagged pointer looks negative)
#else
b.eq LReturnZero
#endif
这一段代码的意思是消息接受者为nil,如果是SUPPORT_TAGGED_POINTERS
就跳转到LNilOrTagged
,否则跳转到LReturnZero
,这个是异常情况,就不深入分析了。
4、ldr p13, [x0]
:将x0寄存器的数据读到寄存器p13中,也就是说将消息接收者放到p13中。
5、GetClassFromIsa_p16 p13, 1, x0
:这个在当前文件中搜一下GetClassFromIsa_p16,可以看到:
其实GetClassFromIsa_p16就是一个宏定义,这个作用就是根据isa通过移位获取到class,这个原理在中介绍过,这里就不介绍了。最终就是将class存到p16中了。
6、
LGetIsaDone:
// calls imp or objc_msgSend_uncached
CacheLookup NORMAL, _objc_msgSend, __objc_msgSend_uncached
通过上面5步将消息接受者的class找到,接下来就开始缓存查找了,同样找到CacheLookup的定义:
image.png这个是objc818版本比之前的版本改动不少,把没有用的去掉简化一下;
.macro CacheLookup Mode, Function, MissLabelDynamic, MissLabelConstant
mov x15, x16 // stash the original isa
LLookupStart\Function:
ldr p11, [x16, #CACHE] // p11 = mask|buckets
and p10, p11, #0x0000ffffffffffff // p10 = buckets
and p12, p1, p11, LSR #48 // x12 = _cmd & mask
add p13, p10, p12, LSL #(1+PTRSHIFT)
// p13 = buckets + ((_cmd & mask) << (1+PTRSHIFT))
// do {
1: ldp p17, p9, [x13], #-BUCKET_SIZE // {imp, sel} = *bucket--
cmp p9, p1 // if (sel != _cmd) {
b.ne 3f // scan more
// } else {
2: CacheHit \Mode // hit: call or return imp
// }
3: cbz p9, \MissLabelDynamic // if (sel == 0) goto Miss;
cmp p13, p10 // } while (bucket >= buckets)
b.hs 1b
.endmacro
6.1 ldr p11, [x16, #CACHE]
,x16加上#CACHE的值给p11。看一下#CASE定义就知道其大小是16,x16存的是isa的地址也是类的首地址,类的首地址+16字节就是cache,参考中cache的获取方法。
6.2 p10, p11, #0x0000ffffffffffff
,p11 & #0x0000ffffffffffff的值放到p10,在里面已经介绍过cache的高16位是存的mask,第48位存的是buckets,p10存的就是buckets了
6.3 and p12, p1, p11, LSR #48
,p11, LSR #48
的意思是P11 逻辑右移48位取到的结果&p1,p11逻辑右移48位就是mask,p1就是_cmd,所以p12的值就是(_cmd&mask)在里面已经介绍过这个值就是buckets的脚标,可以根据它获取到相应的bucket。
6.4 add p13, p10, p12, LSL #(1+PTRSHIFT)
,这个的意思是将p10加p12逻辑左移(1+PTRSHIFT)放到P13中。1+PTRSHIFT的值是4:
p12<<4
就是将脚标放大2^4
,p10
是buckets
也是首地址,p13
存的就是当前bucket
,举个例子脚标为2
:
这样就取到bucket3
了,bucket
的大小是16因为结构体bucket_t
里面包含两个指针sel
和imp
。
7、下面进入一个循环体了:
// do {
1: ldp p17, p9, [x13], #-BUCKET_SIZE // {imp, sel} = *bucket--
cmp p9, p1 // if (sel != _cmd) {
b.ne 3f // scan more
// } else {
2: CacheHit \Mode // hit: call or return imp
// }
3: cbz p9, \MissLabelDynamic // if (sel == 0) goto Miss;
cmp p13, p10 // } while (bucket >= buckets)
b.hs 1b
7.1 ldp p17, p9, [x13], #-BUCKET_SIZE
,取到当前的sel后,然后backet--,
7.2 cmp p9, p1
,当前的sel和_cmd比较,如果相同就返回imp,如果不相同跳到下一次循环
7.3 CacheHit \Mode
,命中imp返回
7.4 cbz p9, \MissLabelDynamic
,没有找到imp
开始到methodlist
里面查找——消息慢速查找流程,MissLabelDynamic
是第三个参数__objc_msgSend_uncached
,看一下其定义:
7.5 cmp p13, p10
,循环条件,就是判断当前bucket是不是已经到了buckets的首地址,如果已经到了就调出循环
7.6 b.hs 1b
,再次进入循环体。因为bucket已经小于buckets了,所以sel=0,就会调出去了。
这一句不是很理解,跟之前的流程不一样了,可以在评论区探讨一下
消息流程的快速查找就介绍完了,汇编也是半瓢水,有纰漏的地方希望指出。后面再介绍消息流程的慢速查找。