iOS - 探索objc_msgSend慢速查找流程
上一篇我们分析了objc_msgSend
的快速查找方法的流程,我们调用方法实际上就是发送消息,然后首先会到cache
中进行查找,也即是快速查找。objc_msgSend
通过汇编快速查找方法缓存 ,如果能找到则调用 TailCallCachedImp
直接将方法缓存起来然后进行调用,如果查找不到就跳到 CheckMiss
,然后走慢速查找流程 。这一篇我们接着来分析一下objc_msgSend
的慢速查找方法的流程。
一、 checkMiss
和jumpMiss
在前面的快速查找流程中,有两个判断是够没有找到的方法,就是checkMiss
和jumpMiss
。我们先看下他们的源码:
.macro CheckMiss
// miss if bucket->sel == 0
.if $0 == GETIMP
cbz p9, LGetImpMiss
.elseif $0 == NORMAL
cbz p9, __objc_msgSend_uncached
.elseif $0 == LOOKUP
cbz p9, __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro
.macro JumpMiss
.if $0 == GETIMP
b LGetImpMiss
.elseif $0 == NORMAL
b __objc_msgSend_uncached
.elseif $0 == LOOKUP
b __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro
如果没有找到方法进入他们的时候,都会执行__objc_msgSend_uncached
方法,我们再看下__objc_msgSend_uncached
的源码:
STATIC_ENTRY __objc_msgSend_uncached
UNWIND __objc_msgSend_uncached, FrameWithNoSaves
// THIS IS NOT A CALLABLE C FUNCTION
// Out-of-band p16 is the class to search
MethodTableLookup
TailCallFunctionPointer x17
END_ENTRY __objc_msgSend_uncached
非常简单,关键代码就是MethodTableLookup
这一行,表示从方法列表中进行查找,我们接着看MethodTableLookup
的源码:
.macro MethodTableLookup
// push frame
SignLR
stp fp, lr, [sp, #-16]!
mov fp, sp
// save parameter registers: x0..x8, q0..q7
sub sp, sp, #(10*8 + 8*16)
stp q0, q1, [sp, #(0*16)]
stp q2, q3, [sp, #(2*16)]
stp q4, q5, [sp, #(4*16)]
stp q6, q7, [sp, #(6*16)]
stp x0, x1, [sp, #(8*16+0*8)]
stp x2, x3, [sp, #(8*16+2*8)]
stp x4, x5, [sp, #(8*16+4*8)]
stp x6, x7, [sp, #(8*16+6*8)]
str x8, [sp, #(8*16+8*8)]
// lookUpImpOrForward(obj, sel, cls, LOOKUP_INITIALIZE | LOOKUP_RESOLVER)
// receiver and selector already in x0 and x1
mov x2, x16
mov x3, #3
bl _lookUpImpOrForward
// IMP in x0
mov x17, x0
// restore registers and return
ldp q0, q1, [sp, #(0*16)]
ldp q2, q3, [sp, #(2*16)]
ldp q4, q5, [sp, #(4*16)]
ldp q6, q7, [sp, #(6*16)]
ldp x0, x1, [sp, #(8*16+0*8)]
ldp x2, x3, [sp, #(8*16+2*8)]
ldp x4, x5, [sp, #(8*16+4*8)]
ldp x6, x7, [sp, #(8*16+6*8)]
ldr x8, [sp, #(8*16+8*8)]
mov sp, fp
ldp fp, lr, [sp], #16
AuthenticateLR
.endmacro
是不是看着很懵逼?我也是,我们需要过滤下,找出其中的关键代码,从上到下看一遍,是不是发现有一个很可疑的代码:_lookUpImpOrForward
,没错,除了它,其它的我们基本不需要看。那我们怎么知道它就是我们要找的关键代码呢?
接下来我们在项目中验证下:
首先创建工程,新建LPPerson
类,具体代码如下:
@interface LPPerson : NSObject
@property (nonatomic, copy) NSString *name;
@property (nonatomic, strong) NSString *nickName;
- (void)say666;
- (void)sayHello;
@end
@implementation LGPerson
- (void)sayHello{
NSLog(@"%s",__func__);
}
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
// insert code here...
LPPerson *person = [LPPerson alloc];
[person sayHello];
[person say666];
}
return 0;
}
并在[person sayHello];
这一行打上断点:
然后运行,在来到断点后,开启汇编调试【Debug -- Debug worlflow -- 勾选Always show Disassembly】
就可以看到下面这样:
我们在objc_msgSend
这一行打上断点,并执行到此断点,按照我们前面说的方法,按住control
点击stepInto
即可进入objc_msgSend
内部:
同样的方法,在_objc_msgSend_uncached
加上断点,并stepInto
进去:
DuangDuang,是不是我们前面找到的关键代码:_lookUpImpOrForward
,只不过这里少了个下划线,这是因为汇编和C/C++
的语法问题导致:
- 1、
C/C++
中调用 汇编 ,去查找汇编时,C/C++
调用的方法需要多加一个下划线 - 2、汇编 中调用
C/C++方
法时,去查找C/C++
方法,需要将汇编调用的方法去掉一个下划线
二、lookUpImpOrForward
ok,接下来我们就要重点分析_lookUpImpOrForward
它的内部做了做什么了,全局搜索lookUpImpOrForward
,记得去掉下划线:
找到如图所以的地方,
lookUpImpOrForward
就是一个函数:
IMP lookUpImpOrForward(id inst, SEL sel, Class cls, int behavior)
{
// 定义的消息转发
const IMP forward_imp = (IMP)_objc_msgForward_impcache;
IMP imp = nil;
Class curClass;
runtimeLock.assertUnlocked();
// 快速查找,如果找到则直接返回imp
//目的:防止多线程操作时,刚好调用函数,此时缓存进来了
if (fastpath(behavior & LOOKUP_CACHE)) {
imp = cache_getImp(cls, sel);
if (imp) goto done_nolock;
}
//加锁,目的是保证读取的线程安全
runtimeLock.lock();
//判断是否是一个已知的类:判断当前类是否是已经被认可的类,即已经加载的类
checkIsKnownClass(cls);
//判断类是否实现,如果没有,需要先实现,此时的目的是为了确定父类链,方法后续的循环
if (slowpath(!cls->isRealized())) {
cls = realizeClassMaybeSwiftAndLeaveLocked(cls, runtimeLock);
}
//判断类是否初始化,如果没有,需要先初始化
if (slowpath((behavior & LOOKUP_INITIALIZE) && !cls->isInitialized())) {
cls = initializeAndLeaveLocked(cls, inst, runtimeLock);
}
runtimeLock.assertLocked();
curClass = cls;
//----查找类的缓存
// unreasonableClassCount -- 表示类的迭代的上限
//(猜测这里递归的原因是attempts在第一次循环时作了减一操作,然后再次循环时,仍在上限的范围内,所以可以继续递归)
for (unsigned attempts = unreasonableClassCount();;) {
//---当前类方法列表(采用二分查找算法),如果找到,则返回,将方法缓存到cache中
Method meth = getMethodNoSuper_nolock(curClass, sel);
if (meth) {
imp = meth->imp;
goto done;
}
//当前类 = 当前类的父类,并判断父类是否为nil
if (slowpath((curClass = curClass->superclass) == nil)) {
//--未找到方法实现,方法解析器也不行,使用转发
imp = forward_imp;
break;
}
// 如果父类链中存在循环,则停止
if (slowpath(--attempts == 0)) {
_objc_fatal("Memory corruption in class list.");
}
// --父类缓存
imp = cache_getImp(curClass, sel);
if (slowpath(imp == forward_imp)) {
// 如果在父类中找到了forward,则停止查找,且不缓存,首先调用此类的方法解析器
break;
}
if (fastpath(imp)) {
//如果在父类中,找到了此方法,将其存储到cache中
goto done;
}
}
//没有找到方法实现,尝试一次方法解析
if (slowpath(behavior & LOOKUP_RESOLVER)) {
//动态方法决议的控制条件,表示流程只走一次
behavior ^= LOOKUP_RESOLVER;
return resolveMethod_locked(inst, sel, cls, behavior);
}
done:
//存储到缓存
log_and_fill_cache(cls, imp, sel, inst, curClass);
//解锁
runtimeLock.unlock();
done_nolock:
if (slowpath((behavior & LOOKUP_NIL) && imp == forward_imp)) {
return nil;
}
return imp;
}
整个lookUpImpOrForward
,我们大体上可以分为4个部分:
- 1、再次快速查找,防止因为线程的原因,导致查找到这个地方的时候,刚好有了缓存,那么就需要获取缓存并返回
- 2、获取类信息,这个一步不仅是获取当前的类的信息,还要获取父类,父类的父类等,确保类的继承链,方便我们的方法查找一定是走到最后。主要包括以下几步:
-
判断当前cls是否是已知类,如果不是,则报错
-
类是否实现,如果没有,则需要先实现,确定其父类链,此时实例化的目的是为了确定父类链、
ro
、以及rw
等,方法后续数据的读取以及查找的循环 -
是否初始化,如果没有,则初始化
-
- 3、按照继承链循环查找,查找过程中使用二分查找,保证效率。注意
for (unsigned attempts = unreasonableClassCount();;)
是一个死循环,一直找到nil,如果找到了则存储到cache
中,并返回imp,找不到则imp = forward_imp;
。 - 4、判断是否执行过动态方法解析,如果没有,执行动态方法解析,如果执行过一次动态方法解析,则走到消息转发流程。
需要注意的两个地方:
第一、二分查找
二分查找的原理是:从第一次查找开始,每次都取中间位置,与想查找的key
的value
值作比较,如果相等,则需要排除分类方法,然后将查询到的位置的方法实现返回,如果不相等,则需要继续二分查找,如果循环至count = 0
还是没有找到,则直接返回nil
。
具体流程是:
- 首先进入
getMethodNoSuper_nolock
:
getMethodNoSuper_nolock(Class cls, SEL sel)
{
runtimeLock.assertLocked();
ASSERT(cls->isRealized());
// fixme nil cls?
// fixme nil sel?
auto const methods = cls->data()->methods();
for (auto mlists = methods.beginLists(),
end = methods.endLists();
mlists != end;
++mlists)
{
// <rdar://problem/46904873> getMethodNoSuper_nolock is the hottest
// caller of search_method_list, inlining it turns
// getMethodNoSuper_nolock into a frame-less function and eliminates
// any store from this codepath.
method_t *m = search_method_list_inline(*mlists, sel);
if (m) return m;
}
return nil;
}
- 然后进入
search_method_list_inline
:
ALWAYS_INLINE static method_t *
search_method_list_inline(const method_list_t *mlist, SEL sel)
{
int methodListIsFixedUp = mlist->isFixedUp();
int methodListHasExpectedSize = mlist->entsize() == sizeof(method_t);
if (fastpath(methodListIsFixedUp && methodListHasExpectedSize)) {
return findMethodInSortedMethodList(sel, mlist);
} else {
// Linear search of unsorted method list
for (auto& meth : *mlist) {
if (meth.name == sel) return &meth;
}
}
#if DEBUG
// sanity-check negative results
if (mlist->isFixedUp()) {
for (auto& meth : *mlist) {
if (meth.name == sel) {
_objc_fatal("linear search worked when binary search did not");
}
}
}
#endif
return nil;
}
再进入二分查找的核心代码findMethodInSortedMethodList
中:
ALWAYS_INLINE static method_t *
findMethodInSortedMethodList(SEL key, const method_list_t *list)
{
ASSERT(list);
const method_t * const first = &list->first;
const method_t *base = first;
const method_t *probe;
uintptr_t keyValue = (uintptr_t)key; //key 等于 say666
uint32_t count;
//base相当于low,count是max,probe是middle,这就是二分
for (count = list->count; count != 0; count >>= 1) {
//从首地址+下标 --> 移动到中间位置(count >> 1 左移1位即 count/2 = 4)
probe = base + (count >> 1);
uintptr_t probeValue = (uintptr_t)probe->name;
//如果查找的key的keyvalue等于中间位置(probe)的probeValue,则直接返回中间位置
if (keyValue == probeValue) {
// -- while 平移 -- 排除分类重名方法
while (probe > first && keyValue == (uintptr_t)probe[-1].name) {
//排除分类重名方法(方法的存储是先存储类方法,在存储分类---按照先进后出的原则,分类方法最先出,而我们要取的类方法,所以需要先排除分类方法)
//如果是两个分类,就看谁先进行加载
probe--;
}
return (method_t *)probe;
}
//如果keyValue 大于 probeValue,就往probe即中间位置的右边查找
if (keyValue > probeValue) {
base = probe + 1;
count--;
}
}
return nil;
}
第二、cache_getImp
cache_getImp
方法是通过汇编_cache_getImp
实现,传入的$0
是 GETIMP
。源码如下:
STATIC_ENTRY _cache_getImp
GetClassFromIsa_p16 p0
CacheLookup GETIMP, _cache_getImp
LGetImpMiss:
mov p0, #0
ret
END_ENTRY _cache_getImp
如果父类缓存中找到了方法实现,则跳转至CacheHit
即命中,则直接返回imp
如果在父类缓存中,没有找到方法实现,则跳转至CheckMiss
或者 JumpMiss
,通过判断$0 跳转至LGetImpMiss
,直接返回nil
。
从前面探索isa中我们知道对象和类的继承链:
- 对象方法(即实例方法),即在类中查找,其慢速查找的父类链是:
类--父类--根类--nil
- 类方法,即在元类中查找,其慢速查找的父类链是:
元类--根元类--根类--nil
三、消息转发流程
如果在快速查找、慢速查找、方法解析流程中,均没有找到实现,则使用消息转发。lookUpImpOrForward
源码中定义了一个消息转发吗?
IMP lookUpImpOrForward(id inst, SEL sel, Class cls, int behavior)
{
const IMP forward_imp = (IMP)_objc_msgForward_impcache;
IMP imp = nil;
...
}
即_objc_msgForward_impcache
,我们查看它的源码:
STATIC_ENTRY __objc_msgForward_impcache
// No stret specialization.
b __objc_msgForward
END_ENTRY __objc_msgForward_impcache
ENTRY __objc_msgForward
adrp x17, __objc_forward_handler@PAGE
ldr p17, [x17, __objc_forward_handler@PAGEOFF]
TailCallFunctionPointer x17
END_ENTRY __objc_msgForward
_objc_msgForward_impcache
是汇编实现,会跳转至__objc_msgForward
,其核心是__objc_forward_handler
,全局搜索__objc_forward_handler
,搜索不到,去掉一个下划线,继续搜索
_objc_forward_handler
,有如下实现,本质是调用的objc_defaultForwardHandle
r方法:
__attribute__((noreturn, cold)) void
objc_defaultForwardHandler(id self, SEL sel)
{
_objc_fatal("%c[%s %s]: unrecognized selector sent to instance %p "
"(no message forward handler is installed)",
class_isMetaClass(object_getClass(self)) ? '+' : '-',
object_getClassName(self), sel_getName(sel), self);
}
void *_objc_forward_handler = (void*)objc_defaultForwardHandler;
噔噔,我们发现了什么?这个报错是不是我们常见的执行未实现方法的时候报的错啊。
觉得不错记得点赞哦!听说看完点赞的人逢考必过,逢奖必中。ღ( ´・ᴗ・` )比心