selector底层原理

iOS dyld流程分析

2021-02-14  本文已影响0人  辉辉岁月

本文的目的主要是分析dyld的加载流程,了解在main函数之前,底层还做了什么

引子

为什么是这么一个顺序?按照常规的思维理解,main不是入口函数吗?为什么不是main最先执行?

下面根据这个问题,我们来探索在走到main之前,到底还做了什么。

编译过程&库

在分析app启动之前,我们需要先了解iOS app的编译过程以及动态库静态库

编译过程

其中编译过程如下图所示,主要分为以下几步:

静态库 和 动态库

静态库和动态库的图示如图所示

静态库和动态库图示

dyld加载流程分析

根据dyld源码,以及libobjclibSystemlibdispatch源码协同分析

什么是dyld?

dyld(the dynamic link editor)是苹果的动态链接器,是苹果操作系统的重要组成部分,在app被编译打包成可执行文件格式的Mach-O文件后,交由dyld负责连接,加载程序

所以 App的启动流程图如下

app启动的起始点

也可以通过xcode左侧的堆栈信息来找到入口

dyld::_main函数源码分析

源码中搜索dyldbootstrap找到命名作用空间,再在这个文件中查找start方法,其核心是返回值的调用了dyldmain函数,其中macho_headerMach-O的头部,而dyld加载的文件就是Mach-O类型的,即Mach-O类型是可执行文件类型,由四部分组成:Mach-O头部、Load Command、section、Other Data,可以通过MachOView查看可执行文件信息

进入dyld::_main的源码实现,特别长,大约600多行,如果对dyld加载流程不太了解的童鞋,可以根据_main函数的返回值进行反推,这里就多作说明。在_main函数中主要做了一下几件事情:

第二步 第三步 第四步 第五步 第六步 第七步 image

【第九步:寻找主程序入口main函数】:从Load Command读取LC_MAIN入口,如果没有,就读取LC_UNIXTHREAD,这样就来到了日常开发中熟悉的main函数了

第九步

第三步:主程序初始化

进入instantiateFromLoadedImage源码,其中创建一个ImageLoader实例对象,通过instantiateMainExecutable方法创建

进入instantiateMainExecutable源码,其作用是为主可执行文件创建映像,返回一个ImageLoader类型的image对象,即主程序。其中sniffLoadCommands函数时获取Mach-O类型文件Load Command的相关信息,并对其进行各种校验

第八步:执行初始化方法

在这里,需要分成两部分探索,一部分是notifySingle函数,一部分是doInitialization函数,首先探索notifySingle函数

notifySingle 函数

全局搜索sNotifyObjCInit,发现没有找到实现,有赋值操作

搜索registerObjCNotifiers在哪里调用了,发现在_dyld_objc_notify_register进行了调用

注意:_dyld_objc_notify_register的函数需要在libobjc源码中搜索

objc4-781源码中搜索_dyld_objc_notify_register,发现在_objc_init源码中调用了该方法,并传入了参数,所以sNotifyObjCInit赋值的就是objc中的load_images,而load_images会调用所有的+load方法。所以综上所述,notifySingle是一个回调函数

load函数加载

下面我们进入load_images的源码看看其实现,以此来证明load_images中调用了所有的load函数

进入call_load_methods源码实现,可以发现其核心是通过do-while循环调用+load方法

进入call_class_loads源码实现,了解到这里调用的load方法证实我们前文提及的类的load方法

所以,load_images调用了所有的load函数,以上的源码分析过程正好对应堆栈的打印信息

【总结】load的源码链为:_dyld_start --> dyldbootstrap::start --> dyld::_main --> dyld::initializeMainExecutable --> ImageLoader::runInitializers --> ImageLoader::processInitializers --> ImageLoader::recursiveInitialization --> dyld::notifySingle(是一个回调处理) --> sNotifyObjCInit --> load_images(libobjc.A.dylib)
那么问题又来了,_objc_init是什么时候调用的呢?请接着往下看

走到objc_objc_init函数,发现走不通了,我们回退到recursiveInitialization递归函数的源码实现,发现我们忽略了一个函数doInitialization

进入doInitialization函数的源码实现

这里也需要分成两部分,一部分是doImageInit函数,一部分是doModInitFunctions函数

进入doModInitFunctions源码实现,这个方法中加载了所有C++文件

可以通过测试程序的堆栈信息来验证,在C++方法处加一个断点

走到这里,还是没有找到_objc_init的调用?怎么办呢?放弃吗?当然不行,我们还可以通过_objc_init加一个符号断点来查看调用_objc_init前的堆栈信息,

libsystem中查找libSystem_initializer,查看其中的实现

根据前面的堆栈信息,我们发现走的是libSystem_initializer中会调用libdispatch_init函数,而这个函数的源码是在libdispatch开源库中的,在libdispatch中搜索libdispatch_init

进入_os_object_init源码实现,其源码实现调用了_objc_init函数

结合上面的分析,从初始化_objc_init注册的_dyld_objc_notify_register的参数2,即load_images,到sNotifySingle --> sNotifyObjCInie=参数2sNotifyObjcInit()调用,形成了一个闭环

所以可以简单的理解为sNotifySingle这里是添加通知即addObserver_objc_init中调用_dyld_objc_notify_register相当于发送通知,即push,而sNotifyObjcInit相当于通知的处理函数,即selector

【总结】:_objc_init的源码链:_dyld_start --> dyldbootstrap::start --> dyld::_main --> dyld::initializeMainExecutable --> ImageLoader::runInitializers --> ImageLoader::processInitializers --> ImageLoader::recursiveInitialization --> doInitialization -->libSystem_initializer(li#### 第九步:寻找主入口函数

第九步:寻找主入口函数

继续执行,来到kcFunc的C++函数

点击stepover,继续往下,跑完了整个流程,会回到_dyld_start,然后调用main()函数,通过汇编完成main的参数赋值等操作

dyld汇编源码实现

注意:main是写定的函数,写入内存,读取到dyld,如果修改了main函数的名称,会报错

所以,综上所述,最终dyld加载流程,如下图所示,图中也诠释了前文中的问题:为什么是load-->Cxx-->main的调用顺序

上一篇 下一篇

猜你喜欢

热点阅读