iOS alloc&init原理探索
首先
- 了解alloc和init的原理之前,我们先看看以下几行代码,以下分別输出对象的内容,对象的地址,对象的指针的地址,打印结果如下:
LGPerson *p1 = [LGPerson alloc];
LGPerson *p2 = [p1 init];
LGPerson *p3 = [p1 init];
LGNSLog(@"%@ - %p - %p",p1,p1,&p1);
LGNSLog(@"%@ - %p - %p",p2,p2,&p2);
LGNSLog(@"%@ - %p - %p",p3,p3,&p3);
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2068
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2060
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2058
为什么
- 前两个%@→p1,%p→p1地址一样,而%p→&p1又不一样呢?
原因
- 程式在运行时先进行类加载,即在代码段中开辟空间,内部存放声明的属性及方法。
- 在使用alloc时会在堆区开辟一个空间,内部有isa指针,这个指针指向所指的类对象。
-
而栈区的指针保存的是对象的地址。
对象在内存中的存储
注:想知道类在代码段中的地址可以通过
Class cls1 = objc_getClass(p1);
NSLog(@"%p" , cls1);
0x1022147c8
- 由上图可以初步了解对象的内容,对象的地址,对象的指针的地址之间的关系
那么到底alloc&init的原理是什么呢?
准备工作
- 请参考底层探索分析的三种方法
三种下断点方式 - 下载源码
Source Browser - 编译源码,请参考大神
编译源码
alloc源码探索
流程
源碼搭配斷點調適查看 alloc:
+ (id)alloc {
return _objc_rootAlloc(self);
}
进入_objc_rootAlloc
id _objc_rootAlloc(Class cls) {
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
进入callAlloc
- 到这里会不确定进入哪个流程,不过我们可以通过源码搭配断点调试,判断逻辑走到哪个流程,來到了
_objc_rootAllocWithZone
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false) {
#if __OBJC2__
// checkNil 为false,!cls 也为false ,不会返回nil
if (slowpath(checkNil && !cls)) return nil;
// 是否有自定义的 +allocWithZone 实现
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
怎么知道是走到_objc_rootAllocWithZone
的呢?
-
首先我们通过符号断点添加
_objc_rootAlloc
,callAlloc
,_objc_rootAllocWithZone
-
因为直接运行起來可能断着不是我們想要的流程,所以先disable停用一下,接著运行起來
-
接下來想要看看alloc后面到底调用了什么吧?
-
這時再启用刚刚添加的符号断点,确保我们断着的断点是我們想要看的流程
-
过掉断点來到
_objc_rootAlloc
-
再过掉断点來到
_objc_rootAllocWithZone
-
可以发现为什么直接从
_objc_rootAlloc
直接跳到了_objc_rootAllocWithZone
-
因为编译器优化了,可以看到源碼如下。
-
编译器优化-fastpath&slowpath
其中的__builtin_expect
指令是由gcc
引入的,- 目的:编译器可以对代码进行优化,以减少指令跳转带来的性能下降,即性能优化。
- 作用:允许程序员将最有可能执行的分支告诉编译器。
- 指令的写法为:
__builtin_expect(EXP, N)
。表示EXP==N的概率很大。 - fastpath定义中
__builtin_expect((x),1)
表示x 的值为真的可能性更大;即执行if里面语句的机会更大。 - slowpath定义中的
__builtin_expect((x),0)
表示x 的值为假的可能性更大。即執行else里面语句的机会更大。 - 在日常的开发中,也可以通過设置来优化编译器,达到性能优化的目的,设置的路径为:Build Setting--> Optimization Level--> Debug-->将None改为fastest或者smallest。
//x很可能为1,程式走if括弧內的實現
#define fastpath(x) (__builtin_expect(bool(x), 1))
//x很可能为0,程式走else括弧內的實現
#define slowpath(x) (__builtin_expect(bool(x), 0))
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)// alloc 源码 第三步
{
#if __OBJC2__ //有可用的编译器优化
/*
参考链接:(https://www.jianshu.com/p/2684613a300f)
*/
// checkNil 为false,!cls 也为false ,所以slowpath 为 false,假值判断不会走到if里面,即不会返回nil
//fastpath(x)表示x很可能不為0,希望編譯器進行優化;slowpath(x)表示x很可能為0,希望編譯器進行優化-這裡表示cls大概率是有值的,編譯器可以不用每次都讀取return nil指令
if (slowpath(checkNil && !cls)) return nil;
//判断一个类是否有自定义的 +allocWithZone 实现,没有则走到if里面的实现
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available. // 没有可用的编译器优化
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
跳转至_objc_rootAllocWithZone 的源码实现
跳转至_class_createInstanceFromZone 的源码实现,這部分是alloc源碼的核心操作,该方法的实现主要分为三个部分
- cls→instanceSize:计算需要开辟的内存空间大小
- calloc:申请内存,返回地址指針
- obj→initInstanceIsa:将类与isa关联
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)// alloc 源码 第五步
{
ASSERT(cls->isRealized()); //检查是否已经实现
// Read class's info bits all at once for performance
//一次性读取类的位信息以提高性能
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
//计算需要开辟的内存大小,传入的extraBytes 为 0
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
//申请内存
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
//将 cls类 与 obj指针(即isa) 关联
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
alloc核心操作
- 核心操作都位于calloc方法中
cls->instanceSize:计算所需内存大小
流程
跳转至instanceSize 的源码实现
size_t instanceSize(size_t extraBytes) const {
//编译器快速计算内存大小
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
// 计算类中所有属性的大小 + 额外的字节数0
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
//如果size 小于 16,最小取16
if (size < 16) size = 16;
return size;
}
- 经过断点调试,执行cache.hasFastInstanceSize方法,快速计算内存大小。
跳转至
fastInstanceSize
的源码实现,通过断点调试,來到align16
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
//Gcc的内建函数 __builtin_constant_p 用于判断一个值是否为编译时常数,如果参数EXP 的值是常数,函数返回 1,否则返回 0
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
//删除由setFastInstanceSize添加的FAST_CACHE_ALLOC_DELTA16 8个字节
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
跳转到align16的源码实现,以下是16字节对齐算法
//16字節對齊算法
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
想知道什么是16字节对齐算法,请先参考
- 看完了内存对齐原理,了解为什么要内存对齐后,我們來看看這個16字节对齐算法,为什么是这样写呢?又代表了什么意思?
为什么要16字节对齐
- cpu存取数据时,以区块來做范围的读取,如果读取到的资料是沒有经过对齐的,资料读取上就要花更多的次数读取完成,意味着增加了cpu读取时的负担。
- 由于一个对象的本质为结构体,且第一個属性为isa指针(占8个字节),在沒有其他属性的情况下,会预留8个字节,其目的是为了数据读取的安全性,如果不预留,有可能造成资料读取混乱。
- 苹果早期以8字节对齐,現在以16字节对齐。
16字节对齐算法
-
在解决为什么16字节是这样写之前,我們先來看看C++的位元运算
- 在这里出现了AND(&)和NOT(~)两个位元运算子,AND就是两者数据1时输出1,其余为0,NOT就是将1变0,0变1。
- 有了以上知识后,我們來看看
//16字節對齊算法
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
calloc:申請內存,返回地址指針
- 通過instanceSize计算的内存大小,向內存中申請大小为size的內存,并赋值给obj,因此obj是指向內存地址的指针
obj = (id)calloc(1, size);
- 这里我们可以通过断点來印证上述的說法,在未执行calloc时,
po ob
j为nil,执行后,再po obj
,返回了一個16进制的地址 - 然而在平常的开发中,一般一個對象的打印的格式都是类似于这样的<LGPerson: 0x01111111f>(是一個指针)。为什么这里不是呢?
- 主要是因为iobjc 地址还没有与传入的cls进行关联
- 同时印证了alloc的根本作用就是开辟内存
obj->initInstanceIsa:类与isa关联
8 经过calloc可知,內存已经申请好了,类也已经传入进来了,接下來就需要将类与地址指针即isa指针进行关联,其关联的流程圖如下所示
类与isa关联
initInstanceIsa流程
- 主要过程就是初始化一個isa指針,并将isa指針指向申请的内存地址,在将指针与cls类进行关联
同样也可以通過断点调试來印证上面的說法,在執行完initInstanceIsa后,在通过po obj可以得出一個对象指针
总结
通過对alloc源码的分析,可以得知alloc的主要目的就是开辟内存,而且开辟的内存需要使用16字节对齐算法,现在开辟的内存的大小基本上都是16的整數倍
开辟内存的核心步骤有3步:计算 -- 申请 -- 关联
init源码探索
- alloc源码探索完了,接下來探索init源码,通過源码可知,init的源码实现有以下两种
类方法init
+ (id)init {
return (id)self;
}
- 這裡的init是一個构造方法,是通過工厂设计(工厂方法模式),主要是用与給用户提供构造方法入口。這里能使用id强转的原因,主要还是因为内存字节对齐后,可以使用类型强转为你所需的类型
实例方法init
通過以下代码进行探索实例方法init
LGPerson *objc = [[LGPerson alloc] init];
通過main中的init跳转至init的源码实现
- (id)init {
return _objc_rootInit(self);
}
跳转至_objc_rootInit的源码实现
id
_objc_rootInit(id obj)
{
// In practice, it will be hard to rely on this function.
// Many classes do not properly chain -init calls.
return obj;
}
有上述代码可以,返回的是传入的self本身。
new 源碼探索
一般在开发中,初始化除了init,还可以使用new,两者本质上并沒有什么区別,以下是objc中new的源码实现,通過源码可以得知,new函數中直接调用了callAlloc函數(即alloc中分析的函數),且调用了init函數,所以可以得出new 其实就等价于 [alloc init]的结论