alloc & init & new 源码分析
ios底层原理 02:alloc & init & new 源码分析
在分析源码之前,先看看这三个变量的内存地址和指针的区别:
截屏2020-11-12 07.12.40.png
分别输出3个对象的内容、内存地址、内存指针
下图是打印结果:
结论:通过上图可以看出,3个对象指向的是用一片内存空间,所以其内容
和内存地址
是相同
的,但是对象的指针是不同的。
%p->&p1:是对象指针的地址
%p->%p1:是对象指针指向的内存地址
这就是本文即将探索的内容,alloc做了什么,init做了什么?
准备工作
- 下载 objc4-781 源码
- 编译源码,可参考大神的文章iOS-底层原理 03:objc4-781 源码编译 & 调试
源码探索
alloc + init整体探索流程如下:
2251862-5cd87fac98b952fc.png
【第一步】首先根据main函数中的LGPerson的alloc方法进入alloc的源码实现(即源码分析开始)
//alloc源码分析-第一步
+ (id)alloc {
return _objc_rootAlloc(self);
}
- 【第二步】跳转至_objc_rootAlloc的源码实现
//alloc源码分析-第二步
id
_objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
- 【第三步】跳转至callAlloc的源码实现
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)// alloc 源码 第三步
{
#if __OBJC2__ //有可用的编译器优化
/*
参考链接:https://www.jianshu.com/p/536824702ab6
*/
// checkNil 为false,!cls 也为false ,所以slowpath 为 false,假值判断不会走到if里面,即不会返回nil
if (slowpath(checkNil && !cls)) return nil;
//判断一个类是否有自定义的 +allocWithZone 实现,没有则走到if里面的实现
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available. // 没有可用的编译器优化
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
如上所示,在calloc方法中,当我们无法确定实现走到哪步时,可以通过断点调试,判断执行走哪部分逻辑。这里是执行到_objc_rootAllocWithZone
slowpath & fastpath
其中关于slowpath
和fastpath
这里需要简要说明下,这两个都是objc源码中定义的宏,其定义如下
//x很可能为真, fastpath 可以简称为 真值判断
#define fastpath(x) (__builtin_expect(bool(x), 1))
//x很可能为假,slowpath 可以简称为 假值判断
#define slowpath(x) (__builtin_expect(bool(x), 0))
其中的__builtin_expect
指令是由gcc
引入的,
1、目的:编译器可以对代码进行优化,以减少指令跳转带来的性能下降。即性能优化
2、作用:允许程序员将最有可能执行的分支告诉编译器。
3、指令的写法为:__builtin_expect(EXP, N)
。表示EXP==N
的概率很大。
4、fastpath
定义中__builtin_expect((x),1)
表示 x
的值为真的可能性更大;即 执行if 里面语句的机会更大
5、slowpath
定义中的__builtin_expect((x),0)
表示x
的值为假的可能性更大。即执行 else 里面语句的机会更大
6、在日常的开发中,也可以通过设置来优化编译器,达到性能优化的目的,设置的路径为:Build Setting --> Optimization Level --> Debug --> 将None 改为 fastest 或者 smallest
cls->ISA()->hasCustomAWZ()
其中fastpath
中的 cls->ISA()->hasCustomAWZ()
表示判断一个类是否有自定义的 +allocWithZone
实现,这里通过断点调试,是没有自定义的实现,所以会执行到 if 里面的代码,即走到_objc_rootAllocWithZone
- 【第四步】跳转至
_objc_rootAllocWithZone
的源码实现
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)// alloc 源码 第四步
{
// allocWithZone under __OBJC2__ ignores the zone parameter
//zone 参数不再使用 类创建实例内存空间
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
- 【第五步】跳转至_class_createInstanceFromZone的源码实现,这部分是alloc源码的核心操作,由下面的流程图及源码可知,该方法的实现主要分为三部分
- cls->
instanceSize
:计算需要开辟的内存空间大小 -
calloc
:申请内存,返回地址指针 - obj->
initInstanceIsa
:将 类 与 isa 关联
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)// alloc 源码 第五步
{
ASSERT(cls->isRealized()); //检查是否已经实现
// Read class's info bits all at once for performance
//一次性读取类的位信息以提高性能
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
//计算需要开辟的内存大小,传入的extraBytes 为 0
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
//申请内存
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
//将 cls类 与 obj指针(即isa) 关联
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
根据源码分析,得出其实现流程图如下所示:
2251862-abc9ce2f6305dce1.png
alloc 核心操作
核心操作都位于calloc
方法中
**cls->instanceSize:计算所需内存大小
**
计算需要开辟内存的大小的执行流程如下所示:
2251862-2542c276194d0607.png
- 1、跳转至
instanceSize
的源码实现
size_t instanceSize(size_t extraBytes) const {
//编译器快速计算内存大小
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
// 计算类中所有属性的大小 + 额外的字节数0
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
//如果size 小于 16,最小取16
if (size < 16) size = 16;
return size;
}
通过断点调试,会执行到cache.fastInstanceSize方法,快速计算内存大小
- 2、跳转至
fastInstanceSize
的源码实现,通过断点调试,会执行到align16
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
//Gcc的内建函数 __builtin_constant_p 用于判断一个值是否为编译时常数,如果参数EXP 的值是常数,函数返回 1,否则返回 0
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
//删除由setFastInstanceSize添加的FAST_CACHE_ALLOC_DELTA16 8个字节
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
- 3、跳转至align16的源码实现,这个方法是16字节对齐算法
//16字节对齐算法
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
内存字节对齐原则
-
在解释为什么需要
16
字节对齐之前,首先需要了解内存字节对齐的原则,主要有以下三点 -
数据成员对齐规则:
struct
或者union
的数据成员,第一个数据成员放在offset
为0
的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小(只要该成员有子成员,比如数据、结构体等)的整数倍开始(例如int在32位机中是4字节,则要从4的整数倍地址开始存储) -
数据成员为结构体:如果一个结构里有某些结构体成员,则结构体成员要从其内部最大元素大小的整数倍地址开始存储(例如:struct a里面存有
struct b
,b
里面有char
、int
、double
等元素,则b
应该从8
的整数倍开始存储) -
结构体的整体对齐规则:结构体的总大小,即sizeof的结果,必须是其内部做大成员的整数倍,不足的要补齐
为什么需要16字节对齐
需要字节对齐的原因,有以下几点:
- 通常内存是由一个个字节组成的,cpu在存取数据时,并不是以字节为单位存储,而是以块为单位存取,块的大小为内存存取力度。频繁存取字节未对齐的数据,会极大降低cpu的性能,所以可以通过减少存取次数来降低cpu的开销
- 16字节对齐,是由于在一个对象中,第一个属性isa占8字节,当然一个对象肯定还有其他属性,当无属性时,会预留8字节,即16字节对齐,如果不预留,相当于这个对象的isa和其他对象的isa紧挨着,容易造成访问混乱
- 16字节对齐后,可以加快CPU读取速度,同时使访问更安全,不会产生访问混乱的情况
字节对齐-总结
-
在字节对齐算法中,对齐的主要是对象,而对象的本质则是一个 struct objc_object的结构体,
-
结构体在内存中是连续存放的,所以可以利用这点对结构体进行强转。
-
苹果早期是8字节对齐,现在是16字节对齐
下面以align(8) 为例,图解16字节对齐算法的计算过程,如下所示
2251862-f6b06f1aa524c90d.png -
首先将原始的内存
8
与size_t(15)
相加,得到8 + 15 = 23
-
将
size_t(15)
即15
进行~(取反)
操作,~(取反)
的规则是:1变为0,0变为1
* 最后将23
与15
的取反结果 进行&(与)
操作,&(与)
的规则是:都是1为1,反之为0
,最后的结果为16
,即内存的大小是以16的倍数增加的
calloc:申请内存,返回地址指针
通过instanceSize
计算的内存大小,向内存中申请 大小 为 size
的内存,并赋值给obj
,因此 obj
是指向内存地址的指针
obj = (id)calloc(1, size);
这里我们可以通过断点来印证上述的说法,在未执行calloc
时,po obj
为nil
,执行后,再po obj
发现,返回了一个16
进制的地址
在平常的开发中,一般一个对象的打印的格式都是类似于这样的<LGPerson: 0x01111111f>
(是一个指针)。为什么这里不是呢?
- 主要是因为objc 地址 还没有与传入 的 cls进行关联,
- 同时印证了 alloc的根本作用就是 开辟内存
obj->initInstanceIsa:类与isa关联
经过calloc可知,内存已经申请好了,类也已经传入进来了,接下来就需要将 类与 地址指针 即isa指针进行关联,其关联的流程图如下所示
2251862-24fec93b412fa841.png
主要过程就是初始化一个isa
指针,并将isa
指针指向申请的内存地址,在将指针与cls
类进行 关联
同样也可以通过断点调试来印证上面的说法,在执行完initInstanceIsa
后,在通过po obj
可以得出一个对象指针
总结
通过对alloc
源码的分析,可以得知alloc
的主要目的就是开辟内存,而且开辟的内存需要使用16字节对齐算法,现在开辟的内存的大小基本上都是16的整数倍
开辟内存的核心步骤有3步:计算 -- 申请 -- 关联
init 源码探索
alloc
源码探索完了,接下来探索init
源码,通过源码可知,inti
的源码实现有以下两种
类方法 init
+ (id)init {
return (id)self;
}
这里的init
是一个构造方法 ,是通过工厂设计(工厂方法模式)
,主要是用于给用户提供构造方法入口。这里能使用id
强转的原因,主要还是因为 内存字节对齐后,可以使用类型强转为你所需的类型
实例方法 init
- 通过以下代码进行探索实例方法 init
LGPerson *objc = [[LGPerson alloc] init];
- 通过main中的init跳转至init的源码实现
- (id)init {
return _objc_rootInit(self);
}
- 跳转至_objc_rootInit的源码实现
id
_objc_rootInit(id obj)
{
// In practice, it will be hard to rely on this function.
// Many classes do not properly chain -init calls.
return obj;
}
有上述代码可以,返回的是传入的self
本身。
new 源码探索
一般在开发中,初始化除了init
,还可以使用new
,两者本质上并没有什么区别,以下是objc
中new
的源码实现,通过源码可以得知,new
函数中直接调用了callAlloc
函数(即alloc中分析的函数),且调用了init
函数,所以可以得出new
其实就等价于 [alloc init]
的结论
但是一般开发中并不建议使用new
,主要是因为有时会重写init
方法做一些自定义的操作,例如 initWithXXX
,会在这个方法中调用[super init]
,用new初始化可能会无法走到自定义的initWithXXX
部分。
例如,在ZCPerson
中有两个初始化方法,一个是重写的父类的init,一个是自定义的initWithXXX
方法,如下图所示
- 使用
alloc + init
初始化时,打印的情况如下
截屏2020-11-12 08.42.49.png
- 使用
new
初始化时,打印的情况如下
截屏2020-11-12 08.44.00.png
总结
- 如果子类没有重写父类的
init
,new
会调用父类的init
方法 - 如果子类重写了父类的
init
,new
会调用子类重写的init
方法 - 如果使用 a
lloc +
自定义的init
,可以帮助我们自定义初始化操作,例如传入一些子类所需参数等,最终也会走到父类的init
,相比new
而言,扩展性更好,更灵活。
补充
【问题】为什么无法断点到obj->initInstanceIsa(cls, hasCxxDtor);?
主要是因为断点断住的不是 自定义类的流程,而是系统级别的