iOS之武功秘籍⑤:cache_t分析

2021-02-21  本文已影响0人  長茳

iOS之武功秘籍 文章汇总

写在前面

在上一篇文章中已经全面地介绍了类的结构,但是还剩下一个cache_t cache没有进行详细的介绍,本文就将从源码层面分析cache_t.

本节可能用到的秘籍Demo

一、初探cache_t

① cache_t结构

如下是在底层的结构

其中cache_t的结构如下

其中的_bucketsAndMaybeMask is a buckets_t pointer,是bucket_t类型的结构体指针.

从以上bucket_t的属性和方法中可以看出它应该与imp有联系——事实上bucket_t作为一个桶,里面是用来装imp方法实现以及它的key.
所以通过上面两个结构体源码可知,而我们cache中缓存的正好是sel-imp.
整体的结构如下图所示

在cache_t中查找sel-imp

cache_t中查找存储的sel-imp,有以下两种方式

准备工作

通过源码查找 一 LLDB调试

由上图可知,在没有执行方法调用时,此时的cache是没有缓存的,执行了一次方法调用,cache中就有了一个缓存,即调用一次方法就会缓存一次方法.

我们现在了解了如何获取cachesel-imp,如何验证打印的selimp就是我们调用的呢?可以通过machoView打开target的可执行文件,在方法列表中查看其imp的值是否是一致的,如下所示,发现是一致的,所以打印的这个sel-imp就是TCJPerson的实例方法

第一个调用方法的存储获取很简单,直接通过_buckets的首地址调用对应的方法即可,那么获取第二个呢?在之前的iOS之武功秘籍④:类结构分析文章中,曾提及过一个概念 指针偏移,所以我们这里可以通过_buckets属性的首地址偏移,即 p *($9+1)即可获取第二个方法的sel 和imp
如果有多个方法需要获取,以此类推,例如p *($9+i)

脱离源码通过项目查找

脱离源码环境,就是将所需的源码的部分拷贝至项目中,其完整代码如下

这里有个问题需要注意,在源码中,objc_classISA属性是继承自objc_object的,但在我们将其拷贝过来时,去掉了objc_class的继承关系,需要将这个属性明确,否则打印的结果是有问题,如下图所示

加上ISA属性后,增加两个方法的调用,其正确的打印结果应该是这样的

在增加两个方法的调用,即解开sayMastersayNA的注释,其打印结果如下

针对上面的打印结果,有以下几点疑问

二、深入cache_t

找到切入点

该函数的具体实现为

insert方法分析

insert方法中,其源码实现如下

主要分为以下几部分

【第一步】计算出当前的缓存占用量

根据occupied的值计算出当前的缓存占用量,当属性未赋值及无方法调用时,此时的occupied()0,而newOccupied1,如下所示

关于缓存占用量的计算,有以下几点说明:

【第二步】根据缓存占用量判断执行的操作

reallocate方法:开辟空间

该方法,在第一次创建以及两倍扩容时,都会使用,其源码实现如图所示

主要有以下几步

该方法的实现主要有以下几步:

【第三步】针对需要存储的bucket进行内部imp和sel赋值

这部分主要是根据cache_hash方法,即哈希算法 ,计算sel-imp存储的哈希下标,分为以下三种情况

其中涉及的两种哈希算法,其源码如下

三、cache_t疑问点

① _mask是什么?

_mask是指掩码数据,用于在哈希算法或者哈希冲突算法中计算哈希下标,其中mask等于capacity - 1

② _occupied 是什么?

_occupied表示哈希表中 sel-imp 的占用大小 (即可以理解为分配的内存中已经存储了sel-imp的的个数)

③ 为什么随着方法调用的增多,其打印的occupied 和 mask会变化?

因为在cache初始化时,分配的空间是4个,随着方法调用的增多,当存储的sel-imp个数,即newOccupied + CACHE_END_MARKER(等于1)的和 超过 总容量的3/4,例如有4个时,当occupied等于2时,就需要对cache的内存进行两倍扩容.

④ 为什么是在 3/4 时进行扩容

在哈希这种数据结构里面,有一个概念用来表示空位的多少叫做装载因子——装载因子越大,说明空闲位置越少,冲突越多,散列表的性能会下降

负载因子是3/4的时候,空间利用率比较高,而且避免了相当多的Hash冲突,提升了空间效率

具体可以阅读HashMap的负载因子为什么默认是0.75?

④ bucket数据为什么会有丢失的情况?

原因是在扩容时,是将原有的内存全部清除了,再重新申请了内存导致的

⑤ 方法缓存是否有序?

因为sel-imp的存储是通过哈希算法计算下标的,其计算的下标有可能已经存储了sel,所以又需要通过哈希冲突算法重新计算哈希下标,所以导致下标是随机的,并不是固定的

⑥ bucket与mask、capacity、sel、imp的关系

缓存的主要目的就是通过一系列策略让编译器更快的执行消息发送的逻辑

写在后面

和谐学习,不急不躁.我还是我,颜色不一样的烟火.

上一篇 下一篇

猜你喜欢

热点阅读