iOS得层探索 --- 类的结构探索(下)

2021-06-25  本文已影响0人  Jax_YD
image

iOS底层探索 --- 类的结构探索(上)中我们分析了cache_t的大小。今天我们来探索一下cache_t里面到底存放了些什么。


1、cache_t源码查看

1.1 源码简单分析

首先我们要从源码中寻找,看看cache_t到底长什么样子。

在这里首先要跟打下确认几点内容:

image

我们在阅读cache_t源码的时候,里面有很多内容,一时间也看不出来到底有什么用。同样的,探索的过程终究是比较枯燥的。在漫长的探索过程中,发现了这个:bucket_t

image

为什么是bucket_t呢?因为我在bucket_t的定义中发现了我想要的东西:

image

正常的缓存,一定要存储方法的。既然在bucket_t里面找到了impsel;那么说明这条思路是对的,我们顺着这条思路继续探索。


1.2 LLDB打印缓存方法

既然我们大致滤清了cache_t中方法的存储形式,那么我们就通过控制台去打印一下。

我们沿用之前的代码:


image

我们的初次LLDB运行到下面阶段的时候,遇到了问题。究竟cache_t里的缓存方法存在哪里呢?(注意:这里指针平移16字节

image

上图中$3的结构,对应的就是源码中的数据结构:

image

这里我猜测应该是_originalPreoptCache,存储着缓存方法。但是在继续探索的时候,发现并没有缓存方法。过程如下:

image

此时应该换一个思路,看一看cache_t中有没有一些对应的方法,于是发现了buckets()

image

这个时候,我们执行以下buckets()

image

到这里我们终于找到了selimp。但是会发现,里面并没有数据,这是因为我们并没有调用方法,所以没有缓存数据。

既然没有缓存数据,那么我们就执行以下方法func,创造缓存数据。但是当我们执行了方法func之后,发现还是没有数据,不过maybeMask产生了变化:

image

这里主要是因为缓存方法的存储是根据哈希值来计算下标的。我这边从新执行了,然后得到了需要的数据。(哈希值的内容,我们文章结尾再探讨)

image

此时我们可以通过sel()imp(UNUSED_WITHOUT_PTRAUTH bucket_t *base, Class cls)这两函数来获得具体的selimp

image

2 非源码查看缓存

正常情况下,我们从官网获取的源码是不能够编译的。有些情况下,我们去配置源码的时候,也不一定能够成功让其编译通过。(我这边使用的是命令行工程)

这个时候我们可以采取另外一种方式,让我们可以继续进行源码的探索。那就是\color{red}{将源码,部分拷贝到我们自己的项目中(注意,不是全部拷贝)},举个例子如下:

struct jax_objc_class {
    Class isa;
    Class superclass;
    struct jax_cache_t cache;
    struct jax_class_data_bit_t bits;
};
typedef uint32_t mask_t;  // x86_64 & arm64 asm are less efficient with 16-bits

struct jax_bucket_t {
    SEL _sel;
    IMP _imp;
};

struct jax_cache_t {
    struct jax_bucket_t *_bukets;  // 8
    mask_t _maybeMask;             // 4
    uint16_t _flags;               // 2
    uint16_t _occupied;            // 2
};

struct jax_class_data_bit_t {
    uintptr_t bits;
};

struct jax_objc_class {
    Class isa;
    Class superclass;
    struct jax_cache_t cache;
    struct jax_class_data_bit_t bits;
};
image image image

3 cache_t 底层原理探索

在上面我们调用多个对象方法的时候,我们的循环打印发生了异常。
并且还发现_occupied_maybeMask也发生了变化。

这究竟是为什么呢?我们还是需要从源码中寻找答案。

3.1 occupied

首先关于occupied的变化,我们发现了这个函数:void incrementOccupied();

image
image

也就是说incrementOccupied()会让_occupied进行自加操作。
那么我们就要知道它在哪里别调用。

通过搜索发现,它在cache_tinsert方法里面被调用:

image

3.2 insert

其实在看到insert方法的时候,我们就应该有所感觉了。对应缓存,肯定是要有插入方法的。cache_tinsert正是其插入方法。

image

接下来我们分析以下insert源码:

image

上面这部分内容,描述了缓存空间的开辟,其中有一个方法reallocate值得我们去研究一下。

因为,初始化扩容的时候,都用到了这个方法,但是,传入的参数却不相同。

可以看到,开启缓存空间的方法很简单,首先是根据传入的值开辟新的缓存空间;然后判断是否有旧的缓存,如果有就释放旧的缓存

既然缓存空间已经开辟完毕了,那接下来就应该是selimp相关的操作了。

image

这个是计算哈希值的函数:

// Class points to cache. SEL is key. Cache buckets store SEL+IMP.
// Caches are never built in the dyld shared cache.

static inline mask_t cache_hash(SEL sel, mask_t mask) 
{
    uintptr_t value = (uintptr_t)sel;
#if CONFIG_USE_PREOPT_CACHES
    value ^= value >> 7;
#endif
    return (mask_t)(value & mask);
}

这个是计算哈希冲突的函数:

#if CACHE_END_MARKER
static inline mask_t cache_next(mask_t i, mask_t mask) {
    return (i+1) & mask;
}
#elif __arm64__
static inline mask_t cache_next(mask_t i, mask_t mask) {
    return i ? i-1 : mask;
}
#else
#error unexpected configuration
#endif

3.3 上面问题解答

我们在上面,调用多个对象方法的时候,循环打印出错了。接着我们探究了源码中的insert方法。现在我们可以对这个现象做出解释了。

上一篇下一篇

猜你喜欢

热点阅读