六、类原理之cache

2021-04-07  本文已影响0人  Mlqq

我们先来回顾一下objc_class的几个主要的结构,如图:


image.png

主要是有4个变量:ISAsuperclasscachebits,其中isabits已经分两篇介绍过了,superclass这个比较简单我们就不介绍了,这篇就介绍一下cache

1、cache内存结构

cache的内存结构在之前讲cache的大小的时候已经介绍过一次,这里再展示一下:

image.png

1、_bucketsAndMaybeMaskuintptr_t类型
2、联合体:结构体里面有3个成员变量:mask_t类型的_maybeMask_flags_occupied都是uint16_t类型的,他们的作用在后面会介绍

结构体cache_t提供了一个获取buckets的方法,返回的是结构体bucket_t的指针:

image.png

再来看看bucket_t的源码:

image.png

成员变量是两个:_imp_sel,有一个获取sel的方法sel()以及获取imp的方法(图中未展示,读者可以参考源码)

2、获取cache

有了获取bits的基础,获取cache就简单多了,获取bits时,我们是从类的起始地址平移32位,从objc_class的结构可以看到,获取cache时只需平移16位就可以了,如图:

image.png

我们调一个方法之后,再来获取一次看看有没有什么变化:

image.png

这个_occupied发生了变化,那么他是不是有我们调用的cacheTest这个方法导致的呢?
调一下buckets()方法取到里面的内容:

image.png

这样我们就取到了buckets存的sel,那么怎么获取imp呢,上面已经提过bucket_t提供了获取imp的方法:

image.png

按着这个方式我们可以获取到cacheTestimp

image.png

3、cache_t底层原理

上面只是缓存了一个方法,如果条用多个方法会不会都缓存呢?我们先在MlqqObject添加一个方法如下:

image.png

然后再main函数里面按顺序调用:

image.png

我们每调用一个方法打印一下_occupied的值,看看会不会一直增加:
调1个方法_occupied的值为1

image.png

调2个方法_occupied的值为2

image.png

调3个方法_occupied的值又为1

image.png

调4个方法_occupied的值又为2

image.png

调5个方法_occupied的值为3

image.png

调6个方法_occupied的值为4

image.png

调7个方法_occupied的值为5

image.png

调8个方法_occupied的值又为1

image.png

从上面结果可以看到并不是调一个方法,_occupied就增加1,为什么会这样呢?

3.1 cache大小

我们通过源码来分析一下,全局搜索_occupied

image.png

找到了改变其值的方法incrementOccupied(),再找调incrementOccupied()的地方:

image.png

来分析主要代码块,看看苹果是怎么处理的:

mask_t newOccupied = occupied() + 1;
unsigned oldCapacity = capacity(), capacity = oldCapacity;

定义一个新的变量的newOccupied存储当前即将暂存的数量,变量oldCapacitycapacity存当前可以存储容量。

if (slowpath(isConstantEmptyCache())) {
        // Cache is read-only. Replace it.
        if (!capacity) capacity = INIT_CACHE_SIZE;
        reallocate(oldCapacity, capacity, /* freeOld */false);
    }

cache为空的时候,会走到这个分支来,主要是初始化cache,调方法reallocate开辟空间,当capacity0时,开辟默认为INIT_CACHE_SIZE大小的空间,INIT_CACHE_SIZE可以查到为4,也就是说当大小为0时,默认开辟容量为4的空间。这里注意一下reallocate开辟空间函数的第三个参数传的是false,从注释上也可以看到是不会释放旧的值。

 else if (fastpath(newOccupied + CACHE_END_MARKER <= cache_fill_ratio(capacity))) {
        // Cache is less than 3/4 or 7/8 full. Use it as-is.
}
<!--__arm__  ||  __x86_64__  ||  __i386__-->
static inline mask_t cache_fill_ratio(mask_t capacity) {
    return capacity * 3 / 4;
}

这个if分支从注释中可以看到当newOccupied小于总容量的3/4不处理,这里用的是<=,是因为加了一个CACHE_END_MARKER的宏定义,该宏定义在模拟器下为1,真机为0,可以参考源码。

#if CACHE_ALLOW_FULL_UTILIZATION
    else if (capacity <= FULL_UTILIZATION_CACHE_SIZE && newOccupied + CACHE_END_MARKER <= capacity) {//capacity <= 8
        // Allow 100% cache utilization for small buckets. Use it as-is.
    }
#endif

这个分支不会走,因为CACHE_ALLOW_FULL_UTILIZATION这个宏定义,在客户端没有定义,可以参考源码看一下。

else {
        capacity = capacity ? capacity * 2 : INIT_CACHE_SIZE;
        if (capacity > MAX_CACHE_SIZE) {
            capacity = MAX_CACHE_SIZE;
        }
        reallocate(oldCapacity, capacity, true);
    }

当容量大于总容量的3/4时,就会扩容,扩容到之前的2倍,最大值为MAX_CACHE_SIZE,为1<<16=65536,再调用reallocate方法开辟空间时,第三个参数传的值就是true了,这时就会清除旧值了。

看一下reallocate这个容函数做了什么。

image.png

这里面要介绍一下setBucketsAndMask这个方法,他有两个参数第一个是newBuckets,第二个就是mask

image.png

存储的方法:

    _bucketsAndMaybeMask.store(((uintptr_t)newMask << maskShift) | (uintptr_t)newBuckets, memory_order_relaxed);

((uintptr_t)newMask << maskShift) | (uintptr_t)newBuckets的意思是将newmask向左移动maskShift位,maskShift可以从cache_t的定位中查到为48,然后再或newBuckets,结果就是将mask放在_bucketsAndMaybeMask的高16位,buckets放在低48位。

3.2 cache存储

处理完空间问题,再来看看怎么存的

bucket_t *b = buckets();
mask_t m = capacity - 1;
mask_t begin = cache_hash(sel, m);
mask_t i = begin;

获取到当前buckets指针b,根据capacit计算出maskm,根据masksel计算出脚标begin

do {
        if (fastpath(b[i].sel() == 0)) {
            incrementOccupied();
            b[i].set<Atomic, Encoded>(b, sel, imp, cls());
            return;
        }
        if (b[i].sel() == sel) {
            // The entry was added to the cache by some other thread
            // before we grabbed the cacheUpdateLock.
            return;
        }
    } while (fastpath((i = cache_next(i, m)) != begin));

这里是一个do-while循环,为什么要一个循环呢,因为上面采用cache_hash计算出来的脚标不同的sel又可能是相同的,所以要循环遍历一下。在循环体里面第一个if判断b[i].sel() == 0,说明该位置没有值,就会使_occupied+1,并且把sel保存在当前位置。第二个if,如果当前位置有值并且是要缓存的sel时就不处理了,直接return了。

经过上面的介绍,我们根据我们看到的现象来分析一下是不是这样的,是mac下运行的故CACHE_END_MARKER1

  1. 当调1个方法时,第一次初始化cache大小capacity4capacity * 3/4 = 3, 这时newOccupied1,满足(1+CACHE_END_MARKER = 2) <= 3,不会扩容;
  2. 当调2个方法时,capacity * 3/4 = 3,这时newOccupied2,满足(newOccupied+CACHE_END_MARKER = 3) <= 3,不会扩容;
  3. 当调3个方法时,capacity * 3/4 = 3,这时newOccupied3,不满足(newOccupied+CACHE_END_MARKER = 4) <= 3,会扩容,清除旧的值再保存第三个方法,_occupied变为1
  4. 当调4个方法时,capacity 已经扩容为8了,capacity * 3/4 = 6,这时newOccupied2,因为已经存了第3个方法,满足(newOccupied+CACHE_END_MARKER = 3) <= 6,不会扩容;
  5. 当调5个方法时,capacity8capacity * 3/4 = 6,这时newOccupied3,满足(newOccupied+CACHE_END_MARKER = 4) <= 6,不会扩容;
  6. 当调6个方法时,capacity8capacity * 3/4 = 6,这时newOccupied4,满足(newOccupied+CACHE_END_MARKER = 5) <= 6,不会扩容;
  7. 当调7个方法时,capacity8capacity * 3/4 = 6,这时newOccupied5,满足(newOccupied+CACHE_END_MARKER = 6) <= 6,不会扩容;
  8. 当调8个方法时,capacity8capacity * 3/4 = 6,这时newOccupied6,不满足(newOccupied+CACHE_END_MARKER = 7) <= 6,需要扩容;扩容结果capacity变为16capacity * 3/4 = 12,清除旧值再存第8个方法,_occupied变为1

到这里cache的底层原理就介绍完了,这里只是缓存,那么什么时候取呢,请看下一篇:消息流程之快速查找。

上一篇 下一篇

猜你喜欢

热点阅读