聊一聊 iOS 开发中的惰性计算
本文摘自:作者臧成威,美团网 iOS 技术专家,QCon 讲师,国内 Functional Reactive Programming 技术爱好者.2015年加入美团,负责美团 iOS 发布工程系统的研发和流程优化梳理。擅长多语言范式,对各种编程范式有着独到的见解.
臧老师在美团组织过系统的 Functional Reactive Programming 培训,参与人数总计达百人。
他最近在 InfoQ 旗下的 StuQ 开设课程:《ReactiveCocoa 编程思想与开发实战》,第一期爆满结束。于是他最近开了第二期课程,本周五即将上课,感兴趣的可以看文末的课程详情。
正文
首先给大家讲一个笑话:
有一只小白兔,跑到蔬菜店里问老板:“老板,有 100 个胡萝卜吗?”。老板说:“没有那么多啊。”,小白兔失望的说道:“哎,连 100 个胡萝卜都没有。。。”。
第二天小白兔又来到蔬菜店问老板:“今天有 100 个胡萝卜了吧?”,老板尴尬的说:“今天还是缺点,明天就能好了。”,小白兔又很失望的走了。
第三天小白兔刚一推门,老板就高兴的说道:“有了有了,从前天就进货的 100 个胡萝卜到货了。”,小白兔说:“太好了,我要买 2 根!”。。。
不晓得笑话是否博您一笑,但是这里面确有一个点是和我们的主题惰性计算相关的。试想一下,假设蔬菜店是一个电商,你是老板,你挂商品数量的时候,是 100 个,1000 个,还是真实的备货 2 个?显然做过淘宝的同学都知道这其中的玄机,就是先挂大的余量,有卖出再补货。所以,如果这个老板先回答有 100 个胡萝卜,再等它要 2 个的时候把自己备货的 2 个拿给它,是不是就免去了 100 个胡萝卜的物流?
在程序开发中,我们也会经常的遇到这样的问题,明明创建了很大的一个对象,但是其实只用了一个字段;明明创建了一个 500 个的数组,其实只用了第 0 个和第 1 个元素。遇到这类问题,我们可以尝试使用惰性计算来解决。
关于惰性计算,或者惰性求值。想必大家第一反应就是在 getter 里动态返回属性了。例如有一个很大的属性,你希望在有人调用的时候才创建,就可以这样写:
- (id)someBigProperty
{
if (_someBigProperty == nil) {
NSMutableArray *someBigProperty = [NSMutableArray array];
for (int i = 0; i < 100000; ++i) {
[someBigProperty addObject:@(i)];
}
_someBigProperty = [someBigProperty copy];
}
return _someBigProperty;
}
本文当然不拘泥于大家耳熟能详的知识点进行阐述了。上述的代码虽然也能勉强叫惰性求值,但并非足够理想。为什么说是 “勉强叫” 呢?大家想想上面的笑话,其实这样做和老板的做法并无差别。首先店里没有 100 个胡萝卜,就好像这个对象没有_someBigProperty属性一样。一旦有人需要 100 个 “胡萝卜”,就循环 100000 次创建这个_someBigProperty属性。然后可能使用者只需要第 0 个。
另外在实际项目中这样的一个手段几乎被大家严重的乱用了,为什么说是乱用呢?除了创建非常大的属性、或者创建对象的时候有一些必要的副作用不能提前创建之外,几乎不应该使用惰性求值来处理类似逻辑。原因如下:
如果真的是很大的属性,一般它比较重要,几乎一定会被访问,所以加上这个不如直接在 init 的时候创建。
@property 的 atomic、nonatomic、copy、strong 等描述在有 getter 方法的属性上会失效,后人修改代码的时候可能只改了 @property 声明,并不会记得改 getter,于是隐患就这样埋下了。
代码含有了隐私操作,尤其 getter 中再混杂了各种逻辑,使得程序出现问题非常不好排查。后人哪会想到someObj.someProperty这样一个简简单单的取属性发生了很多奇妙的事。
很多人的 getter 写得并不是完全标准,例如上述代码会导致多线程访问的时候,出现很多神奇的问题。一旦形成习惯,后续的很多稀奇古怪的 crash 就接踵而至了。
代码多,本来代码只需要在init方法中创建用上一两行,结果用了至少 7 行的一个 getter 方法才能写出来,想想一个程序轻则数百个属性,都这么搞,得多出多少行代码?另外代码格式几乎完全一样,不符合 DRY 原则。好的程序员不应该总是写重复的代码,不是么?
性能损耗,对于属性取值可能会非常的频繁,如果所有的属性取值之前都经过一个if判断,这不是平白浪费的性能?
我们回到正题。既然简单改写一下 getter 不但解决不了问题还有这么多隐患,那我们该如何能够正确优雅的把惰性计算写好?下面给大家一些建议。
观察上面的代码,你会发现 _someBigProperty 是一个非常规则的 NSArray,它的 item 内容与下标相等。我们可以看出 item 的结果与 index 存在如下关系:
f(x) = x
类似的可以有很多,例如> 100的为@“world”,0 <= x <= 100的为@“hello”;item 为下标的平方;item 为下标的数值转换成的字符串等。所以这类NSArray,基本需要一个 count 和一个函数就可以构成了。那我们现在就基于NSArray这个类簇,实现一个特殊的类吧!
关于类簇,相信很多同学都有所了解,大概的说法是不可以直接继承一个NSArray、NSNumber、NSString这样的类。如果要继承需要实现全部的必要方法,在NSArray这个类簇来说,就是如下的方法:
@interface NSArray<__covariant ObjectType> : NSObject
@property (readonly) NSUInteger count;
- (ObjectType)objectAtIndex:(NSUInteger)index;
- (instancetype)init NS_DESIGNATED_INITIALIZER;
- (instancetype)initWithObjects:(const ObjectType [])objects count:(NSUInteger)cnt NS_DESIGNATED_INITIALIZER;
- (nullable instancetype)initWithCoder:(NSCoder *)aDecoder NS_DESIGNATED_INITIALIZER;
@end
当然除了NSArray类的基本方法,还有NSCopying、NSMutableCopying、NSSecureCoding这些协议需要实现,另外NSFastEnumberation协议已经默认实现完成,不需要额外处理。与惰性计算无关的细节大家可以自己填补,对于本例,我们只需要关心这几个方法的实现:
typedef id(^ItemBlock)(NSUInteger index);
@interface ZDynamicArray : NSArray
- (instancetype)initWithItemBlock:(ItemBlock)block count:(NSUInteger)cnt;
- (id)objectAtIndex:(NSUInteger)index;
- (NSUInteger)count;
@end
按照上文的说法,对于这样一个特殊的NSArray,我们真正要储存的数据只有一个 count 值外加一个函数,所以我们用这两个作为init参数。实现也很简单:
@interface ZDynamicArray()
@property (nonatomic, readonly) ItemBlock block;
@property (nonatomic, readonly) NSUInteger cnt;
@end
@implementation ZDynamicArray
- (instancetype)initWithItemBlock:(ItemBlock)block count:(NSUInteger)cnt
{
if (self = [super init]) {
_block = block;
_cnt = cnt;
}
return self;
}
- (NSUInteger)count
{
return self.cnt;
}
- (id)objectAtIndex:(NSUInteger)index
{
if (self.block) {
return self.block(index);
} else {
return nil;
}
}
@end
瞧,就这么简单的写好了。让我们试一下吧!
ZDynamicArray *array = [[ZDynamicArray alloc] initWithItemBlock:^id(NSUInteger index) {
return @(index);
} count:100000];
for (id v in array) {
NSLog(@"%@", v);
}
NSLog(@"%@", array[15]);
一个看似 10w 数据的数组,其实占用空间微乎其微,但是作用和最开始那样的代码效果一样。很不错吧。大家也可以动手实践,写一些自己需要用到的惰性计算代码,例如一个Model的数组,并非所有的Model都需要用到,我们也可以做成这样的一个数组,等用到的时候再从NSDicitonary转换成Model。就像这样:
NSArray *downloadData = @[@{}, @{}, @{}, @{}];
NSArray *modelArray = [[ZDynamicArray alloc] initWithItemBlock:^id(NSUInteger index) {
return [SomeModel modelFromDictionary:downloadData[index]];
} count:downloadData.count];
当然这可能有一定的风险,因为传统的写法会更早一步的发现某些数据不正确,然后惰性计算,会把这个发现问题的时间延后。这就需要更多更好的错误处理机制。ReactiveCocoa这个著名的 FRP 库为我们提供了更多编程的可能,它在很多处理上都是惰性计算的,同时它又做了很好的异常处理工作。学习它可以让你编程思路更广。
全文完。