iOS 底层 - 内存管理之Tagged Pointer
本文源自本人的学习记录整理与理解,其中参考阅读了部分优秀的博客和书籍,尽量以通俗简单的语句转述。引用到的地方如有遗漏或未能一一列举原文出处还望见谅与指出,另文章内容如有不妥之处还望指教,万分感谢 !
关于TaggedPointer
-
从64bit开始,IOS引入了
Tagged Pointer
技术;用于优化NSNumber
、NSDate
、NSString
等小对象(OC对象
)的存储;
比如:NSString 就会被优化成NSTaggedPointerString类型 -
注意:
Tagged Pointer
技术不会
运用在可变
类型对象,比如:NSMutableString
-
在没有使用
Tagged Pointer
之前,NSNumber等对象需要动态分配内存、维护引用计数等,NSNumber指针存储的是堆空间NSNumber对象的地址值
-
使用Tagged Pointer 技术之后,NSNumber指针里面存储的数据变成了:Tag+Data (Tag 是一个标记信息:数据类型),也就是NSNumber指针存储的是NSNumber
对象的数据
-
当对象指针地址的最高有效位是1,则该指针为
Tagged Pointer
比如:十六进制0x7 转换成二进制0b1110;十六进制0x6 转换成二进制0b1100;最左边数字是最高有效位 ;总体来说十六进制最后一位是只要不是0,就是Tagged Pointer指针
-
当指针不够存储这些数据是,才会使用动态分配内存的方式来存储数据;即将之前的直接动态分配内存,改变为先把数据加上tag值存储在指针中,如果不够再动态分配
-
Tagged Pointer
指针的赋值过程是不会走setter方法和getter方法的 -
Tagged Pointer
是由编译器来实现,开发者全程无感
示例代码:
int main(int argc, char * argv[]) {
@autoreleasepool {
NSNumber *number = @10;
return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
}
}
*图解:
number-taggedPointer.png- 十进制的10 转化成十六进制就是 0xa
优点:
- Tagged Pointer技术节省了内存空间开销,本来正常的局部变量的NSNumber指针占8字节,堆空间动态分配内存至少16字节;这样看来需要在两块内存区域分配共24字节;但是Tagged Pointer技术可以实现只在栈空间分配8字节就可以。
- 在方法调用方面也变的更简单,objc_msgSend能够识别Tagged Pointer,比如NSNumber的intValue方法,直接从指针提取数据,节省了以前的调用开销
示例代码二:
-(void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event
{
NSNumber *number1 = @10;
NSNumber *number2 = @11;
NSNumber *number3 = @12;
NSLog(@"\n %p \n %p \n %p", number1, number2, number3);
}
图解.png
疑问:如何判断一个指针是否是Tagged Pointer ?
- iOS 平台,最高有效位是1 (第64bit)
- Mac平台,最低有效位是1
- 这里的有效位是二进制数
还有一个笨办法 !
让指针对象调用一个在编译阶段不报错,运行时就报错的方法;看崩溃日志......
比如:
崩溃日志.png如何区分内存地址是堆控件还是栈空间 ?
十六进制看最后一位是否是0,如果是0那就是堆空间地址;否则就是栈空间地址;
log.png
NSTaggedPointerString
Tagged Pointer
是一个很棒的技术,能把它运用在字符串上很不寻常。显然Apple花了很多心思在这上面,他们必须要看到一个显著的好处。看他们如何把这些技术融合在一起,看他们如何在非常有限的空间里面尽可能的存储信息,实在有趣。
做了什么 ?
利用有限的空间,把小数据存储在指针内部
有什么用 ?
- 提高访问速度,对性能提升很有帮助
- 节省了内存空间
- 简单来说:体量更小,🏃跑的更快 !
用什么编码方式实现 ?
NSTaggedPointerString
的存储有三种编码方式:ASCII码
,六位编码
,五位编码
。
ASCII码:除去第一位和最后一位,用8位的ascll码的话最多可以存储7个字符。字符串数目0~7
之间
六位编码: 六位二进制编码, (144)/6=9.333… ;最多存储9位字符。字符数目在8~9使用
五位编码:五位二进制编码,(144)/5 = 11.2;最多存储11位字符。字符数目在10~11使用
神秘的表:
完整的六位编码表是:
`eilotrm.apdnsIc ufkMShjTRxgC4013bDNvwyUL2O856P-B79AFKEWV_zGJ/HYX`
一个显然的问题是:为什么这个指令这么奇怪?
因为这个表同时用于六位编码和五位编码,它不完全按字母顺序排列是有意义的。最常使用的字符应该是上半部分,而较少使用的字符应该在下半部分。这可以确保尽可能多的长字符串可以使用五位编码。
表中前几个字母与字母出现在英语里的频率相似。最常见的英文字母是E,然后是T,A,O,I,N,S。E作为表的开头是正确的,其他的则靠近开头。表似乎是按使用频率排序。与英语的差异可能是因为Cocoa APP中的短字符串并不是一个从英语散文中随机选择的单词,而是更专业的语言。
但这并不是一成不变的,apple
会持续更新并统计字母使用频率,系统每次升级都可能不一样
,当前第一位是字母e,之后是i,l,o,t…;这两种编码是从左向右的;根据编码位数我们显然也能推测出并不是所有字符都可以进行ASCII
或者六位五位编码
的,当出现这样不能编码的时候,系统也就不会使用NSTaggedPointerString类。
开发中那些字符串符合TaggedPointer呢 ?
- 对于以前的@""符号创建的字符串还是常量字符串,这个没有改变,但是采用
stringWithFormat:
、stringWithUTF8String:
、stringWithString:
等NSString方法的创建字符串对象则有了区别。 - 用这些方法创建的字符串字符数目在
11位之内
的会被存储在TaggedPointer指针内部
参考优秀文章: