4. Python3源码—字符串(bytes)对象
4.1. 字符串对象
字符串对象是“变长对象”。
4.1.1. Python中的创建
Python中字符串(bytes)对象创建最重要的方法为PyBytes_FromStringAndSize,如下Python语句最终会调用到PyBytes_FromStringAndSize:
4.1.2. PyBytes_FromStringAndSize的C调用栈
词法解析,最终调到PyBytes_FromStringAndSize,调用顺序如下:
4.1.3. PyBytes_FromStringAndSize源码
可以看到:
1、字符串对象的C数据结构:
2、空串缓存:空串(nullstring)为同一个地址,第二次需要空串时,只是将计数加1,在_PyBytes_FromSize中实现空串缓存;
3、字符缓冲池:字符(characters)为同一个地址,第二次需要该字符时,只是将计数加1,在PyBytes_FromStringAndSize中实现字符缓存;
4.2. 字符串对象的特性
支持tp_as_number、tp_as_sequence、tp_as_mapping这三种操作。
4.2.1. 数值操作
4.2.2. 序列操作
因为没有实现PySequenceMethods中的设置方法,所以字符串不可变。
其中:
1、bytes_length
2、bytes_concat
多个字符串相加效率低于join,join只分配一次内存;
1、bytes_repeat
效率要高于同个字符串相加;
2、bytes_item:暂时没有找到相应Python语句;
3、bytes_contains
4.2.3. 关联操作
其中:
bytes_subscript
test[1]会走bytes_subscript方法的index分支,test[0:5]会走slice分支;
4.2.4. to string
4.2.5. hash
4.2.6. 比较
4.2.7. 内置方法
4.3 参考
Python源码剖析
本文作者:whj0709
本文为云栖社区原创内容,未经允许不得转载。