我是程序员Pythoner集中营Python精选

4. Python3源码—字符串(bytes)对象

2018-06-08  本文已影响137人  阿里云云栖号

4.1. 字符串对象

字符串对象是“变长对象”。

4.1.1. Python中的创建

Python中字符串(bytes)对象创建最重要的方法为PyBytes_FromStringAndSize,如下Python语句最终会调用到PyBytes_FromStringAndSize:

4.1.2. PyBytes_FromStringAndSize的C调用栈

词法解析,最终调到PyBytes_FromStringAndSize,调用顺序如下:

4.1.3. PyBytes_FromStringAndSize源码

可以看到:

1、字符串对象的C数据结构:

2、空串缓存:空串(nullstring)为同一个地址,第二次需要空串时,只是将计数加1,在_PyBytes_FromSize中实现空串缓存;

3、字符缓冲池:字符(characters)为同一个地址,第二次需要该字符时,只是将计数加1,在PyBytes_FromStringAndSize中实现字符缓存;

4.2. 字符串对象的特性

支持tp_as_number、tp_as_sequence、tp_as_mapping这三种操作。

4.2.1. 数值操作

4.2.2. 序列操作

因为没有实现PySequenceMethods中的设置方法,所以字符串不可变。

其中:

1、bytes_length

2、bytes_concat

多个字符串相加效率低于join,join只分配一次内存;

1、bytes_repeat

效率要高于同个字符串相加;

2、bytes_item:暂时没有找到相应Python语句;

3、bytes_contains

4.2.3. 关联操作

其中:

bytes_subscript

test[1]会走bytes_subscript方法的index分支,test[0:5]会走slice分支;

4.2.4. to string

4.2.5. hash

4.2.6. 比较

4.2.7. 内置方法

4.3 参考

Python源码剖析

本文作者:whj0709

阅读原文

本文为云栖社区原创内容,未经允许不得转载。

上一篇下一篇

猜你喜欢

热点阅读