第1篇:Cython的数据类型(第二部分)

2020-04-14 本文已影响0人铁甲万能狗

Cython的C指针

与C一样，尽管指针性与变量而不是类型相关联，但可以在类型或变量附近声*号。

%%cython
cdef int *a
cdef int *b

但这样在变量a,b写在一行,cython编译器会发出警告的信息,因此建议每个变量单独声明

%%cython

cdef int *a,*b

Cython中的指针的解引操作

在Cython中解引用指针与在C语言中不同。
由于Python语言已经使用*args和**kwargs语法来允许任意位置和关键字参数并支持函数参数解包，因此Cython不支持*

*解引语法是C指针的语法。取而代之的是，我们在位置0的指针处建立索引，以解引Cython中的指针的引用。这种语法也可以解引C中的指针，尽管这种情况很少见。

Cython的结构体与指针

无论在C中使用箭头运算符的任何地方，在Cython中的结构体都使用点运算符访问其内部的成员变量，Cython将生成正确的C级代码

%%cython -a

cdef struct Person:
    char* name
    unsigned int age
#end-cdef

#初始化结构体
cdef Person p=Person("jck308",32)

#声明Person类型结构体指针p_per
#并将变量p的地址赋值给指针p_per
cdef Person *p_per=&p

#访问结构体的成员
print(p.age)
print(p.name)

print(p_per.age)
print(p_per.name)

混合静态和动态类型变量

Cython允许静态和动态类型变量之间的赋值。静态和动态的这种流体混合是一个强大的特性，我们将在多个实例中使用它：它允许我们对大多数代码基使用动态Python对象，并轻松地将它们转换为性能关键部分加速、静态类型的类比。

举例来说，假设我们有几个静态int，我们想将它们组合成（动态）Python元组。使用Python/C API创建和初始化这个元组的C代码很简单，但是很繁琐，需要几十行代码，并且需要大量的错误检查。在Cython，显而易见的方法就是：

%%cython

#静态类型的变量
cdef int a=1,b=2,c=3

##动态类型的变量
tuple_of_ints=(a,b,c)

print(tuple_of_ints)

这段代码很无聊。这里要强调的一点是，a，b和c是静态类型的整数，而Cython允许使用它们创建动态类型的Python元组。然后，我们可以将该元组分配给动态键入的tuple_of_ints变量。该示例的简单性是Cython强大之处：我们可以以显而易见的方式创建一个C类型int元组，而无需进一步思考。我们希望像这样的概念上简单的事情变得简单，这就是Cython所提供的。

此示例之所以有效，是因为C类型的int与Python int之间存在明显的对应关系，因此Python可以为我们自动类型转换。例如，如果a，b和c是C指针，则此示例无法按原样工作。在这种情况下，我们必须解引它们，然后再将它们放入元组或使用其他策略。

例如下面的代码是个错误的例子，因为Python解释器无法识别指针类型的变量

%%cython

cdef int k=55,j=56

cdef int *a=&k
cdef int *b=&j

tuple_of_ints=(a,b)
print(tuple_of_ints)

正确的做法,如下图所示，我们通过解引指针变量a、b

ss8.png

给出了内置Python类型与C或C ++类型之间对应关系的完整列表

ss8.png

Cythond的bint类型

bint布尔整数类型是C级别的int，并与Python的bool相互转换。它具有真实性的标准C解释：零为False，非零为True。

整数类型转换和溢出

Python 3中，所有int对象都是无限精度的。当将整数类型从Python转换为C时，Cython会生成检查溢出的代码。如果C类型不能表示Python整数，则会引发运行时OverflowError。

float类型转换

Python fload存储为C double。根据IEEE 754转换规则，将Python浮点数转换为C浮点数可能会截断为0.0或正负无穷大。
Cython的double类型会被动态转换Python的float类型

%%cython

cdef double d=384848048282945060321.3835
b=d

print(b)
print(type(b))

ss8.png

Complex类定

The Python complex类型存储为两个double的C结构,Cython具有浮点复数和双复数C级类型，它们对应于Python复数类型。 C类型与Python复杂类型具有相同的接口，但是使用有效的C级操作。这包括访问实数和虚数分量的实数和imag属性，创建多个复数共轭的共轭方法，以及用于加，减，乘和除的有效运算。C级Complex类型与C99 _Complex类型或C ++ std :: complex模板化类兼容。

bytes类型

Python字节类型会自动在char *或std :: string之间来回转换。下面示例就是Cython char类型指针动态转换为Python的bytes

%%cython

cdef char* s="Hello World"
b=s

print(b)
print(type(b))

用Python类型静态声明变量

到目前为止，我们一直使用cdef静态声明C类型的变量。也可以使用cdef静态声明Python类型的变量。我们可以对内置类型（例如list，tuple和dict）执行此操作；扩展类型，例如NumPy数组；还有很多其他

并非所有的Python类型都可以静态声明：它们必须用C实现，并且Cython必须有权访问该声明。内置的Python类型已经满足了这些要求，并且声明它们很简单。例如Python典型的集合类型list,dict,str,set(str就是集合类型,字符串数组)：

cdef list mylist
cdef dict mydi
cdef str pname
cdef set myset

此示例中的变量是完整的Python对象。在后台，Cython将它们声明为指向某些内置Python结构类型的C指针。它们可以像普通的Python变量一样使用，但是受其声明类型的约束：

%%cython

cdef list mylist=[k+1 for k in range(1,11)]

pylist=mylist

print("mylist:",mylist)

print("删除pylist索引2的元素")
del pylist[2]
print(mylist)

在这里，通过删除pylist第3个元素也会删除mylist的第3个元素，因为它们引用的是同一列表。mylist和pylist之间的一个区别是，mylist只能引用Python列表对象，而pylist可以引用任何Python类型。 Cython将在编译时和运行时对mylist施加类型约束。

备注:关于Cython更复杂的数组类型引用，可以参考此篇文章《第5篇:Cython的线性表性操作》

乍一看，Cython允许静态声明具有内置Python类型的变量似乎有些奇怪。为什么不照常使用Python的动态类型？答案指出了Cython的一般原理：我们提供的静态类型信息越多，Cython就能更好地优化结果。像往常一样，该规则也有例外，但这通常是正确的。例如，以下代码从Cython函数中返回sieveOfEratosthenes()返回一个cdef list的对象附加到动态类型的变量中：

%%cython 
#cython:language_level=3

cpdef list sieveOfEratosthenes(int n):
    cdef list pr = [True for i in range(n + 1)]
    cdef int p = 2
    cdef list res=list()
    
    while (p * p <= n):
        if (pr[p] == True):
            for i in range(p * p, n + 1, p):
                pr[i] = False
            #end-for
        #end-if
        p += 1
    #end-while
    
    cdef int k
    
    for k in range(2,n):
        if pr[k]:
            res.append(k)
        #end-if
    #end-for
    return res
#end-def


#这是Python动态类型的list
primers=[]

primers=sieveOfEratosthenes(9)

print(primers)

print("调用append方法")
primers.append(11)
print(primers)

程序输出

Cython编译器将生成可处理任何Python对象的代码，并在运行时测试primers是否为列表。如果不是，只要它具有带参数的append方法，该代码就会运行。在后台，生成的代码首先在primers对象上查找append属性(使用PyObject_GetAttr），然后使用完全通用的PyObject_Call Python / C API函数调用该方法。这实质上模拟了当运行等效的Python字节码时Python解释器将执行的操作。

假设上面的代码中primers变量我们使用静态声明

cdef list primers

现在，Cython可以生成专门的代码，这些代码可以直接从C API调用PyList_SET_ITEM或PyList_Append函数。这就是上一示例中的PyObject_Call最终仍然要调用的内容，但是静态类型允许Cython绕过了Python解释器在动态调度(Dynamic Dispatch)一系列繁琐沉重的类型检测(内部类型指针查找)，这也是Cython的静态版本list比Python动态版本list性能高效的原因。

关于Python解释器的动态调度的详细介绍，请查看此文《第2篇:Cython VS Python 执行原理》

Cython当前支持的集中内置可静态声明的Python类型，我们常用静态声明的可能就是list,dict

type,object
bool
complex
basestring,str,unicode,bytes,bytearray
list,tuple,dict,set,frosenset
array
slace
date,time,datetime,timedelta,tzinfo

上面的列出的中不包括直接C对应的Python类型（例如int，long和float）。事实证明，在Cython中静态声明和使用PyIntObjects，PyLongObjects或PyFloatObjects并不容易。幸运的是，这样做的需要很少。我们只声明常规的C基本数据类型int，long，float和double，然后让Cython为我们进行往返于Python的自动转换。

数字字面量的基本运算

当我们对数字字面量进行加，减或乘运算时，当操作数是动态类型化的Python对象时，这些操作具有Python语义(包括对于数值大的自动Python long强制转换）。当操作数是静态类型的C变量时，它们具有C语义（即，对于有限精度的整数类型，结果可能会溢出）

除数和模数（即计算余数）值得特别提及。使用带符号整数操作数计算模数时，C和Python具有明显不同的行为：C舍入为零，而Python舍入为无穷。例如，使用Python语义时，-1％5的结果为4；但是，如果使用C语义，它将得出-1。当将两个整数相除时，Python始终检查分母，并在其为零时引发ZeroDivisionError，而C没有适当的保护措施。

对于除法/取模运算中，即便指定了C类型的静态数字变量，Cython的行为是倾向于Python的，要获取与C/C++完全相同的语义，我们可以在全局模块级别或在指令注释中使用cdivision编译器指令，如下示例所示

在Python 3中，在C级别，所有整数都是PyLongObjects。Cython以与语言无关的方式在C整数类型和这些Python整数类型之间正确转换，并在无法进行转换时引发OverflowError。

当我们在Cython中使用Python对象时，无论是静态声明还是动态声明，Cython仍将为我们管理对象的所有方面，包括繁琐的引用计数。下一篇我们将会谈到Cython中的引用计数和静态的字符串类型。

第1篇:Cython的数据类型(第二部分)

Cython的C指针

Cython中的指针的解引操作

Cython的结构体与指针

混合静态和动态类型变量

Cythond的bint类型

整数类型转换和溢出

float类型转换

Complex类定

bytes类型

用Python类型静态声明变量

数字字面量的基本运算

猜你喜欢

热点阅读