cython中np.in t,np.int,int和np.int的区别?

2024-04-29 06:20:28 发布

您现在位置:Python中文网/ 问答频道 /正文

在cython中,我有点难以处理这么多的int数据类型。

np.int, np.int_, np.int_t, int

我猜纯python中的int等同于np.int_,那么np.int是从哪里来的呢?我找不到努比的文件?另外,既然我们已经有了np.int_,为什么np.int_还存在?

在cython中,当用作cdef intndarray[int]时,int会变成C类型,而当用作int()时,它会保持为python的caster?

np.int_是否等同于C中的long?那么cdef longcdef np.int_是相同的吗?

在什么情况下我应该使用np.int_t而不是np.int?e、 g.cdef np.int_tndarray[np.int_t]。。。

有人能简单地解释一下这些类型的错误使用将如何影响已编译cython代码的性能吗?


Tags: 文件代码类型错误np情况性能caster
2条回答

这有点复杂,因为名字根据上下文有不同的含义。

int

  1. 在Python中

    int通常只是一个Python类型,它具有任意精度,这意味着您可以在其中存储任何可能的整数(只要您有足够的内存)。

    >>> int(10**50)
    100000000000000000000000000000000000000000000000000
    
  2. 但是,当您使用它作为NumPy数组的dtype时,它将被解释为np.int_1。它不是任意精度的,它的大小与C的long相同:

    >>> np.array(10**50, dtype=int)
    OverflowError: Python int too large to convert to C long
    

    这也意味着以下两项是等效的:

    np.array([1,2,3], dtype=int)
    np.array([1,2,3], dtype=np.int_)
    
  3. 作为Cython类型标识符,它有另一个含义,这里它代表类型int。它的精度有限(通常是32位)。您可以将其用作Cython类型,例如在使用cdef定义变量时:

    cdef int value = 100    # variable
    cdef int[:] arr = ...   # memoryview
    

    作为cdefcpdef函数的返回值或参数值:

    cdef int my_function(int argument1, int argument2):
        # ...
    

    作为ndarray的“通用”:

    cimport numpy as cnp
    cdef cnp.ndarray[int, ndim=1] val = ...
    

    对于类型铸造:

    avalue = <int>(another_value)
    

    可能还有更多。

  4. 在Cython中,但作为Python类型。您仍然可以调用int,您将得到一个“Python int”(任意精度),或者将其用于isinstance,或者用作np.arraydtype参数。这里上下文很重要,因此转换为Pythonint与转换为C int不同:

    cdef object val = int(10)  # Python int
    cdef int val = <int>(10)   # C int
    

np.int

其实这很简单。它只是int的别名:

>>> int is np.int
True

所以上面的所有内容也适用于np.int。但是,除非在cimported包上使用它,否则不能将其用作类型标识符。在这种情况下,它表示Python整数类型。

cimport numpy as cnp

cpdef func(cnp.int obj):
    return obj

这将要求obj是Python整数,而不是NumPy类型:

>>> func(np.int_(10))
TypeError: Argument 'obj' has incorrect type (expected int, got numpy.int32)
>>> func(10)
10

我对np.int的建议是:尽可能避免。在Python代码中,它相当于int,在Cython代码中,它也相当于Python sint,但是如果用作类型标识符,它可能会使您和所有阅读代码的人感到困惑!我真的很困惑。。。

np.int_

实际上它只有一个含义:它是一个表示标量NumPy类型的Python类型。你用它就像Python一样int

>>> np.int_(10)        # looks like a normal Python integer
10
>>> type(np.int_(10))  # but isn't (output may vary depending on your system!)
numpy.int32

或者使用它指定dtype,例如使用np.array

>>> np.array([1,2,3], dtype=np.int_)
array([1, 2, 3])

但在Cython中不能将其用作类型标识符。

cnp.int_t

它是np.int_的类型标识符版本。这意味着您不能将其用作数据类型参数。但是可以将其用作cdef声明的类型:

cimport numpy as cnp
import numpy as np

cdef cnp.int_t[:] arr = np.array([1,2,3], dtype=np.int_)
     |---TYPE---|                         |---DTYPE---|

这个示例(希望)显示了带有尾随_t的类型标识符实际上表示使用不带尾随tdtype的数组类型。你不能用Cython码交换它们!

注释

在NumPy中还有更多的数字类型,我将包含一个列表,其中包含NumPy dtype和Cython类型标识符,以及C类型标识符,也可以在Cython中使用。但它基本上取自the NumPy documentationCython NumPy ^{} file

NumPy dtype          Numpy Cython type         C Cython type identifier

np.bool_             None                      None
np.int_              cnp.int_t                 long
np.intc              None                      int       
np.intp              cnp.intp_t                ssize_t
np.int8              cnp.int8_t                signed char
np.int16             cnp.int16_t               signed short
np.int32             cnp.int32_t               signed int
np.int64             cnp.int64_t               signed long long
np.uint8             cnp.uint8_t               unsigned char
np.uint16            cnp.uint16_t              unsigned short
np.uint32            cnp.uint32_t              unsigned int
np.uint64            cnp.uint64_t              unsigned long
np.float_            cnp.float64_t             double
np.float32           cnp.float32_t             float
np.float64           cnp.float64_t             double
np.complex_          cnp.complex128_t          double complex
np.complex64         cnp.complex64_t           float complex
np.complex128        cnp.complex128_t          double complex

实际上,np.bool_cnp.npy_boolbint都有Cython类型,但这两种类型目前都不能用于NumPy数组。对于标量,cnp.npy_bool将只是一个无符号整数,而bint将是一个布尔值。不知道发生了什么。。。


1取自NumPy documentation "Data type objects"

Built-in Python types

Several python types are equivalent to a corresponding array scalar when used to generate a dtype object:

int           np.int_
bool          np.bool_
float         np.float_
complex       np.cfloat
bytes         np.bytes_
str           np.bytes_ (Python2) or np.unicode_ (Python3)
unicode       np.unicode_
buffer        np.void
(all others)  np.object_

np.int_是默认的整数类型(as defined in the NumPy docs),在64位系统上,这将是一个C longnp.intc是默认的C int或者int32或者int64np.int是内置int函数的别名

>>> np.int(2.4)
2
>>> np.int is int  # object id equality
True

cython数据类型应该反映C数据类型,因此cdef int aC int等等。

对于np.int_t即NumPy np.int_数据类型的Cython编译时间等价物,np.int64_tCython编译时间等价物np.int64

相关问题 更多 >