ctypes c_char_p的不同表现？

19 投票

1 回答

15666 浏览

提问于 2025-04-18 07:30

我对不同版本的Python表现出的行为感到困惑，不明白为什么会这样。

Python 2.7.5 (default, Aug 25 2013, 00:04:04) 
[GCC 4.2.1 Compatible Apple LLVM 5.0 (clang-500.0.68)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> c="hello"
>>> a=ctypes.c_char_p(c)
>>> print(a.value) 
hello

Python 3.3.5 (default, Mar 11 2014, 15:08:59) 
[GCC 4.2.1 Compatible Apple LLVM 5.0 (clang-500.2.79)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> c="hello" 
>>> a=ctypes.c_char_p(c)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: bytes or integer address expected instead of str instance

一个版本可以正常工作，而另一个版本却给我报错。哪个才是正确的呢？

如果这两个版本都是正确的，那我该如何在3.3.5版本中实现和2.7版本一样的行为呢？我想从Python传递字符指针到C语言中。

c语言版本兼容性 ctypes 数据类型转换字符指针

1 个回答

c_char_p 是 _SimpleCData 的一个子类，它的 _type_ 属性是 'z'。在初始化的时候，__init__ 方法会调用这个类型的 setfunc，而对于简单类型 'z' 来说，这个函数是 z_set。

在 Python 2 中，z_set 函数（版本 2.7.7）可以处理 str 和 unicode 字符串。在 Python 3 之前，str 是一种 8 位字符串。CPython 2.x 的 str 内部使用的是 C 语言的以空字符（\0）结尾的字符串，这样 z_set 就可以调用 PyString_AS_STRING 来获取 str 对象内部缓冲区的指针。unicode 字符串需要先被编码成字节字符串。z_set 会自动处理这个编码，并在 _objects 属性中保留对编码后字符串的引用。

>>> c = u'spam'
>>> a = c_char_p(c)
>>> a._objects
'spam'
>>> type(a._objects)
<type 'str'>

在 Windows 系统上，ctypes 的默认字符串编码是 'mbcs'，错误处理方式设置为 'ignore'。在其他平台上，默认编码是 'ascii'，错误处理方式为 'strict'。如果想修改默认设置，可以调用 ctypes.set_conversion_mode。比如，可以使用 set_conversion_mode('utf-8', 'strict')。

在 Python 3 中，z_set 函数（版本 3.4.1）不会自动将 str（现在是 Unicode）转换为 bytes。在 Python 3 中，字符字符串和二进制数据被严格区分开来。ctypes 的默认转换被移除了，set_conversion_mode 函数也不再存在。你需要给 c_char_p 传递一个 bytes 对象（例如 b'spam' 或 'spam'.encode('utf-8')）。在 CPython 3.x 中，z_set 会调用 C-API 函数 PyBytes_AsString 来获取 bytes 对象内部缓冲区的指针。

需要注意的是，如果 C 函数会修改这个字符串，那么你需要使用 create_string_buffer 来创建一个 c_char 数组。可以通过查看参数是否被标记为 const 来判断使用 c_char_p 是否安全。

回答于 2025-04-18 由 Python大师

分享举报

ctypes c_char_p的不同表现？

1 个回答

撰写回答