Python中模块和包有什么区别?
Python中的模块和包有什么区别?
另外可以参考:“包”和“模块”有什么区别?(适用于其他编程语言)
10 个回答
首先,要知道,严格来说,模块是Python解释器内存中的一个对象,通常是通过读取一个或多个磁盘上的文件来创建的。虽然我们可以随便称磁盘上的文件,比如a/b/c.py
为“模块”,但它实际上要等到和其他一些信息(比如sys.path
)结合后,才会变成真正的模块对象。
举个例子,两个不同名字的模块可以从同一个文件中加载,这取决于sys.path
和其他设置。比如,当你在解释器中运行python -m my.module
,然后再import my.module
时,就会出现两个模块对象,分别是__main__
和my.module
,它们都是从同一个磁盘文件my/module.py
创建的。
包是一个可以包含子模块(包括子包)的模块。但并不是所有模块都能这样做。我们可以创建一个小的模块层级来举例:
$ mkdir -p a/b
$ touch a/b/c.py
确保a
目录下没有其他文件。启动一个Python 3.4或更高版本的解释器(例如,使用python3 -i
),然后检查以下语句的结果:
import a
a ⇒ <module 'a' (namespace)>
a.b ⇒ AttributeError: module 'a' has no attribute 'b'
import a.b.c
a.b ⇒ <module 'a.b' (namespace)>
a.b.c ⇒ <module 'a.b.c' from '/home/cjs/a/b/c.py'>
模块a
和a.b
是包(实际上,它们是一种叫做“命名空间包”的特殊包,不过这里我们不讨论这个)。但是,模块a.b.c
就不是一个包。我们可以通过在上面的目录结构中添加另一个文件a/b.py
,然后重新启动一个新的解释器来证明这一点:
import a.b.c
⇒ ImportError: No module named 'a.b.c'; 'a.b' is not a package
import a.b
a ⇒ <module 'a' (namespace)>
a.__path__ ⇒ _NamespacePath(['/.../a'])
a.b ⇒ <module 'a.b' from '/home/cjs/tmp/a/b.py'>
a.b.__path__ ⇒ AttributeError: 'module' object has no attribute '__path__'
Python会确保在加载子模块之前,所有父模块都已经加载。这里它发现a/
是一个目录,因此创建了一个命名空间包a
,而a/b.py
是一个Python源文件,Python会加载它并用它来创建一个(非包)模块a.b
。此时,你不能有模块a.b.c
,因为a.b
不是一个包,因此不能有子模块。
你还可以看到,包模块a
有一个__path__
属性(包必须有这个),但非包模块a.b
没有。
- 任何一个Python文件都是一个模块,它的名字就是文件名去掉
.py
后缀的部分。 - 包是多个Python模块的集合:模块是单个的Python文件,而包则是一个包含多个Python模块的文件夹,并且这个文件夹里有一个
__init__.py
文件,用来区分这个包和仅仅包含一些Python脚本的普通文件夹。包可以嵌套,也就是说一个包里面可以有包,只要相应的文件夹里也有自己的__init__.py
文件。
模块和包的区别主要是在文件系统的层面。当你导入一个模块或包时,Python创建的对应对象总是类型为module
。不过要注意,当你导入一个包时,只有那个包的__init__.py
文件里的变量、函数和类是直接可见的,而不是子包或模块。
例子
举个例子,考虑一下Python标准库里的xml
包:它的xml
文件夹里有一个__init__.py
文件和四个子文件夹;其中的etree
子文件夹里也有一个__init__.py
文件,还有一个ElementTree.py
文件等。
看看当你尝试交互式地导入包/模块时会发生什么:
>>> import xml
>>> type(xml)
<type 'module'>
>>> xml.etree.ElementTree
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'module' object has no attribute 'etree'
>>>
>>>
>>> import xml.etree
>>> type(xml.etree)
<type 'module'>
>>> xml.etree.ElementTree
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'module' object has no attribute 'ElementTree'
>>>
>>>
>>> import xml.etree.ElementTree
>>> type(xml.etree.ElementTree)
<type 'module'>
>>> xml.etree.ElementTree.parse
<function parse at 0x00B135B0>
注意
在Python中,还有一些内置模块,比如sys
,这些模块是用C语言写的,但我觉得你在提问时可能没有考虑到这些。