18.Python编程:模块深入学习
目录
本文将在学习Python中模块的概念的基础上,通过一些示例来继续学习模块标准模板、import、from…import 、深入理解模块、__name__
属性、包等知识。
模块标准模板
在了解了Python中的模块知识以后,就来看一下Python中的模块标准模板。例子中模块名:17my_module.py
。
如下:
# encoding: utf-8
#! F:\python_projects\17my_module.py
# 文件名: 17my_module.py
"""
Here is document note
这里是文档注释
"""
__author__ = 'Guang TouQiang'
import sys
print('命令行参数如下:')
for i in sys.argv:
print(i)
print('\n\nPython 路径为:', sys.path, '\n')
解释如下:
第1、第2和第3行是标准注释。其中:
第1行注释表示当前模块采用的是标准utf-8编码。
第2行注释表示可以让这个17my_module.py文件直接在Unix/Linux/Mac上运行。
第3行注释表示本模块名;
第4-7行是一个字符串,表示模块的文档注释,任何模块代码的第一个字符串都被视为模块的文档注释;
第8行使用_author_变量把作者写进去,这样当你公开源代码后别人就可以看到你的大名;
以上就是Python模块的标准文件模板,当然也可以全部删掉不写,但是,按标准办事肯定没错。
后面开始就是真正的代码部分。
你可能注意到了,使用sys模块的第一步,就是导入该模块:
import sys
导入sys模块后,我们就有了变量sys指向该模块,利用sys这个变量,就可以访问sys模块的所有功能。sys模块有一个argv变量,用list存储了命令行的所有参数。
import 语句
想使用 Python 源文件,只需在另一个源文件里执行 import 语句,语法如下:
import module1[, module2[,... moduleN]
当解释器遇到 import 语句,如果模块在当前的搜索路径就会被导入。
搜索路径是一个解释器会先进行搜索的所有目录的列表。例如:想要导入模块my_pi,需要把命令放在脚本的顶端:
my_pi.py源码如下:
# 割圆求π
# 获取正2N边形长度
def get_n(n):
# 正6边形边长等于圆的半径,假设圆的半径为1,则边长也为1
if n == 6.0:
print("L6 = 1.0")
return 1.0
else:
a = n / 2
result = math.sqrt(2 - math.sqrt(4 - math.pow(get_n(a), 2)))
print(r'内接正' + str(n).replace('.0', '') + r'边形边长 = ' + str(result))
return result
# 获取π
def get_pi(n):
return n * get_n(n) / 2
在my_module模块中导入,就可以使用了:
import my_pi
# 获取π
print(r'π = ' + str(my_pi.get_pi(384*8*8)))
运行结果如下:
L6 = 1.0
内接正12边形边长 = 0.5176380902050416
内接正24边形边长 = 0.2610523844401031
内接正48边形边长 = 0.13080625846028635
内接正96边形边长 = 0.0654381656435527
内接正192边形边长 = 0.03272346325297234
内接正384边形边长 = 0.01636227920787303
内接正768边形边长 = 0.008181208052471188
内接正1536边形边长 = 0.004090612582339534
内接正3072边形边长 = 0.0020453073607051096
内接正6144边形边长 = 0.00102265381399354
内接正12288边形边长 = 0.0005113269236068993
内接正24576边形边长 = 0.0002556634639747083
π = 3.1415926453212157
一个模块只会被导入一次,不管你执行了多少次import。这样可以防止导入模块被一遍又一遍地执行。
当我们使用import语句的时候,Python解释器是怎样找到对应的文件的呢?
这就涉及到Python的搜索路径,搜索路径是由一系列目录名组成的,Python解释器就依次从这些目录中去寻找所引入的模块。这看起来很像环境变量,事实上,也可以通过定义环境变量的方式来确定搜索路径。搜索路径是在Python编译或安装的时候确定的,安装新的库应该也会修改。
from…import 语句
Python的from语句让你从模块中导入一个指定的部分到当前命名空间中,语法如下:
from modname import name1[, name2[, ... nameN]]
例如:my_pi.py模块中,添加了两个函数,get_standard_pi
、get_simple_pi
源码如下:
# 割圆求π
# 获取正2N边形长度
def get_n(n):
# 正6边形边长等于圆的半径,假设圆的半径为1,则边长也为1
if n == 6.0:
print("L6 = 1.0")
return 1.0
else:
a = n / 2
result = math.sqrt(2 - math.sqrt(4 - math.pow(get_n(a), 2)))
print(r'内接正' + str(n).replace('.0', '') + r'边形边长 = ' + str(result))
return result
# 获取标准pi
def get_standard_pi():
return 3.1415926
# 获取简单Pi
def get_simple_pi():
return 3.14
# 利用割圆方法获取π
def get_pi(n):
return n * get_n(n) / 2
错误示例
在模块my_module中,这次只导入get_standard_pi函数。导入get_standard_pi,仍调用my_pi.get_pi(),则会报错NameError,代码如下:
from my_pi import get_standard_pi
# 获取π
print(r'π = ' + str(my_pi.get_pi(384*8*8)))
运行结果:
Traceback (most recent call last):
File "F:/python_projects/17my_module.py", line 13, in <module>
print(r'π = ' + str(my_pi.get_pi(384*8*8)))
NameError: name 'my_pi' is not defined
原因是:由于from my_pi import get_standard_pi
,这个声明不会把整个my_pi模块导入到当前的命名空间中,它只会将my_pi里的get_standard_pi函数引入进来。而实际调用时,调用的get_pi()
,所以提示:NameError: name 'my_pi' is not defined
,my_pi未定义。
正确示例
在模块my_module中,这次只导入get_standard_pi()函数。导入get_standard_pi,仍调用my_pi.get_standard_pi(),代码如下:
from my_pi import get_standard_pi
# 获取π
print(r'π = ' + str(get_standard_pi()))
运行结果:
π = 3.1415926
From…import* 语句
把一个模块的所有内容全都导入到当前的命名空间也是可行的,只需使用如下声明:
from module_name import *
这提供了一个简单的方法来导入一个模块中的所有项目。然而这种声明不该被过多地使用,此处也不再举例。
深入理解模块
每个模块有各自独立的符号表,在模块内部为所有的函数当作全局符号表来使用。所以,模块的作者可以放心大胆的在模块内部使用这些全局变量,而不用担心把其他用户的全局变量搞污染。
在一个模块(或者脚本,或者其他地方)的最前面使用 import 来导入一个模块,当然这只是一个惯例,而不是强制的。被导入的模块的名称将被放入当前操作的模块的符号表中。
例如:上面例子中的
import my_pi
这样做并没有把直接定义在my_pi
中的函数名称写入到当前符号表里,只是把模块my_pi
的名字写到了那里。
还有一种导入的方法,可以使用 import 直接把模块内(函数,变量的)名称导入到当前操作模块。比如:
from my_pi import get_standard_pi
这种导入的方法不会把被导入的模块的名称放在当前的字符表中(所以在这个例子里面,my_pi这个名称是没有定义的)。
这还有一种方法,可以一次性的把模块中的所有(函数,变量)名称都导入到当前模块的字符表:
from module_name import *
这将把所有的名字都导入进来,但是那些由单一下划线_开头的名字不在此例。大多数情况, Python程序员不使用这种方法,因为引入的其它来源的命名,很可能覆盖了已有的定义。
这也是三种导入方式的重要区别。
__name__
属性
一个模块被另一个程序第一次引入时,其主程序将运行。如果我们想在模块被引入时,模块中的某一程序块不执行,我们可以用__name__
属性来使该程序块仅在该模块自身运行时执行。
基于此,设计如下实例进行验证:
我们创建2个模块:my_name.py
、18name.py
,模块名分别:my_name
、18name
;在18name
模块中导入my_name
模块。
其中my_name.py
源码如下:
# 定义一个测试函数
def name_test():
if __name__ == '__main__':
print('A: __name__ is __main__')
else:
print('B: __name__ is ', __name__)
18name.py
源码如下:
# 导入my_name模块
import my_name
# 调用my_name模块中的name_test函数
my_name.name_test()
运行模块18name
,运行结果如下:
B: __name__ is my_name
修改:my_name.py
源码如下:
# 定义一个测试函数
def name_test():
if __name__ == '__main__':
print('A: __name__ is __main__')
else:
print('B: __name__ is ', __name__)
# 在本模块中调用定义好的测试函数
name_test()
运行模块my_name
,运行结果如下:
A: __name__ is __main__
说明: 每个模块都有一个__name__
属性,当其值是'__main__'
时,表明该模块自身在运行,否则是被引入。
提示:__name__ 与 __main__ 底下是双下划线, _ _ 是这样去掉中间的那个空格。
包
通过前面的学习,我们已经知道,在解决和其他人的模块同名时,我们引入了包。此时,模块的名字就变成了:包名.模块名
。
注意:
目录只有包含一个叫做__init__.py
的文件才会被认作是一个包,主要是为了避免一些滥俗的名字(比如叫做 string)不小心的影响搜索路径中的有效模块。
最简单的情况,放一个空的 __init__.py
就可以了。当然这个文件中也可以包含一些初始化代码或者为(将在后面介绍的) __all__
变量赋值。
注意当使用from package import item
这种形式的时候,对应的item既可以是包里面的子模块(子包),或者包里面定义的其他名称,比如函数,类或者变量。
import语法会首先把item当作一个包定义的名称,如果没找到,再试图按照一个模块去导入。如果还没找到,恭喜,一个ImportError
异常被抛出了。
反之,如果使用形如import item.subitem.subsubitem
这种导入形式,除了最后一项,都必须是包,而最后一项则可以是模块或者是包,但是不可以是类,函数或者变量的名字。
从一个包中导入*
使用形如from package.xxx import *
时,Python会做哪些事情呢?
Python 会进入文件系统,找到这个包里面所有的子模块,一个一个的把它们都导入进来。
但是很不幸,这个方法在 Windows平台上工作的就不是非常好,因为Windows是一个大小写不区分的系统。
在这类平台上,没有人敢担保一个叫做 ECHO.py 的文件导入为模块 echo 还是 Echo 甚至 ECHO。
(例如,Windows 95就很讨厌的把每一个文件的首字母大写显示)而且 DOS 的 8+3 命名规则对长模块名称的处理会把问题搞得更纠结。
为了解决这个问题,只能烦劳包的作者提供一个精确的包的索引了。
导入语句遵循如下规则:
如果包定义文件__init__.py
存在一个叫做__all__
的列表变量,那么在使用from package import *
的时候就把这个列表中的所有名字作为包内容导入。
作为包的作者,可别忘了在更新包之后保证__all__
也更新了啊。你说我就不这么做,我就不使用导入*这种用法,好吧,没问题,谁让你是老板呢。
例如:我们项目中有一个登陆包,包名:login
。
如上图,在
company_project/login/__init__.py
中包含如下代码:__all__ = ["abc", "cde", "xyz"]
这表示当你使用
from company_project.login import *
这种用法时,你只会导入包里面这三个子模块。
如果 __all__
真的没有定义,那么使用from company_project.login import *
这种语法的时候,就不会导入包 login 里的任何子模块。他只是把包company_project.login和它里面定义的所有内容导入进来(可能运行__init__.py
里定义的初始化代码)。这会把 __init__.py
里面定义的所有名字导入进来。并且他不会破坏掉我们在这句话之前导入的所有明确指定的模块。
通常我们并不主张使用*
这种方法来导入模块,因为这种方法经常会导致代码的可读性降低。不过这样倒的确是可以省去不少敲键的功夫,而且一些模块都设计成了只能通过特定的方法导入。
记住,使用from Package import specific_submodule
这种方法永远不会有错。事实上,这也是推荐的方法。除非是你要导入的子模块有可能和其他包的子模块重名。
如果在结构中login
包是一个子包(比如这个例子中对于包company_project
来说),而你又想导入兄弟包(同级别的包,图中没有,假设有个网络请求的network包)你就得使用导入绝对的路径来导入。比如,如果模块company_project.login
要使用包company_project.network
中的模块query
,你就要写成 from company_project.network import query
。
无论是隐式的还是显式的相对导入都是从当前模块开始的。主模块的名字永远是"__main__"
,一个Python应用程序的主模块,应当总是使用绝对路径引用。
包还提供一个额外的属性__path__
。这是一个目录列表,里面每一个包含的目录都有为这个包服务的__init__.py
,你得在其他__init__.py
被执行前定义哦。可以修改这个变量,用来影响包含在包里面的模块和子包。
说明:
这个功能并不常用,一般用来扩展包里面的模块。
小结
本文在学习Python3中模块概念的基础上,通过一些示例来继续学习了模块标准模板、import、from…import 、深入理解模块、__name__
属性、包等知识。