Python

Effective Python 学习笔记 1

2019-08-01  本文已影响0人  coder前行

Effective Python 学习笔记 1

PEP 8规范

命名

  1. 使用下标获取列表元素、调用函数或者给关键字参数赋值时,不在两旁加空格
  2. 函数、变量及属性应该用小写字母来拼写,个单词之间下划线相连
  3. 受保护实例属性以单个下划线开头:_protect_var
  4. 类与异常,以每个单词首字母大写形式命名:ClassName
  5. 模块级别的常量,采用全部大写字母方式命名,单词之间下划线连接:ALL_CAPS
  6. 类中实例方法(instance method),应该把首个参数命名为self,以表示该对象自身
  7. 类方法(class method)的首个参数应该命名为cls,以表示该类自身

语句

  1. 不要不要通过检测长度的办法(如 if len(somelist) == 0)来判断somelist是否为[]''等空值,而是采用if not somelist这种写法来判断,它会假定:空值将自动评估为false
  2. 不要编写单行的ifforwhileexcept语句,应该分开书写以示清晰
  3. import语句应总是放在开头
  4. 引入模块时,总是使用绝对名称,而不是根据当前面模块路径来使用相对名称:from bar import foo
  5. 如果一定要引用相对名称,采用from . import foo的格式
  6. import语句应该按顺序划分成三个部分,分别表示标准库模块第三方模块以及自用模块,在每个部分中import语句应该按照模块的字母顺序排列

bytes、str与unicode的区别

  1. Unicode字符转换成二进制数据就必须使用encode方法

  2. 二进制数据字符转换成Unicode就必须使用decode方法

  3. 实现:

    def to_str(bytes_or_str):
        if isinstance(bytes_or_str, bytes):
            value = bytes_or_str.decode('utf-8')
        else:
            value = bytes_or_str
        return value
    
    def to_bytes(str_to_bytes):
        if isinstance(str_to_bytes, str):
            value = str_to_bytes.encode('utf-8')
        else:
            value = str_to_bytes
        return value
    
  4. 编写程序时,一定要把编码和解码操作放在界面外围来做。程序最核心的部分应该使用Unicode字符类型,而且不对编码做任何假设。这种方法既可以令程序接受多种类型的文本编码(如Latin-1Shift JISBig 5),又可以保证输出的文本信息只采用一种编码形式(最好是UTF-8

  5. open函数添加了名为encoding的新参数,默认值为utf-8,这就要求再写入时必须传入unicode字符的str实例,而不接受二进制数据的bytes实例。解决方法:采用字符写入模式wb,读取采用rb,如:

    with open('file.txt', 'wb') as f:
        f.write(os.urandom(10))
    

用辅助函数取代复杂的表达式

'''
    eg. 需求:查询字符串
'''

from urllib.parse import parse_qs
    my_values = parse_qs('red=5&blue=0&green=', keep_blank_values=True)
    print(repr(my_values))

>>> {'red': ['5'], 'blue': ['0'], 'green': ['']}

# 方法一:用get方法在my_values字典中查询不同参数
print('RED:     ', my_values.get('red'))
print('GREEN:   ', my_values.get('green'))
>>> RED:       ['5']
    GREEN:     ['']     #无法将空值输出为0

#方法二
green = int(my_values.get('green', [])[0] or 0)
print('GREEN:   %r' % green)
>>> GREEN:   0  #表达式复杂,不易理解

# 总结辅助函数
def get_first_int(values, key, default=0):
    found = values.get(key, [''])
    if found[0]:
        found = found[0]
    else:
        found = default
    return found

green = get_first_int(my_values, 'green')

总结

  1. if/else表达式会比用orand这样的Boolean操作符更清晰

了解切割序列的办法

基本写法

somelist[start:end]

  1. 如果从头切片,将start留空,而非写0. end同理
  2. 在源列表进行切割之后,会产生一份全新的列表。系统依然维护着指向原列表中各个对象的引用。
  3. 在赋值时采用切割操作会改变原列表:a[2:7] = [1, 2, 3]
  4. 单词切片操作内不要同时指定startendstride
  5. 反转字符串:```re = str[::-1]
  6. 第五条只对ASCII字符有效,对已经编码成utf-8字符串的Unicode字符无效
上一篇 下一篇

猜你喜欢

热点阅读