python 编程技巧(一)
2018-01-05 本文已影响16人
你常不走的路
如何在字典,列表,集合中 筛选数据
运行在ipython中
常规 filter 列表解析
# 如何在列表,字典,集合中根据条件筛选数据?
from random import randint
# 常规
data = [1, 2, 34, 56, -1]
x = []
for v in data:
if v > 0:
x.append(v)
print(x)
# filter
data = [randint(-10, 10) for _ in range(10)]
timeit filter(lambda x: x >= 0, data)
#列表解析
timeit ([x for x in data if x>= 0])
#对于字典筛除某些元素
d={x:randint(60,100) for x in range(1,21)}
{for k,v in d.items() if v >90}
#集合筛选 data 是上面的数据
s = set(data)
{for x in s if s % 3 ==0 and s!=0}
如何为元组中的每个元素命名,提高程序可读性
以学生信息 为例
student = ('jim',16,'male','x@x.com')
#name
student[0]
#age
student[1]
#sex
student[2]
#可读性很差 所以我们可以使用
name,age,sex,email = range(4)
这样我们插叙 就可以使用
student[name] #可读性就高了
还可以利用namedtuple
from collections import namedtuple
Student = namedtuple('Student',['name','age','sex',email'])
s = Student('jim',16,'male','x@x.com')
s2 = Student(name='jim',age=16,sex='male',email='x@x.com')
#name
s.name
#age
s.age
isinstance(s,tuple) #他们两个是一个类型
这里是使用了 collections 中的namedtuple 命名元组
这样也行
如何统计序列中的元素的出现额度?
dict.fromkeys()
from random import randint
data = [randint(20) for _ in range(30)]
#创建字典 使用data中的每一个元素作为key 值为0
c = dict.fromkeys(data,0)
for x in data:
c[x] +=1
#遍历data中所有的值 然后 每遇到一个值 就在c[x]中进行加一
如果要查询 出现频率最高的值 我们就可以使用更好的方法
Counter and most_common
from collections import Counter
c2 = Counter (data) #也是一个字典 但是它直接做了 c的事,直接做了词频统计 c2 跟c 是一样的
c2.most_common(3) #出现频率最高的三个元素 非常简单好用
文本文件 词频统计
#在网上随便找一篇 英文文章 保存本地来使用
from collections import Counter
import re
txt = open('son.txt'),read()
c3 = Counter(re.split('\W',txt)) #进行频率统计
c3.most_common(10) #查询最高频率的十个单词
对字典进行排序
方法1 sorted
#对学生成绩进行排序 字典 对应一个学生名 一个成绩
from random import randint
s = {x:randint(60,100) for x in range('xyzabc')} #这样就得到了6个小朋友的成绩
#使用sorted排序 如果直接使用sorted
sorted(s) #那么只会比较 xyzabc 这些 不会比较 后面的成绩
#因此我们需要 把 字典变为元组 (95,‘a’) 这样的形式 就可以进行比较了
#使用zip方法
c = zip(d.values(),d.keys()) #如果不成功就在zip 前面加上 list() 同样在py2 中可以使用itervalues来更好
sorted(c) #这样就进行排序了
方法二 sorted key的用法
s.items() #直接得到 元组 但是 这个元组是 ('a',95) 名字在前 所以我们还需要 sorted中有一个key方法
sorted(s.items(),key= lambda x:x[1]) #这里的x[1] 就是比较 元组索引位 1 的值 就是 成绩