python 编程技巧(一)

2018-01-05  本文已影响16人  你常不走的路

如何在字典,列表,集合中 筛选数据

运行在ipython中

常规 filter 列表解析

# 如何在列表,字典,集合中根据条件筛选数据?
from random import randint

# 常规
data = [1, 2, 34, 56, -1]
x = []
for v in data:
    if v > 0:
        x.append(v)
print(x)

# filter
data = [randint(-10, 10) for _ in range(10)]
timeit filter(lambda x: x >= 0, data)

#列表解析
timeit ([x for x in data if x>= 0])

#对于字典筛除某些元素
d={x:randint(60,100) for x in range(1,21)}
{for k,v in d.items() if v >90}

#集合筛选 data 是上面的数据
s = set(data)
{for x in s if s % 3 ==0 and s!=0}

如何为元组中的每个元素命名,提高程序可读性

以学生信息 为例


student = ('jim',16,'male','x@x.com')
#name
student[0]
#age
student[1]
#sex
student[2]
#可读性很差  所以我们可以使用
name,age,sex,email = range(4)
这样我们插叙 就可以使用
student[name]  #可读性就高了

还可以利用namedtuple

from collections import namedtuple
Student = namedtuple('Student',['name','age','sex',email'])
s = Student('jim',16,'male','x@x.com')
s2 = Student(name='jim',age=16,sex='male',email='x@x.com')
#name
s.name
#age
s.age
isinstance(s,tuple) #他们两个是一个类型

这里是使用了 collections 中的namedtuple 命名元组
这样也行

如何统计序列中的元素的出现额度?

dict.fromkeys()

from random import randint
data = [randint(20) for _ in range(30)]
#创建字典  使用data中的每一个元素作为key 值为0
c = dict.fromkeys(data,0) 
for x in data:
    c[x] +=1
#遍历data中所有的值 然后 每遇到一个值 就在c[x]中进行加一

如果要查询 出现频率最高的值 我们就可以使用更好的方法

Counter and most_common

from collections import Counter
c2 = Counter (data)  #也是一个字典 但是它直接做了 c的事,直接做了词频统计   c2 跟c 是一样的
c2.most_common(3)  #出现频率最高的三个元素 非常简单好用

文本文件 词频统计

#在网上随便找一篇 英文文章 保存本地来使用
from collections import Counter
import re
txt = open('son.txt'),read()
c3 = Counter(re.split('\W',txt))  #进行频率统计
c3.most_common(10)  #查询最高频率的十个单词

对字典进行排序

方法1 sorted

#对学生成绩进行排序  字典 对应一个学生名 一个成绩
from random import randint
s = {x:randint(60,100) for x in range('xyzabc')}  #这样就得到了6个小朋友的成绩
#使用sorted排序  如果直接使用sorted
sorted(s) #那么只会比较  xyzabc 这些 不会比较 后面的成绩
#因此我们需要 把 字典变为元组  (95,‘a’) 这样的形式 就可以进行比较了 
#使用zip方法
c = zip(d.values(),d.keys())  #如果不成功就在zip 前面加上 list()  同样在py2 中可以使用itervalues来更好
sorted(c) #这样就进行排序了

方法二 sorted key的用法

s.items() #直接得到 元组 但是 这个元组是 ('a',95) 名字在前 所以我们还需要 sorted中有一个key方法
sorted(s.items(),key= lambda x:x[1])  #这里的x[1] 就是比较 元组索引位  1 的值 就是 成绩
上一篇下一篇

猜你喜欢

热点阅读