我爱编程

安装 pandas 筛选数据

2018-01-17  本文已影响0人  Weiyx

conda install pandas

pandas 可以很好分析数据

删除第一列

awk '{$1="";print $0 >outname}' text

 两个文件,按照一个文件中的某一列筛选另一个文件中的数据

# -*- coding: utf-8 -*-  

import pandas as pd  

#input.csv是那个大文件,有很多很多行  

df1 = pd.read_csv('A.csv', encoding='gbk')  

#input1.csv是那个小文件,其中他们有一行或者若干行存储的特征参数相同  

df2 = pd.read_csv('B.csv', encoding='gbk')  

#加encoding=‘gbk’是因为文件中存在中文,不加可能出现乱码  

index = df1[u'汉字井号'].isin(df2['well'])  

outfile = df1[index]  

outfile.to_csv('outfile.csv', index=False, encoding='gbk')

sed -i '1i\要添加的内容' yourfile

上一篇下一篇

猜你喜欢

热点阅读