python数据处理小结

2017-12-18  本文已影响167人  Crystalajj

Python Tutoriol Chinese Version

想要数据类型之间的转换,首先要知道数据是什么类型,可以用type(your_data) 或者isinstance(your_data,data_type_you_think)来判断。具体

读txt文件

txt文件往往不便于数据分析,可以用pandasread_csv()模式读取。

NOTE:

f = pd.read_csv('/your_path/your_filename.txt', delim_whitespace = True)

加载CSV文件的两种方式

加载CSV文件的两种方式

保存与加载csv文件

存为csv文件

可以用to_csv()实现csv文件的转换。
如果想把刚才生成的f存为csv,(默认的分隔符是comma),那么可以如下操作:

f.to_csv('/your_path/your_filename.csv')

参考to_csv()的配置文件


将csv文件读取为数组

数组更方便于数据处理,可以用numpy将csv文件整体读取为一个数组或者矩阵。
numpy,pandas对csv文件进行写操作

my_matrix = numpy.loadtxt(open('/your_path/your_filename.csv','rb'))

简介:

loadtxt(fname, dtype=<class 'float'>, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)

Note:


各种数据类型的转换

超赞总结


获取Series类型值(value)的索引(index)

your_Series[your_Series.values==True/you_want].index

获得多个索引的话可以加上.tolist()得到list类型。
stack overflow上是这么用的,但是在我这里行不通

df.index[df[values==True]].tolist()

获取DataFrame类型值(value)的索引(index)

# create DataFrame
# {}内是值,可以多列,index后是索引
df = pd.DataFrame({'values1':[1,2,3],'values2':[3,4,5]}, index = [1,2,3])
#找到values1=1 & values2=3的索引
a = df[(df.values1==1)&(df.values2==3)].index.tolist()
results

数据整合

有时候需要把很多条数据添加到一个list或者dataframe的数据中进行整合。

list.append()
your_dataframe_data = pandas.concat([your_dataframe_data,add_data],ignore_index=True)

持续更新...

上一篇下一篇

猜你喜欢

热点阅读