Day20 - 2018-04-22
2018-04-22 本文已影响0人
谁共我醉明月
在 Python 中处理数据时,使用NumPy 和 pandas这些库已经成为了行业标准。
pandas 提供了read_csv方法直接将一个csv读取到dataFrame里,还有很多有用的方法帮助我们快速了解数据。df.head()列出数据的前5行,df.columns会返回数据所有的列名,df.describe()会计算出数据中可计算列的一些数学特征值(数量、平均值、标准差、最小值、25%、50%、75%处的值以及最大值),df.info()则会列出所有列的数据类型以及非空值的数量。
排序
df.sort_values可以对dataFrame排序,这里有相关文档可以参考
df.value_counts()可以返回一个包含值和该值出现次数的Series对象,次序按照出现的频率由高到低排序.。这里有相关文档