Python数据科学程序员我爱编程

Python数据科学(八)- 资料探索与资料视觉化

2018-05-22  本文已影响94人  一只写程序的猿

传送门:

1.叙述性统计与推论性统计

1.叙述性统计

1.我们一般有三种方式进行叙述性统计

select * from tb1 where col1 >= 100 limit 3

2.如何操作数据

import pandas_datareader

pandas_datareader.DataReader(name, data_source=None, start=None, end=None, retry_count=3, 
                                    pause=0.001, session=None, access_key=None)

2.进行读取相关数据

丘老师是使用pandas_datareader.DataReader来读取的雅虎提供的阿里巴巴股票数据,现在雅虎已经被弃用。这里我使用Tushare来读取金融数据。
Tushare是一个免费、开源的python财经数据接口包。

import tushare

# 获取大盘指数实时行情列表
df = ts.get_index()

# 查看后五行
df.tail()

备注:返回值说明
# 查看列
df.columns

1.做一些简易的统计

# 取得最低开盘点位,最低收盘点位
df[['open', 'close']].min()

2.取得整体叙述性统计

df.describe()
均值,标准差,最大值,最小值等等

3.计算当日大盘指数当日涨跌次数

df['diff'] = df['close'] - df['open']
df['rise'] = df['diff'] > 0  # 涨
df['fall'] = df['diff'] < 0  # 跌
可以看到多了差额、涨、跌三列
df[['rise', 'fall']].sum()
上一篇 下一篇

猜你喜欢

热点阅读