Python股票数据分析(tushare/seaborn)
python版本:3.4
最近在学习基于python的股票数据分析,其中主要用到了tushare和seaborn。tushare是一款财经类数据接口包,国内的股票数据还是比较全的,官网地址:http://tushare.waditu.com/index.html#id5 。seaborn则是一款绘图库,通过seaborn可以轻松地画出简洁漂亮的图表,而且库本身具有一定的统计功能。
导入的模块:
import matplotlib.pyplot as plt
import seaborn as sns
import seaborn.linearmodels as snsl
from datetime import datetime
import tushare as ts
代码部分:
股票收盘价走势曲线
<code>sns.set_style("whitegrid")</code>
end = datetime.today() #开始时间结束时间,选取最近一年的数据
start = datetime(end.year-1,end.month,end.day)
end = str(end)[0:10]
start = str(start)[0:10]
stock = ts.get_hist_data('300104',start,end)#选取一支股票
stock['close'].plot(legend=True ,figsize=(10,4))
<code>plt.show()</code>

同理,可以做出5日均线、10日均线以及20日均线
stock[['close','ma5','ma10','ma20']].plot(legend=True ,figsize=(10,4))

股票每日涨跌幅度
stock['Daily Return'] = stock['close'].pct_change()
stock['Daily Return'].plot(legend=True,figsize=(10,4))

核密度估计
sns.kdeplot(stock['Daily Return'].dropna())

核密度估计+统计柱状图
sns.distplot(stock['Daily Return'].dropna(),bins=100)

两支股票的皮尔森相关系数
sns.jointplot(stock['Daily Return'],stock['Daily Return'],alpha=0.2)

多只股票相关性计算
<code>stock_lis=['300113','300343','300295','300315`] #随便选取了四支互联网相关的股票</code>
<code>df=pd.DataFrame()</code>
closing_df = ts.get_hist_data(stock,start,end)['close']
df = df.join(pd.DataFrame({stock:closing_df}),how='outer')```
```tech_rets = df.pct_change()```
<code>snsl.corrplot(tech_rets.dropna())</code>

简单地计算股票的收益与风险,衡量股票收益与风险的数值分别为股票涨跌的平均值以及标准差,平均值为正则说明收益是正的,标准差越大则说明股票波动大,风险也大。
```rets = tech_rets.dropna()```
<code>plt.scatter(rets.mean(),rets.std())</code>
```plt.xlabel('Excepted Return')```
<code>plt.ylabel('Risk')</code>
```for label,x,y in zip(rets.columns,rets.mean(),rets.std()):#添加标注
plt.annotate(
label,
xy =(x,y),xytext=(15,15),
textcoords = 'offset points',
arrowprops = dict(arrowstyle = '-',connectionstyle = 'arc3,rad=-0.3'))```
