量化 | 基础框架(上)
2021-08-30 本文已影响0人
opcc
炒股系列开篇已经简单介绍过量化分析,一套基本的系统需要数据、策略、回测系统三个部分组成。它的流程就是获取数据,由于数据基本都是时间序列的,所以回测系统就需要按周期做数据切片,然后喂给策略,策略反馈买卖点,回测系统记录模拟交易过程及剩余资金,最后计算一些评价指标。下面就来分别介绍这三部分。
数据
数据获取的途径很多,但质量也参差不齐,目前我对数据的要求还不是很高,所以也没觉出好坏。去年我用的Tushare的数据,它这个平台做得已经不小了,后又推出了Pro,但部分数据需要积分,要么社区活跃,要么捐款。今年用的AKShare,网上说学术研究用的比较多。它的数据其实也是来自其它网站的,只不过做了接口整合。
其实股票软件上的数据也能导出,只不过不能全部导出,需要手动一部分一部分来弄。当然可以考虑破解二进制数据文件,或者用桌面自动化处理股票软件,我不太会,就没弄。AKShare的接口已经很简单了,返回的数据默认是Pandas的DataFrame格式,方便处理和分析。
import akshare as ak
#股票历史日数据,后复权
stock_zh_a_daily_hfq_df = ak.stock_zh_a_daily(symbol="sz000002",start_date='20201103',end_date='20201116',adjust="hfq")
print(stock_zh_a_daily_hfq_df)`</pre>