FinTechPHP经验分享

海龟交易算法,实现量化交易(1)数据获取

2016-06-12  本文已影响434人  家鼎

今天看到一篇雪球文章叫海龟交易法

大概思路是通过回看20天的盘中最高和10天内盘中最低,结合前一天收盘价制定的交易策略。

想自己编程试试看。

第一步是取得数据,因为一直用雪球,感觉上可以从雪球上获取数据。于是打开chrome用F12找到雪球日K里面的数据源,和我预期的一致,是JSON格式的。那就好办了,把URL粘贴出来

https://xueqiu.com/stock/forchartk/stocklist.json?symbol=SH600000&period=1day&type=after&begin=1434173957486&end=1465709957486&_=1465709957486

一开始想要用linux shell直接执行wget获取,但发现不行,雪球设置了必须登录才能获取数据。

Linux shell显然是不支持登录后下载的,必须考虑用其他语言实现,找了一圈,php似乎是最简单的,利用CURL包可以模拟浏览器操作。

检查了雪球的登录界面,找到了登录的URL https://xueqiu.com/user/login , 登录需要提供参数,参数名称花了一段时间,一开始直接用username和password,发现不行,于是去截包,发现用手机登录应该是telephone和password,登录代码如下

$curl = curl_init();

$cookie_jar = tempnam('./tmp','cookie');

curl_setopt($curl, CURLOPT_URL,'https://xueqiu.com/user/login');

curl_setopt($curl, CURLOPT_POST, 1);

$request = 'telephone=$phoneno&password=$password';

curl_setopt($curl, CURLOPT_POSTFIELDS, $request);

curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_jar);

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($curl, CURLOPT_HEADER, false);

curl_setopt($curl, CURLOPT_NOBODY, false);

curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);

$content = curl_exec($curl);

print($cookie_jar);

print($content);

Bingo 登录成功>接下来用Curl取刚才的那个URL顺利获得的JSON.

接下来是处理URL动态参数,分析这个URL:https://xueqiu.com/stock/forchartk/stocklist.json?symbol=SH600000&period=1day&type=after&begin=1434173957486&end=1465709957486&_=1465709957486

可以看到前面https://xueqiu.com/stock/forchartk/stocklist.json?symbol=SH600000 这一段大概是取SH600000这个股票,后面的period=1day 就是按天取数据,type=after 默认应该是后复权,begin end 和&_参数看起来像是unix 时间戳。但仔细一看好像后面多了3位数字,不知道是干什么的,试试都加上000看看

于是有了这段代码:

$ts=time();

$start_date=strtotime("-1 week");

$url='https://xueqiu.com/stock/forchartk/stocklist.json?symbol='.$stockno.'&period='.$period.'&type='.$type.'&begin='.$start_date.'000&end='.$ts.'000'.'&_='.$ts.'000';

把这两段代码略作整合,得到了一个function 如下,默认取当前日期一周内的数据。

Function getStock($stockno,$type,$period){

print('printing:'.$stockno);

$curl = curl_init();

$cookie_jar = tempnam('./tmp','cookie');

curl_setopt($curl, CURLOPT_URL,'https://xueqiu.com/user/login');

curl_setopt($curl, CURLOPT_POST, 1);

$request = 'telephone=$phoneno&password=$password';

curl_setopt($curl, CURLOPT_POSTFIELDS, $request);

curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_jar);

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($curl, CURLOPT_HEADER, false);

curl_setopt($curl, CURLOPT_NOBODY, false);

curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);

$content = curl_exec($curl);

//print($cookie_jar);

//print($content);

curl_close($curl);

$curl2 = curl_init();

$ts=time();

$start_date=strtotime("-1 week");

$url='https://xueqiu.com/stock/forchartk/stocklist.json?symbol='.$stockno.'&period='.$period.'&type='.$type.'&begin='.$start_date.'000&end='.$ts.'000'.'&_='.$ts.'000';

curl_setopt($curl2, CURLOPT_URL, $url);

curl_setopt($curl2, CURLOPT_HEADER, false);

curl_setopt($curl2, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($curl2, CURLOPT_COOKIEFILE, $cookie_jar);

$content = curl_exec($curl2);

print_r($content);

return content;

}

getstock('SH600000','normal','1day');

发现可以获取,但数据似乎比预期的要多,但也没什么关系,可能和URL参数的理解有关系,不过没关系,至少第一步获取数据的任务完成了.接下来需要将这些数据存储到数据库中,以便后续的分析和处理。

上一篇下一篇

猜你喜欢

热点阅读