大数据部落互联网证券量化交易

用R语言实现简单的交易回测

2015-02-09  本文已影响10498人  siloes

一、R代码实现。

用google在网上搜索到的回测语句都大同小异,下面给出一个示例,改编自:量化策略回测

# 以S&P500为例,其雅虎代码为^GSPC;我们要计算5日均线指标的函数就是SMA(),

# 先载入需要的扩展包
> library(quantmod)
> library(PerformanceAnalytics)

# 先获取S&P500的交易数据,然后根据其收盘价(由函数Cl()抽取)计算其5日均线值:
> getSymbols('^GSPC') #S&P500 OHLC data
> close <- Cl(GSPC)
> mv5 <- SMA(close, 5)

# 策略是当收盘价大于5日均线,代表可以入市,取1,否则代表清仓,取0。(-1是代表卖空,不适用。)
> sig <- ifelse(close < mv5, 1, 0)

# 使用Lag()将信号序列向“过去”推迟一天,代表将昨天的信号,应用到今天。
> sig <- Lag(sig) #将该序列向“过去”延迟一天

# 计算收益序列
# discrete代表用离散方式计算当天收益率,即(Close-Close(-1))/Close(-1)
# continous代表用连续方式计算当天收益率,即ln(Close/Close(-1))
> roc <- ROC(type='discrete',close) 
> ret <- roc * sig

# 画出策略收益图
> charts.PerformanceSummary(ret)

# 最上面的板块是积累收益,相当于对cumprod(1+ret)的绘图;
# 第二个是日收益,相当于对ret原始收益数据的绘图;
# 最下面的是下跌图(又称“水下图”),将下跌成分独立绘出,有助于我们分析亏损状况和研究弥补措施。
回测示意图

以上需要注意的地方是制定策略的语句

> sig <- ifelse(close < mv5, 1, 0)
# 当收盘价大于5日均线时,sig取1,否则取0。

在网上公布的代码当中,有的是取-1,这里-1代表卖空,不是清仓,得到的结果是不对的。

二、excel模拟。

当初得到这个结果的时候我很怀疑,用几条R语句就把量化策略及结果模拟出来了?看上去这么神奇,结果对不对呢?我在excel里对该策略进行模拟:

以上面的策略为基础,细化得到的交易方案是这样的:

  1. 当股票收盘价格高于五日均线,且无持仓,那么第二天满仓入市。
  2. 当股票收盘价格高于五日均线,且满仓,那么第二天继续持仓。
  3. 当股票收盘价格低于五日均线,且无持仓,那么第二天继续空仓。
  4. 当股票收盘价格低于五日均线,且满仓,那么第二天全部平仓。

为了简化计算,假设以前一天的收盘价作为成交价:即以前一天的收盘价满仓入市,或以前一天的收盘价全部平仓。当然这可以在进一步的研究中细化,但这里我们只是为了演示,就不过于复杂了。

excel表格里得到的结果如下:

CLOSE SMA sig ROC ROC*sig 股票 现金 总收益
1994-1-3 5.6 0 1 1
1994-1-4 5.55 0 1 1
1994-1-5 5.65 0 1 1
1994-1-6 6.1 0 1 1
1994-1-7 6.25 5.83 0 1 1
1994-1-10 6.45 6 1 0.032 0.032 1.032 0 1.032
1994-1-11 6.15 6.12 1 -0.047 -0.047 0.984 0 0.984
1994-1-12 6.15 6.22 1 0 0 0.984 0 0.984
1994-1-13 6.25 6.25 0 0.016 0 0 0.984 0.984
1994-1-14 6.1 6.22 0 -0.024 0 0 0.984 0.984
1994-1-17 6 6.13 0 -0.016 0 0 0.984 0.984
1994-1-18 6.2 6.14 0 0.033 0 0 0.984 0.984
1994-1-19 6 6.11 1 -0.032 -0.032 0.952 0 0.952
1994-1-20 6 6.06 0 0 0 0 0.952 0.952

由于是取5日平均,所以5日平均值SMA从第5个交易日开始出现。这几天的资产都是现金,总收益为1。

从第6个交易日开始,通过判断收盘价与5日均线之间的大小,得到交易信号sig,注意,这里的sig是滞后一日的,代表前一天的收盘价与5日均线之间的相对大小。

  1. 1994-1-10 close>SMA,sig=1,以前一天的收盘价6.25满仓入市,当天收盘价为6.45,日内收益率为0.032,股票价值1.032,现金为0,总资产价值为1.032。

  2. 1994-1-11 close>SMA,sig=1,鉴于前一天已入市,继续持仓,当天收盘价为6.15,日内收益率为-0.047,股票价值0.984,现金为0,总资产价值为0.984。

  3. 1994-1-12 close>SMA,sig=1,继续持仓,当天收盘价为6.15,日内收益率为0,股票价值0.984,现金为0,总资产价值为0.984。

  4. 1994-1-13 close<SMA,sig=0,以前一天的收盘价6.15全部清仓,股票价值为0,现金为前一天的股票价值0.984,总资产价值为0.984。

此时,经历了一次持仓以及清仓之后,投资者手里只拥有现金资产,总资产价值为0.984,亏损0.016。

通过对比excel计算的ret(ROC*sig)与R代码计算的ret,两者的结果完全一致。

通过用excel对以上回测策略的模拟,可以发现以上回测策略的隐含前提:

(1) 入市价格和清仓价格均为前一天的收盘价。

(2) 入市则全部满仓,离市则全部清仓。

三、神秘的charts.PerformanceSummary()函数。

在R代码中,一条charts.PerformanceSummary()语句,画出在该策略下,对应股票的总资产收益,日收益和下跌图。它就像一个神奇的黑箱,给我们以策略是否有效以最直观的图形表示。但光有图形还不够,这三条曲线分别对应哪些数据,能不能分别导出方便进一步研究呢?

  1. 总资产收益。

    对应的是excle表格当中的总收益,直观表示了应用该策略,投资者总资产在回测时间内的增减情况。虽然在excel模拟中用股票、现金、总资产三个条目来代表,但其实用一条R代码就可以实现了:

     cumprod(1+ret)
    

    也就是对(1+ret)的连乘。很容易理解:假设到了第n天,那么这一天的总收益Rn应该等于前一天的总收益R(n-1)乘以当天的收益率,不是ret,而应当是(1+ret)。

    R代码得到的结果与excel是一致的。

  2. 日收益。

    就是R代码当中的ret和excel表格中的ROC*sig。

  3. 下跌图(这部分参考了R包计算回撤)。

    这里只是将下跌成分独立绘出,对应的excel数据也是ROC*sig,但这里的下跌图经过了整理。对应的R函数有:

    a)chart.Drawdown:下跌图,也就是charts.PerformanceSummary()的第三张图。

     data(edhec)
     chart.Drawdown(edhec[,c(1,2)], main="Drawdown from Peak Equity Attained", legend.loc="bottomleft")
    

    b)findDrawdowns:返回回撤的起始时间,时间间隔,回撤数值,常与sortDrawdowns连用找最大回撤。

     data(edhec)     
     findDrawdowns(edhec[,"Funds of Funds", drop=FALSE])     
     sortDrawdowns(findDrawdowns(edhec[,"Funds of Funds", drop=FALSE]))
    

    c)maxDrawdown:返回收益时间序列的最大回撤。

     data(edhec)
     t(round(maxDrawdown(edhec[,"Funds of Funds"]),4))
    

    d)table.Drawdowns:返回最差回撤的统计量表格。

     data(edhec)
     table.Drawdowns(edhec[,1,drop=FALSE])
上一篇下一篇

猜你喜欢

热点阅读