《超越技术分析》 作 者:图莎尔·钱德
而且控制超过20个变量的过程是相当困难的。同样,也极少有过程是基于4个或更多变量之间的相互作用。较高次数的相互作用通常是意义不大的。我们的目标是使规则的总数量尽量少。
在设计系统时使用较大数量的变量存在很多隐患。第一,变量规则相对重要性随着规则数目的增加而降低。第二,自由度随着变量和规则数目的增加而降低。当规则和变量的数目增加时,需要更多的数据来测试,以便得到准确的结果。第三,是在做曲线拟合测试时,所选样本数据带来的风险。例如,给定一组数据,一个带有两个变量的线性回归便足以拟合该数据。当回归分析中的变量数目增加时,比如说7个,那么所得曲线与所给数据更加接近了。所以在做曲线拟合时,我们在所给数据中捕捉了更多的细微变化,这些价格模型在未来可能永远都不会重复出现。对于简单的线性回归,自由度下降了2,但对于多项式回归,自由度却下降了7。
这些思想可以从下面的例子中看出来,使用线性回归去拟合标准普尔期货合约1995年12月的收盘数据。该组数据从1995年8月1日开始到1995年12月13日 结束,共有95个交易日。对于相同的数据我们画出了两条回归线:图2.1所示是一个简单的线性回归;图2.2使用
图2.2使用最高5次幂的线性回归分析标准普尔500收盘数据。
多项式回归加入了更高次的多项式,最高次数达到了5次 。当较高次数的项被加入时,回归曲线变得更加弯曲,我们在数据当中捕捉到 了更多的细微变化。
为了简化起见,日收盘数据被从1~95编号,记作D。 图中的 C (比如C1)代表常数。Est Close是利用回归分析估算的收盘价格。
表2.2列出的是有关曲线拟合数据的几条有趣的特点。第一,常数C0的值对于每一个方程来说都是近似的。这意味着最简单的线性回归模型,常数C0,已经抓取了数据当中的实质性信息。
其次,注意这些常数的绝对值随着项次数的增加而减少。换句话说,C0的绝对值比C1要大,C1的绝对值比C2要大,依次类推。所以,较高次数项的相对作用变得越来越小。但是当你加入高次多项式时,曲线更加接近所给的数据,如图2.1和 图2.2。
该示例展示了许多重要的思想。首先,你为数据所建立的任何
模型都应该尽可能地简单。在这种情况下,简单的线性回归,具有斜坡和交叉,抓住了数据中所有重要的信息。其次,添加复杂的高次项(规则)的确增加了曲线对数据的拟合度。于是,当我们建立更加复杂的模型时,我们在数据当中捕捉到了更多的细微信息。这些细微信息在将来会重复出现的可能性非常之小。再者,我们建立模型的目的是描述价格在测试区间上是如何变化的。使用我们的数据来直接计算线性回归系数,那么,我们的模型是源自所给数据。 没有理由表明这些系数会准确地描述任何未来的数据,这就意味着任何过度拟合的交易系统都不可能在将来表现良好。
另一个例子,是移动平均交易系统的一个改进版本,解释了为什么要限制规则的数量。通常情况下,双移动平均系统只有两条基本规则。例如;对于做多入场,3日均线应该向上穿越65日均线 , 反之亦然。
现在,我们来看一个使用多于两条平均线的变化版本。例如 , 如果3日均线和4日均线都在65日均线之上时在收盘价买进。既然有两条 “ 短期的 ” 均线,这使我们有了四条规则,两条用于做多、 两条用于做空。使用越来越多的 “ 短期 ” 均线可以使得规则的数目快速增加。例如,如果3日 、4日 、5日 、6日 和7日均线都应该在65日均线之上时才做多入场,那么就增加了10条规则。
我们来看一下瑞士法郎10年连续合约数据,从1985年1月1日 到1994年12月31日 ,没有任何初始止损,但考虑了100美元的滑移价差和 佣金。规则的数目从2条到128条不等,以便研究规则数目的增加对系统的影响。随着规则数目的增加,交易数目减少,如图2.3所示。这意 味着当增加规则的数目时,我们需要更多的数据来做可靠性测试。
【版权声明】
本文仅代表作者观点,不代表本站立场。Fx263.com对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证,且不构成任何投资建议,请读者仅作参考,并自行承担全部风险与责任。Fx263.com作为信息内容发布平台,页面展示内容的目的在于传播更多信息,不代表Fx263.com立场;本站会员及自媒体人所发的稿件所载明的信息与本网无关,如文章涉及版权,请联系本站处理。
【风险提示】
请通过正规渠道参与外汇保证金交易。目前通过网络平台提供、参与外汇保证金交易均属非法。请提高意识,谨防损失!外汇、贵金属和差价合约(OTC场外交易)是杠杆产品,存在较高的风险,可能会导致亏损您的投资本金,请理性投资。