[量化交易Backtrader] - 如何规避过拟合
一、回测中的过拟合:隐藏在数据背后的陷阱
过拟合发生在模型过度适应历史数据,以至于在新数据上表现不佳。这就像是为历史数据量身定制了一件衣服,却在新的数据集上穿不进去。
(一)过拟合的常见表现
- 曲线过于完美
- 当在回测报告中看到策略的净值曲线如同一条完美的上升直线,或者夏普比率等指标异常高时,这可能是过拟合的信号。例如,一个策略在过去五年的数据回测中,年化收益率高达50%,夏普比率超过3,这样的完美表现很可能是对历史数据过度拟合的结果。
- 参数过多
- 如果策略包含大量的参数,并且这些参数都是经过反复优化得到的,那么过拟合的风险就会增加。比如,一个策略有10个参数,通过穷举法在历史数据上进行优化,找到一组参数使得回测效果最佳,但这组参数在新数据上可能表现很差。
(二)过拟合产生的原因
- 数据挖掘过度
- 在回测过程中,过度挖掘历史数据的特征,试图找到一些看似有效的模式,但这些模式在新数据上并不成立。例如,根据历史数据的某个特定时间段的