导致模型风险的来源有哪些?
首先,我们来介绍模型风险的概念,简单直观地看,模型风险是指我们无法确定所选择的表示数据的模型是否正确,如果模型不正确,预测误差就会显著。
为了更科学地定义模型风险,我们注意到物理学对模型风险不怎么关注。虽然在深层次的哲学上来看,物理科学是假设的并且常常被修订,但很多科学知识还是被认为是高度有效的。没有一个科学家会认为决定火车、飞机运行的物理规律会崩溃,虽然在一个更高的概念层次上可能会有变化。
模型风险概念伴随着复杂产品工程、复杂系统的研究以及统计学习方法的广泛应用进入了科学领域。这是因为,在处理大的产品和诸如经济学这样的复杂系统时,科学开始处理一个本质完全不同的问题。当为诸如金融市场这样的复杂系统建模时,我们可能会遇到以下特征:
研究的现象可能很复杂,因此只能把描述简化,这使一些重要的方面可能会被漏掉。
研究的现象可能存在严重干扰,因而科学实践包括了要从高度干扰的环境中提取少量的信息。
由于并非是自然规律,而是产品行为,研究对象会受不可预测的变化的影响。
在金融计量经济学中,很多误差来源会导致模型错定(虽然我们的考虑范围很广并且用于一般建模过程,我们把分析限制在关于股价和股票收益的模型中)。特别地,金融计量经济学的误差来源包括以下两个方面:
1.实际数据近似随机但看起来具有某种结构。
2.实际数据是由一个随时间变化或随机变化的数据产生过程(DGP)所产生的,而所选择的模型是静态的或是服从一个不同的时间动态性。
种误差的来源——随机数据看起来有某种结构——是因为金融时间序列中存在大量的噪声。因此模型所得到的表面规律实际上仅仅是偶然的结果。金融时间序列如此嘈杂,几乎到了完全随机的程度,这样的事实说明市场为弱式有效市场。金融时间序列中,任何可发现的利润都会被发掘,然后消失,这就是无套利原理。
由于不存在套利机会,股票价格时间序列看起来像随机游走一样,而股票收益序列则接近于一个随机噪声。因此价格对数的基准模型就是一个随机游走过程。另外,由于收益过程是高度相关的,多元股价对数的多变量基准模型是相关的随机游走过程。与基准模型的偏差使得获利策略变得有效。因为在更好的情况下,金融时间序列没有真正的结构(也就是说,数据本来就是随机的),寻找到没有结构的序列是可能的。给出样本容量,统计检验不足以给出充分的证据来证明数据不是随机的。
我们必须过滤掉大量的噪声,这就要求由滤波来处理不确定性。例如,估计多个股票价格的一个无限制的向量自回归模型时,会产生交叉自相关的估计结构,而这几乎完全是错误的:模型系数中存在干扰。第7章中,我们将讨论如何降低模型维数,例如利用动态因素模型,以便得到真的信息。现在我们在模型风险中遇到同样的问题。
另一种误差的可能来源——数据的结构很简单,但是却会有一些未反映在模型中的突然或不可预测的变化(也就是说,数据是由一个随时间变化或随机变化的数据产生过程所生成的),这可能是模型风险最严重的来源了。例如,实际数据可以由一个在给定的一段时期上平稳的DGP来表示,但是经济发生变化时,DGP也发生变化了。如果我们有很多数据并且它们变化十分频繁,那么我们就可以察觉并估计所发生的变化。然而,由于我们通常只有很少的可使用的同类数据,要发现所发生的变化是很难的。模型风险的一个关键来源是:我们基于过去数据样本正确地估计了模型,然而DGP发生了改变,而这种改变没有被察觉。
处理随时间变化的DGP过程的一个方法是引入体制变换模型(见第三章)。然而,体制变换模型并不能完全解决这个问题。实际上,任何体制变换模型都是在过去数据的基础上进行估计得到的。因此,它只能发现在过去时期里相关统计量的变化。如果在这个时期中出现了一次或两次体制变化,模型将无法发现这些变化。我们可以分开研究体制变化的可能性,但当应用于一个体制变化的模型时,其过程非常复杂并且不确定性很大。
上述论述给出了为了减少在模型选择和估计中误差的来源所能采用的技术方法。可行的技术方法总结起来如下:
信息理论,用来评估时间序列的复杂性以及预测时的限制。
贝叶斯模型,它假定模型是某个先验模型的变异。
收缩法,一种不同模型间的平均形式。
随机系数模型,一种对数据集估计的模型求平均的技术。