1.导论

1.导论

金融市场在营业时间内是以连续和高频率的方式运行。但实际上,市场有关活动的所有数据集都是基于离散的样本,而且是以较低(通常是非常低)的频率获得的。例如,每个工作日,在路透社的外汇交易显示屏上平均大约有4500个德国马克/美元的即期汇率报价;但多数对外汇市场的研究是基于每天或每周的一个代表数值抽取价格。高频数据集的出现结束了这种不一致性问题。在一些市场上,现在具有以秒计算的数据,所以实际上可以掌握价格、数量、交易规模和深度的连续观察值。在本文,我们提出有关高频数据集的使用、分析和应用的一些重要问题。

数据集传统上频率较低和不连续的一个原因是由于收集和分析的成本。一般来说,只有形成个人之间(法律)债务关系的行为才会被记录下来,如一笔涉及用现金购买股票的交易。而且即使在这种情况下,由此形成的审计记录通常也只保留较短时期。电子技术的发展使数据收集成本大幅度下降,向实际地域上分散的读者实时传递“消息”的成本也显著下降。这些因素都改变了市场结构。例如,伦敦股票交易所现在的交易方式是交易商通过电子屏幕来了解信息,同时仍按照个人间通过电话的方式进行交易。目前越来越明显的趋势是,这种人际间交易得到电子交易的帮助,过去10年里自动化交易快速增长的情况就印证了这一点。交易的这类结构性变化对高频数据的可获得性和解释都有重要影响,我们在第二节将讨论这些问题。

连续时间序列数据集的可获得性也提出了如何处理一个本身是时变过程的问题。东京午餐时的外汇市场在许多方面与正常亚洲交易时间有很大差异;美国东部时间早上8∶30(美国新闻发布时间)与其他时间不同。如何处理这些差异没有明确的答案。例如,我们是否应当使用不同的标准系统,即将业务(性质不同)按相同数量划分,而不是仅仅按照时间进行线性划分?如果基础随机过程在不同时间内并不稳定,那么样本内容是否反映了市场的动态性质?我们在第三节将分析这些问题。

这些问题也是第四节内容的基础,在第四节我们将回顾和分析有关(连续)金融市场过程统计特点的研究。除了寻找非线性特征外,本领域的另一个主流热点是分析这些市场的时变波动性,通常是使用种类繁多的ARCH/GARCH模型。幸运的是,最近Bollerslev等人(1992年)对此广阔的领域进行了回顾,因此我们将仅限于回顾与连续时间市场数据相关的研究。目前多数实证研究仍然以描述性为主,分析报价和交易频率的相关性、报价与交易价格修正、价格波动性和价差之间的相关性。实证结果与理论之间有比较密切关系的一个领域是对股票市场专业人士的分析。多数研究偏重于研究做市商如何从交易商那里获得信息,以及这种做法又会如何影响价格和报价。不幸的是,现有的外汇报价数据是意向性而不是确定的价格,而交易数据实际上是不存在的。另外,有关报价和价差修正理论的重点一直是研究单个做市商,而没有“涉及”最容易获得的买卖报价。一般来说,买卖报价一直由不同的做市商给出。这种情况使我们在选择分析这些高频数据集的最好方法时面临许多问题。

另一个重要问题是,高频数据是否可以揭示对市场效率的限制,并因此提供一种从交易中(合法)获得超额收益的方法。这种观点认为,金融市场会表现其复杂性和非线性变化的特点,这表明事前检验(如单位根等)可能无法揭示更复杂的临时相关性。最近的研究综合了非线性关系研究和使用了其他预测技术[如神经网络(neural network)分析],以及对交易规则潜在盈利性的研究。仍然需要进一步分析的是,交易规则之间是否存在明确关系,通过技术分析和数据中所表现出的少量非线性特点是否能够实际证明存在这种关系。高频数据集的一个明显优势是,它们可以提供检验混沌(chaos)(即确定性非线性系统)是否存在的充足基础。目前的证据显示,虽然资产市场价格表现出非线性,但这些价格变化是非混沌的。

第五节将分析不同市场之间的相互关系,以及价格变化如何在地理上相关的市场之间进行传递,或在各个市场的相关资产(如期货和现货,期权和现货,利率和汇率)之间进行传递。捕捉套利机会可能需要非常迅速的行动。因此,只需要分析最高频率和连续时间序列数据,人们就可能观察到市场之间的短暂相互关系,这些市场正是通过这种套利建立起相互关系的。通过提出一些需要进一步研究的问题,本文的最后一节(第六节)将得出一些结论性意见。