金融学中高频数据的研究日程

6.金融学中高频数据的研究日程

获取和分析高频数据的能力为我们提供了进一步了解金融市场的巨大潜力。正如本项调查所明确的,现在可以讨论的问题范围非常广泛,而且我们现在完全有可能认为,目前的分析不久就会被视为金融“黑暗时代”的神秘遗产(arcane relics)。但我们也必须承认,这些新数据提出的问题比回答的问题还要多,而且如果对这些问题没有某种解决方案,则高频数据提供的价值就非常有限。研究人员和金融从业人员的任务是从大量数据中找出最重要的基本面,这些基本面决定市场和资产价格的变化。我们已经提出了一些与使用高频数据相关的问题,但显然还有许多我们没有提到的问题。但即使在这有限的框架内,已经包含了几个关键问题,我们现在就将注意力转到这几个关键问题上。我们的目标是建议在哪些领域进行深入研究可以获得较高收益。

分析高频数据的最重要难题是我们不了解交易的基本理论结构。正如我们已经讨论的,分析股票市场时一般使用的范式是强调私人信息的作用,而且是将价格形成过程的模型构造成是由信息灵通的交易商、信息不灵通的交易商和做市商共同参与交易博弈的结果。对外汇市场的分析重点一直与公共信息有关,而且一般是使用经济计量方法而不是结构性模型来进行实证检验。在这种方法中,交易商的异质性发挥着重要作用,但并没有明确这种异质性源于何处,以及为什么和如何影响价格。

这些方法提供了研究市场行为的有价值途径,但它们的局限性也同样明显和突出。具有私人信息的模型不足之处是必须假设信息到达是外生变量,这样才能明确信息事件的时间点。在Glosten和Milgrom(1985年)、Kyle(1985年)的模型中,是假设某一信息事件发生,然后交易使价格达到真实水平。他们的模型没有考虑如下可能性,即新信息可能在上述调整完成之前到达,或信息事件实际上是随机的。这里的难点是,如果存在掌握不同信息的信息灵通代理人,则交易和执行价格都具有信息含义。但到目前为止开发的学习模型还不能解决这种双重不确定性的问题。虽然学者们为了避免这一问题而假设私人信息在每笔交易后被公开披露(见Madhavan和Smidt,1993年;Admati和Pfleiderer,1988年),但一般来说这一特征并不具有吸引力。

也许分析公共信息的问题更严重。目前的信息灵通交易商的范式并不适合分析这一问题,而且分析一般来说都不涉及正规模型。几乎没有关于交易商的异质性如何影响交易行为的分析,或进一步讲如何影响价格、收益或波动性等市场变量的分析。目前还没有行为最优化理论或实证研究的框架来分析为什么会出现某些规律。虽然经济计量分析提供了有趣的方法,但如果没有某些基础经济解释,则很难理解实证的相关性。

如果能在高频率交易环境下更深入地分析代理人面临的学习问题,则可能取得成果。即使对最偶然的观察家来说,交易商从观察市场中学习也是显而易见的事情,但什么方式传递最重要信息,或什么决定“市场感觉”,甚至是什么市场变量触发交易商进行交易的愿望等,都不容易看到。确定市场统计作用是理解这一过程的第一步,但这又会测试我们更深入认识信息一般如何影响交易的能力。这一点目前也没有做到。

也许一个比较简单的出发点是分析如下有趣的实证研究结果,即公共信息发布对某些市场几乎没有影响。例如对外汇市场来说,公共信息当然是最基础性的,但实证研究还不能揭示其预期影响。为什么会出现这种情况当然也是一个需要今后研究的问题。获取高频数据的能力可能会提供某种答案,目前我们可以在会计方面的研究中看到有关这样做为什么有用的简要介绍。会计研究传统上分析企业的公共信息如何影响股票价值。高频数据的发展使我们可以进行日间“事件研究”,在这种研究中要分析信息公布几小时后的影响。具备更多外汇交易数据可以促进外汇市场上的类似研究。这使我们有可能研究如下重要问题:各个地点交易的市场反应如何不同?信息如何在市场之间传递?政府或中央银行的政策公布是否在不同国家或不同市场有不同影响?

正如我们已经全面分析的,市场数据的实证分析已经提出了许多有关市场的难以回答的问题。在这些问题中最令人困惑的问题是波动性。虽然波动性的一般特点仍然难以捉摸,但也许有关波动性的实证研究所揭示的最有意思的特点是其长期持续性。这种行为引发了寻找完美GARCH模型的研究,其热情几乎与寻找耶稣圣杯一样,但仍然没有回答为什么这种波动持续性会长期存在这一基本问题。我们推测,在研究这一问题方面,分析高频数据的能力可能特别有用,部分是因为这提供了深入了解较长(交易时间)的时间序列数据特点的机会。

但可能同样有用的是分析相关市场和不同市场之间波动性的能力。尤其是,波动性显然是衍生品市场的驱动因素,而且对波动性研究的主要兴趣是源于可以明确应用到衍生品定价和交易当中。衍生品的高频数据,加上现货市场交易的类似数据可能会使研究人员从几个方面对波动性进行分析。

上述介绍的研究中存在一个严重不足,即缺乏对固定收益产品市场微观结构问题的研究。尽管这些市场规模很大也很重要,但目前实际上还没有对其从实证或理论角度进行微观结构分析。我们推测主要原因是缺少足够数据,市场分散的特点使我们很难进行集中化数据收集。尽管如此,在外汇交易数据库开发方面取得成功的技术因素也有助于衍生品市场的数据收集。鉴于目前研究工作的缺失状态,即使是小规模的研究也会引起很大兴趣。

但在我们评述所提出的所有问题中,也许最重要的是如下简单问题:在转向频率越来越高的数据观察值后,我们对市场的分析会有什么收获。就数据问题而言,虽然大家会自然想到“更多总是比较好的”,但这一观点并不一定永远正确。收集、保持和整理高频数据集目前仍然很昂贵。高频观察值还受到大量特殊因素的影响,如非同步交易、日间季节性效应、因买卖价差或报告困难而产生的度量误差,甚至是概念性问题,如在一个没有发生交易的周期内如何定义“收益”等。

对我们来说,有两个研究问题显得尤其重要。第一,在不同抽样规则下,数据集的特点会有什么差异?正如我们已经提到的,当分析市场的微观行为时,时间问题会更重要。但如果按每分钟,或每5分钟,甚至是每小时一次选取的数据观察值都具有相同的统计特征,则在分析所有问题时,可能就没有必要对每秒数据进行分析。类似情况是,如果在基础真实价值的总体变化中,日间数据的季节性特点除噪音外没有反映其他问题,则选择较低频率的样本区间可能就很好了。但如果不能更好地了解数据处理的详细情况,则不可能知道抽样数据是否会造成很大差异。我们相信,解决这一问题将在金融分析中使用和理解高频数据集方面迈出重大一步。

第二,也是相关的问题是,在未来开发高频数据集方面我们希望包括什么信息?技术进步已经将此问题从无根据的遐想转变为现实的必要性,但回答这一问题需要进行认真思考和研究。当然,非常诱人的结论是,我们应当包括“所有”信息,由研究人员根据其特定研究题目从中进行挑选。[36]但到底什么是“所有数据”?正如近期研究所表明的,向市场传递的信息不仅仅涉及价格问题,交易量、时间、订单、交易商身份、相关市场变动,所有这些都曾表现出是理解市场变化的重要因素。很可能的情况是,一些我们甚至没有考虑到的信息也许对解释市场行为非常关键。开发新的和更加完善的数据集才可能确定这些信息,这又将我们带回到如何设计数据集才能使我们掌握最佳手段来分析决定市场行为的各类信息的问题。