数据库和市场结构

2.数据库和市场结构

我们分析金融市场运行状况的能力受到相关数据可获得性的制约。对市场微观结构的研究一直依赖于获取高频数据和使用信息技术来存储及处理数据集。例如,路透社在HFDF93数据集中列出德国马克/美元意向性现货报价,这些连续报价序列中包含了大量信息。[3]由于这些数据集记录了市场每秒钟的变化情况,因此市场的微观结构或运行详细记录非常重要。对从事这方面研究的人来说,不幸(或者也许是幸运)的是,随着市场的演变,市场之间和不同时期之间金融市场的具体结构形式有很大差异。因此,我们需要研究在多大程度上,实证证据或理论概念可以适用于其他金融市场。随着自动交易的增加,这一问题显得更加重要。正如Domowitz在对运行系统的详细分析(1993年)中所指出的,目前全世界有超过50个自动交易系统。研究人员刚刚开始分析这些交易系统的规则及其影响价格决定和行为的机制。正如我们将在本节后面所分析的,正是这些电子交易系统及其产生的新数据集提供了大部分未来研究的基础。

研究最多的金融市场是纽约证券交易所(NYSE),但该市场具有许多独有特点,使我们很难将该市场与其他市场进行统一分析。纽约证券交易所本质上是一个混合市场,同时具有批量[4]和连续型竞价;有交易大厅和安排大宗买卖的“楼上”交易机制;有限制性的竞价程序和为少数专业人士专门设计的规则。Hasbrouck等人(1993年)和O'Hara(1995年)详细介绍了纽约证券交易所的运行机制。另外,东京证券交易所(TSE)也是一个混合市场,其特点包括有专门交易规则的中介机构、价格限制和强制性交易终止(Lehmann和Modest,1994年)。尽管每一个市场都不相同,但也有一些共同特征。所有集中化管理的交易所都保留有关在交易所完成的交易种类、相关价格、交易数量和交易对手方,以及交易的估计时间。但交易对手方的姓名一般被视为具有私密性和潜在商业敏感性。[5]

在其他集中化管理的市场上,高频数据一般都是近几年才开始发展的。Berkeley期货数据库起始于20世纪80年代初期,该数据库针对芝加哥期货交易所(CBOE)的每一种期货交易序列提供有时间标记的竞买—竞卖报价和交易价格,以及当前股票价格。因为针对某种股票可能有多种期权交易,所以利用该数据库可以对相关资产的变动进行研究,也可以分析卖出和买入期权的不同变化。本文的后面将对使用这类数据库的研究进行更详细分析。美国期货市场的数据甚至更广。几项研究(Fishman和Longstaff,1992年;Chang和Locke,1996年;Smith和Whaley,1996年)都使用了经过计算机处理的交易重建记录(CTR),这些数据由商品期货交易委员会(CFTC)保存。这类数据包括参与每笔交易的大厅交易员身份、每笔交易的合约价格和金额,以及每笔交易背后的委托人。通过这类数据,可以区分大厅交易员的交易种类:为客户、个人账户或其他交易。这些信息使研究人员可以分析具体交易规则对最大期货市场之一的芝加哥商品交易所(CME)的影响。但是,还有许多市场没有这类详细的交易信息。许多公开喊价市场(如期货市场)就属于这种情况,对许多衍生品市场和许多使用批量竞价机制的市场来说,这种情况也很普遍。

对集中化管理的交易所来说,涉及买卖报价(和价差)、每笔交易的价格和金额,以及每笔交易的时间[6]等一般都具有某种程度的准确性。[7]还有其他一些信息对研究市场业绩非常有用,但在很多情况下可能没有。这类信息包括在订单驱动(order-driven)型市场上限制订单的辅助方法,或在报价驱动(quote-driven)型市场上随着订单数量增加,说服做市商接受一个订单所需的价格变化等信息。这类数据可以使研究人员建立一种“合成”需求和供给曲线,以研究市场的“流动性”及“深度”。但目前这类数据还不是普遍存在的。

在非集中化管理的市场(如外汇市场和银行间货币市场)上,目前完全没有提供有关报价或交易量信息的准自动化机制。这些市场的参与者一般都非常清楚当前报价,但这类市场的非银行最终用户(如非银行公司、公共部门机构)一般并不十分了解行情。一些银行提供“意向性”买卖报价信息,而意向性意味着报出这些价格的银行并不承诺一定执行这些价格,只是在一般情况下会执行这些价格。电子“新闻”供应商(如路透社、Telerate、Knight Ridder等)收集这些意向性报价,并在电子屏幕上显示,但这些报价一般并不存档保留。路透社一直帮助和资助一些研究人员(见古德哈特,1989年)在一段有限时间内记录并公布这些意向性报价。Olsen等人开发并公布了一个内容更广的数据库(HFDF93数据库),研究人员可以从该数据库中获得数以百万计的数据点。虽然从研究和解决具体问题的角度讲,该数据库非常有用,但数据库的覆盖面非常有限,而且不包含任何交易情况的信息。

在外汇市场上,有关企业实际报价和交易的数据来源非常有限,而且残缺不全。古德哈特等人(1996年)从路透社的电子经纪系统(D2000-2)中获得了1993年6月某一天的7个小时数据,这些数据涉及公司的报价和交易。Lyons(1995年)从纽约一家大银行得到了一个做市商的有时间标识的数据集,涉及该做市商的德国马克/美元的报价、交易和头寸。另外,他还得到了同一市场上通过一家纽约大经纪商进行交易的价格和金额,这些数据具有时间标识,时间覆盖1992年8月的一周。古德哈特等人(1996年)的结论是,买卖报价时间序列意向性数据集中的主要特点(如重要时点、自相关性和GARCH)与“企业”序列数据非常接近,但“企业”D2000-2序列中的价差特点明显不同。D2000-2序列中的价差平均比较小,而且不同时期变化较大,自相关性更强,而且大部分也不是整数。同样,意向性报价序列的特点使其无法作为交易的良好预测指标。一个明显的结论是,我们需要从非集中化管理和场外交易市场中获得有关“企业”报价和交易的更多和更好的数据。[8]

虽然固定利率、货币、票据和债券市场的交易量远远超过证券市场,而且对宏观经济的重要性可能也更大,但令人意外的是,对这些市场进行深入细致研究的论文非常少。Schnadt(1994年)分析了英国的货币市场,Goodfriend(1983年)、Goodfriend和Whelpley(1986年)研究了美国的货币市场,[9]但对货币市场研究的主要内容仍然是描述性的,而关于债券市场的大部分实证研究仍然与期限结构的分析有关。尤其令人感到意外的是,缺少对(政府)债券市场的微观结构分析,因为已经建立了集中化管理的利率期货市场,这些市场可以提供相关数据。

在自动匹配交易系统领域出现了一个有前途的研究领域。传统的交易方式涉及交易商之间的人际互动,包括在交易所内或通过电话方式,因技术进步而建立的电子交易方式可以不需要这种互动。正如Domowitz(1993年)所说,这种趋势可以被视为衍生品交易所最明显的特点,在这些交易所内,“自1988年以来大约82%自动撮合期货/期权交易都是通过电子方式”。另外,除了两个仅有的例外,1986年以来所有新建立的衍生品交易所都是完全自动化的,而且越来越多的新建股票交易所也具有类似设计。[10]

多数自动撮合交易所使用的规则系统一般都涉及价格、数量、时间、交易商身份、排序方式和深度等数据。但向交易商和外部观察者(如研究人员)传送这些信息却有很大问题。在许多情况下,即使对市场参与者,自动撮合系统都不显示排序情况。例如,法国的Cotation Assitee en Continu(CAC)交易系统有三个层次的信息,但只向经纪商提供报价和交易商身份两类信息(Domowitz,1993年)。对外部参与者和研究人员来说,数据的可获得性更加有限。对某些市场来说,外部系统只能访问数据,而这些数据能否保留(这对时间序列研究具有潜在使用价值)却不清楚。

同样困难的事情是如何解释和评估这些数据。正如前面提到的,有关市场行为的多数现有理论模型都使用某一专家所用方法的变体,这些专家具有在集中化管理交易所工作的经验。在自动撮合交易市场上,目前只有研究人员关注价格形成的演变问题。Glosten(1994年)的分析表明,电子交易系统完全可以与做市商系统进行竞争,这代表我们对其他系统认识的一个重大发展。Domowitz和Wang(1994年)分析了两个计算机化市场的有关定价和相对效率的特点。Bollerslev和Domowitz(1992年)研究了电子清算系统中不同交易规则对波动性的影响[有关对利差影响的分析,见Bollerslev等人(1994年)]。Biais等人(1995年)分析了巴黎限额指令交易所的行为。

我们可以对金融服务机构提供的服务形式差异进行某种比较。在美国证券市场上,对大型交易商来说,普遍情况是在“楼上市场”进行交易。在此市场上,大型交易商实际上是进行事先安排好的交易。Keim和Madhavan(1996年)、Seppi(1992年)等人研究了这些大额交易行为的不同定价行为,这是将高频数据应用于分析结构性问题的一个有趣和重要的例子。也许更令人感兴趣的是对报价驱动与指令驱动市场行为的研究(Pagano和Roell,1990年a、1990年b、1991年、1992年、1996年;Madhavan,1992年;de Jong等人,1993年)。[11]这方面研究所关注的重要问题是,在各种市场环境下相应的价格处理方式使谁受益或吃亏。

即使在相同的交易机制下,对不同的证券来说,交易结果也可能有很大差异。尤其值得注意的是,交易频率比较低的股票价格的定价方式受到越来越多的关注。例如在伦敦证券交易所,最活跃的“alpha”股票的价差平均为1%,而“delta”股票的价差平均为11%。[12]在纽约证券交易所也可以发现类似差异,但程度要低很多。股票的流动性为什么会对价差产生如此大影响是一个有趣的谜。[13] Easkey等人(1996年)研究了此问题,他们使用微观结构模型来估计活跃与不活跃股票在信息公开情况下的交易风险。他们的估计结果表明,交易不频繁的股票面临基于信息交易的概率更高。因此他们认为,较高的买卖价差对补偿做市商交易此类股票所承担的更大风险是必要的。关于这些结论令人感兴趣的问题是,这些结论是基于对做市商看法的估计,而做市商的看法又是基于作者观察到的交易数据。正如本文后面所分析的,从高频数据中获取信息对理解市场行为非常重要,而且如何认识不同市场结构也是未来研究中的一个重要课题。