第三节　经验证据

2026年01月15日

版权

第三节　经验证据

一、计量模型设定

考虑到相关数据的可得性和本书的研究目的，下面只对命题1和命题2中土地囤积及住房需求对房价的影响进行了检验，而没有研究房地产企业利润、市场份额和土地利用情况的决定因素。根据（6.1）和（6.2）两式，本书计量方程初步设置为：

其中αi为不可观测的个体效应，由于它不随时间发生变化，在本书中可以代表容积率，p和c分别代表房价和地价，a代表影响房价的住房需求因素，除了前面提到的人口和收入，根据Dipasquale and Wheaton（1994）建立的住房流量存量模型，还包括家庭结构和住房所有权成本（user cost），其中住房所有权成本根据Hendershott and Slemrod（1983）、Poterba（1984）的研究，住房所有权成本uc＝（1－t）（i＋τ）－π＋ξ－g，其中t代表所得税率，i代表抵押贷款利率，τ代表物业税率，π代表通货膨胀率，ξ代表房屋折旧率，g代表房价预期上涨率，考虑到数据的可得性，本书选取了其中的抵押贷款利率和房价预期上涨率^[9]，房价预期采用Case and Shiller（2003）、Malpezzi and Wachter（2005）、况伟大（2008）等的简单自适应性预期，用上一期的房价来表示，这个时候的计量模型可以写成：

上式中income、population、interest、size分别代表收入、人口、利率和家庭结构。由于本书的理论模型一直是建立在寡头垄断的市场结构基础上，因此计量模型中也加入了structure这个变量来反映市场结构对房价的影响。同时加入时间虚拟变量year来控制住房价的时间变动趋势。

为了更好地检验命题1和命题2，特别是本书重点关注的房价对地价弹性的影响因素，本书又加入了囤积土地及其与地价的交叉项、住房需求变量与地价的交叉项，因此本书最终的计量模型为：

其中undevelop1代表囤积的土地。根据（6.1）和（6.2）两式，预期β1，β2，β3，β4，β5应该显著为正。根据命题1土地囤积不影响房价和房价对地价的弹性，β7和β8应该不显著。根据（6.8）式，求出房价对地价的弹性^[10]：

所以

比较难以确定符号的是β6和β11，不同于人口和收入都是只通过住房需求影响房价，利率则是同时影响住房需求和住房供给。利率的提高一方面通过增加购房者的住房所有权成本，导致住房需求降低；另一方面也增加了开发商的资金成本，在其他条件不变的前提下，企业的住房投资意愿降低，导致住房供给减少。前者使房价下降，后者使房价上升，因此最终结果是不确定的^[11]。由于房价变化方向的不确定，导致了房价对地价弹性对利率变化也是不确定的。

二、数据来源与初步统计分析

（一）指标选取

本书选取了2000—2008年中国31个省（区、市）的面板数据，之所以选择省（区、市）的数据，是因为目前只有各省（区、市）有包括当年待开发土地面积、购置土地面积和完成开发土地面积在内的，与土地相关的各种统计指标，为本书估算土地囤积数量提供了参考，而城市的只简单统计了当年土地购置面积。本书中所有与房地产相关的数据如房价、地价、当年待开发土地面积、购置土地面积、完成开发土地面积、房地产企业数等都来源于各年的《中国房地产统计年鉴》，而收入、人口、家庭结构等宏观数据都来源于各年的《中国统计年鉴》，利率则来源于中国人民银行官方网站。指标的具体情况如下。

（1）房价。采用各省（区、市）当年商品房销售额除以商品房销售面积，单位：元／平方米。

（2）地价。采用各省（区、市）当年的土地购置费用除以土地购置面积，单位：元／平方米。

（3）收入。选取的是反映居民实际购买能力的城镇居民人均可支配收入，单位：元。

（4）人口。选取的是各省年底总人口数，单位：万人。之所以未选取更符合实际的城镇人口数，是因为该指标在选定样本期间数据缺失严重^[12]，为了尽可能使用平衡面板而采用了前者。而现在农村居民进城打工买房，在城市定居也不在少数，所以该指标也比较能够反映住房需求的变化。

（5）利率。由于还贷需要很长一段时间，与张涛等（2006），史永东、陈日清（2008）一样，本书采用的是五年以上的金融机构人民币贷款基准利率，如果一年之内央行调整了贷款利率，则按照段忠东、曾令华（2008）的处理方法，根据新老利率实施时间进行了加权平均，单位：%。

（6）土地囤积。目前各种年鉴中都没有土地囤积数量的统计，在现有统计中与之最密切相关的指标是待开发土地面积。根据1999年4月28日颁布的《国土资源部闲置土地处置办法》，国有土地有偿使用合同或者建设用地批准书未规定动工开发建设日期，自国有土地有偿使用合同生效或者土地行政主管部门建设用地批准书颁发之日起满一年未动工开发建设的都视为闲置土地。上一年闲置的待开发土地再加上当年购置土地中还没有来得及开发的，这两部分可以认为是在现有统计口径下所能找到的对土地囤积最好的测度。因此可以用如下公式计算土地囤积：

土地囤积之所以除以建成区土地面积，是为了消除由于各地区国土面积不同所造成的影响。由于这个时候计算出来的2002年的河北省、2001年的黑龙江省、2003年的四川省和2008年的西藏自治区分别为－0.12%、－0.026%、－0.088%和－0.56%，负数在这里是没有经济学意义的，所以统一将这四个观测值都取0，认为当年上述地区不存在土地囤积，单位：%。

（7）市场结构。由于是地区层面的数据而不是企业层面的数据，本书无法计算市场集中度、Herfindahl指数这些通常测度市场势力的指标^[13]，因此采用的是况伟大（2008）中使用的房地产企业数作为反映市场结构的代理变量，单位：个。

（8）家庭结构。这里采用的是每户家庭的平均人数，单位：人／户。

（二）变量统计分析

为了消除物价水平变化带来的影响，本书采用的房价、地价、收入、利率都是根据城市居民消费价格指数平减为以2000年为基期的实际值。表6.1给出了上述变量的描述性统计。

表6.1　变量的描述性统计

从表6.1可知，过去几年间我国的实际利率一直处在一个比较低的水平，2005年以后通货膨胀加剧，虽然2006年下半年以来央行多次提高人民币基准利率，但是由于赶不上物价水平上升的速度，我国很多地方出现了“负利率”。乔海曙和陈志强（2009）认为这种负利率通过成本约束、财富效应、房价预期三个渠道，对房地产市场需求和房价产生了强烈的扩张效应。人口和收入等经济基本面因素在过去几年间也有了很大的增长，这些都是促进我国房地产市场迅速发展的主要力量。但是从其分别高达2 634.7万人和3 402元的标准差来看，我国经济发展的严重不均衡也决定了房地产价格十分严重的区域差异（梁云芳、高铁梅，2007）。家庭规模在各省（区、市）各年都比较稳定，说明“三口之家”目前是我国家庭的主要构成模式。

下面本书着重分析房价、地价和囤积土地三个核心变量，为此画出了这三个变量各省（区、市）的时间趋势变化图。从图6.5、图6.6、图6.7三幅图的整体走势看，随着时间的推移，房价、地价和囤积土地的比例都是越来越大的，但是他们之间的关系也不完全一致：房价和地价最高的北京市，其囤积土地的比例并不是很高，平均不过1.83%，最高也不过只有2004年的2.45%。而房价和地价比较低的重庆市，其囤积土地的比例是最大的，平均高达3.98%，最低的2004年都有3.62%。

图6.5　土地囤积各省（区、市）的时间趋势变化图

图6.6　房价各省（区、市）的时间趋势变化图

图6.7　地价各省（区、市）的时间趋势变化图

图6.8　房地产企业平均产量各省（区、市）的时间趋势变化图

图6.9　房价与囤积土地的散点图

为了进一步证实土地囤积与房价之间没有必然的联系，本书画出了两者的散点图，结果图6.9也说明了囤积的土地数量确实与当年房价没有明显的正相关关系，同时我们也计算了两者的相关系数只有0.22，这些初步证实了命题1中的“大企业囤积土地由于并不真正是作为土地储备，因而并不能平抑房价”，当然更严格的检验还有待于后面计量回归结果。

相比之下，房价与地价的变动关系更一致，房价高的北京市、上海市、广东省、浙江省等地，其地价也高，只是地价变化更剧烈些，特别是2008年的地价明显高出其他年份一大截，这一点从表一中地价的标准差比均值还高也可以看出。为了证实（6.1）式中房价包含有未来地价的上涨预期，我们这里画出了房价对领先一期地价的散点图，从图6.10中明显可以发现两者是正相关的，经计算两者之间的相关系数高达0.80。

图6.10　房价与领先一期地价的散点图

本书一个很重要的结论就是＜0，同样可以用实际数据来验证。对闲置土地中用来生产的比例α，用当年土地开发面积除以上一年待开发土地面积来表示，土地囤积L仍然同前面一样，采用上一年待开发土地面积加当年土地购置面积再减去当年土地开发面积，则可以画出两者的散点图。从图6.11中可以清楚发现，囤积土地中用来生产的比例的对数与囤积土地的对数确实有明显的负向关系，算得两者间的负相关系数为－0.60。

图6.11　闲置土地用来生产的比例与囤积土地的散点图

前面理论模型都是建立在房地产寡头垄断市场结构基础上，对于房地产行业无疑是个垄断市场，但是房地产市场随着房地产企业数量的不断增加就变得更有竞争性了吗？我们不能被房地产企业数量增加的表象所迷惑，认为房地产市场随着企业的不断进入而有向完全竞争市场转变的趋势。事实上，房地产企业数量是受房价、住房需求的急剧上涨而“被增长”的结果。垄断市场的一个最突出特点就是低产高价，如果将各省（区、市）每年房屋竣工面积除以房地产企业数作为房地产企业平均产量，通过图6.8会发现，从整体来看各省房地产企业平均产量大体呈逐年下降趋势，这也跟前面理论模型中所证明的第二期小企业产量比第一期低相符^[14]。这一点在2005年以后表现得更加明显，2005—2008年房地产企业的年均产量分别为9 402平方米、9 174平方米、8 858平方米、7 785平方米，同时也正是房价飞速上涨的几年。房地产企业通过限制产量导致房屋供给不足，是造成这段时间房价持续上涨的一个很重要原因。因此本书认为房地产市场的垄断程度并没有因为房地产企业数量的不断增加而改变，李宏谨（2005）采用1998—2003年中国31个省（区、市）的面板数据估算了房地产市场的Lerner指数，也指出我国房地产市场的垄断程度仍然十分严重，市场竞争环境的改善并不明显，我国房地产市场仍然处于“竞争不足、区域寡占”的市场格局（李伯含，2006）。

三、估计结果

（一）计量方法介绍

待估计的（6.8）式中由于含有因变量的滞后项，属于动态面板模型。对于形如yit＝αi＋yit－1＋βxit＋uit，其中复合残差eit＝αi＋uit，由于因变量的滞后项和复合残差项中都含有不可观测的个体效应αi，使cov（yit－1，eit）≠0，滞后因变量与复合残差相关而具有内生性，这就导致了pool ols和fixed effect估计结果总是有偏的，两者分别高估了和低估了真实值（baltagi，1995）。为此，Arellano and Bond（1991）提出了差分GMM估计，在一阶差分方程中用t－2期之前的因变量滞后项（yi1 yyi2…yit－2）作为因变量一阶差分滞后项Δyit－1的工具变量，得到矩条件E［yit－2（Δyit－ΦΔyit－1）］＝0，t＝3，4…T。这样当N趋近于无穷时，就能够得到Φ的一致估计量。但是其有限样本特性较差，特别是当Φ接近于1时和个体效应的方差var（αi）比var（uit）增加得更快时（Blundell and Bond，1998），因变量滞后项（yi1 yyi2…yit－2）和因变量一阶差分滞后项Δyit－1的相关性非常弱，出现了弱工具变量问题，从而影响了该方法的渐近有效性。Arellano and Bover（1995）、Blundell and Bond（1997）进一步提出了系统GMM估计，它同时运用水平方程和差分方程的信息，用因变量一阶差分滞后项Δyit－1作为水平方程中因变量滞后项yit－1的工具变量，得到了额外的矩条件E［Δyit－1（yit－Φyit－1）］＝0，t＝3，4…T。由于利用了更多的样本信息，Blundell and Bond（1998）、Bond and Windmeijer（2000）利用蒙特卡洛模拟发现在有限样本下，系统GMM比差分GMM更有效。

系统GMM估计有一步和两步之分，由于两步估计的权重矩阵依赖于估计参数，导致两步估计量并不可靠，因此Arellano and Bond（1991）建议采用一步GMM估计，它是一致估计，尽管非有效。本书也采用系统GMM一步估计，并报告异方差稳健性标准差。由于之前的房价越高，会吸引更多开发商进入房地产这个行业^[15]，这会导致以后的开发商在土地市场上竞争越激烈，国家也会通过调高利率来打压过高的房价，因此在估计时本书将地价、房地产企业数、利率及其他变量与地价的交叉项都设置为前定变量（predetermine variable），对应工具变量只出现在水平方程中^[16]，其他自变量则视为严格外生变量同时出现在水平和差分方程中，能够对各种不同类型的内生变量进行灵活处理，这也是动态面板系统GMM估计的一大优势。由于本书只有209个样本，为了避免小样本中工具变量过度带来的偏差，本书利用stata10中xtabond2命令的collapse子选项进行修正，它是对每一个变量的滞后项确定一个工具变量，而不是通常对每一时期每一变量或每一滞后项确定一个工具变量，这样就大大减少了工具变量数。由于本书存在着部分数据缺失，属于非平衡面板，因此使用前向正交离差变换（forward orthogonal deviations）可以最大化参与估计的样本数，从而提高估计系数的有效性（Roodman，2006）。

（二）回归结果及其解释

模型1是根据（6.8）式对所有解释变量进行回归，此时很多变量不显著。经检查发现主要是样本偏小，解释变量过多导致多重共线性比较严重，特别是ln c、ln income以及ln c＊ln income之间高度相关，三者之间的两两相关系数分别为0.82（ln c和ln income）、0.99（ln c和ln c＊ln income）、0.90（ln income和ln c＊ln income）^[17]。在保留本书重点关注的ln c＊ln income情形下，在后面的回归中将lnc和lnincome先后从模型中剔除，分别得到模型2和模型3。上述各模型ar（1）、ar（2）检验结果都表明残差存在一阶自相关，但不存在二阶自相关，同时hansen和差分hansen检验都不拒绝不存在工具变量过度识别的原假设，满足动态面板模型的建模要求。

本书最关注的地价与住房需求的交叉项，其中人口与地价的交叉项符号都为负，与预期相符，只是由于多重共线性的原因，在模型1和模型4中的显著性稍差，但是其t统计量绝对值也都在1.6以上。唯一与预期背离的是收入和地价的交叉项在上面4个模型中都为正，在模型2和模型3中还具有显著性，因此命题2中的房价对地价弹性与住房需求负相关只是部分得到证实，也就是说住房需求越大的地方其地价弹性不一定越低，一个明显的例子就是在第五章第一节分地区估计结果中，东部地区地价弹性最高，接下来才是中部、西部，似乎住房需求大的地方其地价弹性也越高。但是从分城市的回归结果看，大城市的地价弹性却低于中小城市，这里住房需求大的地方又表现了低的地价弹性。如果更进一步考虑细分的六大子市场，虽然住房需求最大的东部大城市有着倒数第二低的地价弹性，但是地价弹性最高的也来自同样住房需求比较大的东部中小城市，所以也很难说房价对地价弹性一定与住房需求负相关，本书的这个土地囤积模型在一定程度上只是对东部大城市，这个住房需求最大的子市场为什么有相对较低的地价弹性作出了解释。其实本书这个理论模型最成功的地方并不是解释上述现象，更重要的意义在于，以土地囤积这个目前房地产企业普遍采取的策略性行为作为切入点，系统地研究了其对房地产市场垄断结构形成的影响以及由此引起的房价变化。有助于对房地产市场有一个更全面和深刻的认识。所以本书无论是在理论还是实证，都以很大篇幅讨论了土地囤积、住房需求以及两者的交互作用对房价的影响。至于影响因素十分复杂不能确定符号的利率与地价的交叉项，在上面4个模型中都没有显著性。(https://www.daowen.com)

土地囤积及其与地价的交叉项与预期一致，在前三个模型中都十分不显著，证实了命题1中的“以投机为主要目的的土地囤积不会影响房价和房价对地价弹性”这一结论。为了更深入研究土地囤积对房价的作用机理，本书对前面提出的土地供应“生产函数渠道”进行了检验，将土地囤积对房价的影响分解成两部分：土地囤积与地价的交互效应和土地囤积与住房供应量的交互效应^[18]。实证研究中为了与土地囤积变量相匹配，住房供应量也采用各省（区、市）当年商品房竣工面积与建成区面积的比重（complete），同样采用系统GMM一步估计，由于前期房价越高，房地产企业就越有可能建造更多的房屋，所以将土地囤积与住房供应量的交叉项也视为前定变量，模型其他设置不变，得到上表中的模型4。本书所关注的土地囤积分别与住房供应量、地价的两个交叉项也都跟预期一致，十分不显著，这更进一步证实了命题1中的相关结论。

模型4中值得注意的是，在前面三个模型中不是很显著的房地产企业数，现在在5%水平上显著。房地产企业估计出来的系数为正，这个跟况伟大（2008）的结论是一样的。从理论上来讲，企业数目越多，市场结构越倾向于完全竞争，价格应该越低。即便房价与房地产企业数之间可能存在着反向因果关系，那么为什么通过将房地产企业数设为前定变量，控制了其内生性的情况下，该符号仍然显著为正呢？这还是源于房地产市场的垄断性，将前面理论模型中房屋产量对需求a求偏导则有：很容易证明2δA－δB＜3δA－2δB，而房地产市场通常是缺乏弹性的，使b＞1。为了证明这点，用商品房销售面积（sale）代表住房需求，考虑到房价在很大程度上是由需求决定的，将房价也设为内生变量，模型其他设置不变，用系统GMM估计了房地产市场的需求函数如下：

因此，房地产市场反需求曲线的斜率b＝1／0.75＝1.33^[19]。Mayo（1981）认为虽然不同学者估计出来的价格和收入弹性有很大差异，但是总体看来收入弹性和价格弹性的绝对值均小1，且随着所有权形式、人口和住房属性而发生变化。高波和王斌（2008）利用我国35个大中城市的面板数据研究了房地产需求弹性的差异性，其结果也显示房地产需求价格弹性总体上缺乏弹性，而收入是富有弹性的，跟本书的估计结果很类似，因此完全有理由相信b＞1。所以这说明房地产企业通过有意识地限制产量使得住房供给小于住房需求的增长，这自然会导致房价的上涨。房地产企业数目与房价显著正相关，恰恰体现了房地产市场低产高价的垄断特性^[20]。

其他控制变量中，房价的滞后期在四个模型中都在1%水平上显著，从几个模型的平均结果来看，上一期房价每上升1%，将会导致当期房价上涨0.75%，这个结果高于况伟大（2008）采用1996—2006年全国31个省（区、市）面板数据估计出来的0.48%，但是低于梁云芳和高铁梅（2006）采用1999年1季度—2005年4季度全国时间序列数据估计出来的0.97%。高房价自回归系数也意味着房价中有很多泡沫成分，市场投机者利用房地产市场中大量存在的信息不对称，通过炒作强化了消费者对未来房价继续上涨的预期，从而促发了市场中的“羊群行为”，以维持房价只涨不跌的“神话”。国外学者中Hamilton and Schwab（1988）、Case and Shiller（1989，1990）、Poterba（1991）等都在实证研究中发现房价运行存在十分明显的正序列相关性，并推断房价中并不包含绝对的理性预期。领先一期的地价在四个模型中也都在5%水平上显著，未来地价每上涨1%，会导致本期房价平均（根据模型1到模型4的均值）上涨0.035%，虽然影响比较小，但是表明开发商在房价的制定中确实考虑到了未来地价上涨的预期。由于多重共线性的关系，当期地价、收入、人口在上面四个模型中都极其不显著。

利率在四个模型中都是显著为正的，即使考虑到利率与地价的交叉项的影响，以F值最高的模型4中的系数为例，＝β6＋β11ln c＝0.073－0.010ln c，在地价的均值处ln c＝6.19，仍然有＝0.011，利率每上升1%，导致全国平均房价上涨0.011%^[21]。况伟大（2010）采用1996—2007年中国35个大中城市的面板数据，利用三阶段最小二乘联立方程估计出了利率增长率对房价增长率的正向关系，只是这个影响不显著。房价与利率之所以在我国表现出较为反常的正相关关系，一个最重要的原因在于利率的内生性。利率作为政府宏观调控的一个重要工具，是由宏观经济形势内生决定的。为了打压房价的过快上涨，抑制通货膨胀，2006年下半年以来明显加快了利率的调整步伐，特别是2007年一年中连续6次加息。由于利率作用有一段时滞，不会立刻起到平抑房价的作用，这才表现为利率和房价的同时上升。但是应该看到2008年全国很多地方房价的增速确实明显放缓。许承明和王安兴（2006）通过构建一个房地产投资行为模型，也证明了在利率内生的情形下，如果银行信贷规模和房地产供给在一定时间内不变，投资者大量资金进入房地产市场，就会导致房价与利率的同时上升。

三、稳健性分析

为了验证本书计量结果的可靠性，接下来有必要做进一步的稳健性分析。本书回归结果的稳健性可能受下面两个因素影响。一方面，是计量上的多重共线性，正如前面指出的那样，ln c、lnincome和ln c＊ln income之间的相关系数非常高，导致在这个比较小的样本中多重共线性很严重，使很多变量都没有预期中的显著性。当时所采用最简单也是最常见的剔除相关系数很高变量的办法，但是在剔除共线性变量的同时可能会导致遗漏变量问题。现在则采用古扎拉蒂（2005）取差分的办法，为了不使模型结构发生很大变化，便于系数前后的比较，本书只是对相关系数很高的ln c、ln income进行差分，差分以后的ln c和lnincome的相关系数只有0.09，这样多重共线性就大大缓解了。由于原来变量都是取的对数，差分以后可以近似看成增长率，仍然具有经济学含义，因此取差分不失为一个既克服多重共线又避免遗漏变量的好办法。

其次是关键变量的测度，本书最关注的土地囤积变量，之前根据的是《国土资源部闲置土地处置办法》，将上一年度待开发土地面积视为闲置土地，但是由于国家在土地违法方面处置不严，导致很多房地产企业土地闲置时间往往不止1年，根据本书最开始提到的廖永林司长在国土部房地产用地专项整治工作新闻通气会上的讲话，有三成闲置土地放了5年以上，广州市有一块闲置土地最长“晒太阳”17年。因此有必要把闲置土地的时间取的更长点，同样根据上述《办法》中规定的“在城市规划区范围内，以出让等有偿使用方式取得土地使用权进行房地产开发的闲置土地，满2年未动工开发时，可以无偿收回土地使用权”，同时考虑到样本因素^[22]，把以前两年度待开发土地面积之和视为闲置土地，这时候土地囤积计算公式为：

土地囤积＝用undevelop2表示，这个时候算出来的土地囤积的均值为2.35%，是之前的约两倍，只有2008年的西藏自治区是负值，因而采用undevelop2相对说来更合理。

表6.3中的模型5和模型6是对表6.2中模型1和模型4中的ln c和ln income进行差分得到的，模型7和模型8是分别把模型5和模型6中的undevelop1换成undevelop2得到的。在模型5—8中d.ln c＝ln c－L.ln c，由于滞后项L.ln c的存在使它与之前的残差项是同期相关的，因而本书估计时将d.ln c设为内生变量，模型其他设置还是不变。本书首先看最关注的地价与收入、人口的交叉项，它们的显著性较之前大大提高，在上述模型中的绝大多数情况都是显著的，符号的方向跟表6.2一样，地价与人口的交叉项还是与预期一致为负，但与收入的交叉项仍然为正，与预期相反。收入的增长率、领先一期的地价也全部具有了显著性，都表现出与房价的正相关关系，与预期相符。地价的增长率虽然在部分模型中为负，但是却极不显著。由于在模型5和模型6中地价和利率的交叉项都具有显著性，这样就便于本书对房价影响因素中最复杂的利率进行分析，以模型整体显著性更高的模型5系数为例：

＝β6＋β11lnc＝0.069－0.009 6lnc，在地价的均值处lnc＝6.19，仍然有＝0.01，利率每上升1%，导致全国平均房价上涨0.01%，跟前面0.011%的结果很接近。

土地囤积对房价的影响情况，无论是采用undevelop1还是undevelop2，土地囤积及其与地价和房屋竣工面积的交叉项在上面四个模型中都是不显著的，这也说明前面的回归结果确实很稳健，由于垄断市场中，房地产企业限制产量和倒买土地的策略性行为，土地供应对房价影响的“生产函数渠道”不畅，导致以投机为目的的土地囤积不会影响房价和房价对地价弹性。

主要有以下三个地方变化比较大：首先，房价的自相关系数进一步提高，模型6中甚至为0.90，显示了房价的上涨预期对房价的强烈影响。其次在表6.2中整体比较显著的房地产企业数，这个时候全部变得非常不显著，而且系数明显变小。一方面固然是由于房地产企业数确实对房价没有多大影响，因为房地产企业数且更多的还是由这些房地产业的发展状况所决定；另一方面就是房地产企业这个指标不能很好地体现房地产市场结构的变化，如前所述，房地产企业数的不断增加并不表示房地产垄断市场结构被打破。最后就是表6.2中四个模型中很不显著的家庭规模，在表6.3中除了模型5不大显著，其他三个模型至少都在10%水平上显著。正的符号表示家庭规模越大，家庭居住条件越紧张，对住房需求也就越强烈，因而促进了房价的上涨。

综上，本书针对当前存在大量土地闲置的现象，建立了一个以投机为主要目的土地囤积模型，证明了房价对地价弹性与住房需求是负相关的，对我国房价对地价弹性的地区差异，特别是经济最发达的东部大城市房地产市场具有较低的地价弹性进行了一定程度的解释。同时，本书还从理论上证明了为什么房价对地价是缺乏弹性的。本书的贡献更主要在于从理论上揭示了囤积土地作为其市场扩张的一个重要手段，使囤积土地的大企业市场势力进一步增强，造成了房地产行业市场集中度的上升。随后采用中国分省（区、市）的动态面板系统GMM方法进行了实证检验，发现作为住房需求代表的人口与地价的交叉项基本显著为负，但是收入与地价的交叉项却基本显著为正，也就是说房价对地价弹性与住房需求负相关并没有完全得到经验证据的支持，这很可能是由于中国幅员辽阔，不同地区经济发展水平差异过大造成的，导致不同省（区、市）、不同城市之间由于住房需求差异过于悬殊所致。

【注释】

[1]转引自陈杰，“揭开地王频出背后的奥秘——基于案例的考察”，http：／／club.ebusinessreview.cn／blog Arhcle－17290.html。

[2]由于房地产业是个资金非常密集的行业，进入壁垒相当高，因而房地产市场是一个高度寡占市场，按照况伟大（2004）、李宏瑾（2005）的测算，1999—2003年我国各省（区、市）房地产市场的勒纳指数平均都在0.5以上，因此为了简化分析结果，在这里把房地产开发市场设为双寡头形式。

[3]现实生活中越是高档楼盘容积率往往越小，这样容积率就是反映房屋质量差异的一个很好指标。

[4]事实上，地价作为房地产企业最大的一项成本，在房价中经常占30%左右的比例。而且更主要的是在容积率给定的情况下，土地数量是决定房屋面积的最重要因素。

[5]土地囤积现象在上市公司表现得更加明显，因为资本市场对房地产上市公司最重要的考核指标就是土地储备。例如原本计划在2008年上市的恒大，在2006年末的土地储备尚不足600万平方米，2007年末则达到了惊人的4 580万平方米。同样碧桂园在上市期间，土地储备面积由2007年4月上市时的约1 900万平方米增加至2009年底的4 150万平方米，这样的大手笔不是每一个房地产企业都能够轻易办到的，本书房地产企业的不对称假设也更符合我国目前房地产市场的实际情况。而理论上假设小企业不囤地，主要也是为了计算方便，如果假设企业B囤地LB，LB＜LA，可以证明并不会改变本书的基本结论。

[6]地价之所以会上涨，是因为相对于房地产市场蓬勃发展对土地产生巨大的引致需求，政府可供给的土地受制于自然因素的限制在短期内总是不足的，前期大房地产企业囤积大量土地更加剧了土地供应的紧张程度，小企业这时就会从竞争对手处买地。

[7]如果只存在一期，由于当期两个企业的成本相同，面临的市场需求也一样，自然产量也一样。企业B正是考虑了第二期市场竞争中的不利，才会在第一期通过减产提价来增加自己的利润。

[8]现实中的情况是尽管房地产企业数越来越多，但是万科、恒大等房产巨头对房地产行业的垄断度却在不断增强，根据最新出版的《2010年中国房地产企业上半年销售排行榜》，万科再次名列销售金额第一，销售面积第二，恒大再次排行销售面积第一，销售金额第二，这种形势已经持续了一年多，来源于2010年7月6日的新浪地产，http：／／dichan.sina.com.cn／zt／2010halfsalesreporf／index／shtml。后面的实证分析由于无法搜集到企业层面的数据，而无法对该结论进行实证检验。

[9]由于实际利率等于名义利率减通货膨胀率，因此两者是高度相关的。同时后面都要根据cpi把名义变量平减为实际变量，为了避免多重共线性，在计量模型中去掉了通货膨胀率。

[10]为了克服异方差，在回归时对除了利率、家庭规模、囤积土地以外的变量都取了自然对数。

[11]虽然绝大多数实证研究都表明房价与利率负相关，如Kau Keenan（1980）、Agarwal and Phillips（1984）、Harris（1989）、Iacoviello（2005）、Elbourne（2008）等，但是Pozdena（1990）和Painter Redfem（2002）等认为金融创新和违规操作使这种负向关系被弱化。Wong等（2003）对1981—2001年中国香港房地产市场研究发现，1997年以后的通货紧缩期利率对房价有正向影响。

[12]2001—2004年的《中国统计年鉴》没有各省城镇人口的统计，虽然在随后出版的《新中国60周年统计资料汇编》中有部分省份该指标的统计，但是数据缺失也很严重，特别是2000—2008年整个吉林省都没有该项统计。而且统计口径也不一致，在其他省（区、市）是城镇人口与农村人口，但是在上海市却是农业与非农业人口。

[13]虽然有房屋造价这一房屋成本的数据，但是根据lerner指数的计算式：L＝pmc／p，由于其中包含被解释变量房价，如果采用该指标作为市场结构的代理变量，那么内生性就很严重。

[14]虽然理论模型中证明的市场总产量会随着时间减少，跟现实中每年竣工的房地产面积不断增加的现实不一致，这主要是理论模型中假设房地产市场始终是双寡头，企业数目前后没有发生变化。而现实中房屋产量的不断增加主要是由于房地产企业数造成的，每个企业的平均产量相反还有所下降，这其实跟本书的理论模型还是不矛盾的。

[15]现实中很多原来不以房地产为主业的企业，在发现房地产行业中的超高利润后都纷纷进入房地产业。2010年国家为了调控房价，国资委让其所属的特大型企业都从房地产业中退出就是一个很好的例子。

[16]如果x为前定变量，根据定义它与当期误差项不相关，而与之前的误差项相关，这样在差分方程中由于dxit与残差项eit－1相关，从而和deit相关，所以前定变量的工具变量只能出现在水平方程中（王志刚，2008）。

[17]在附录中给出了本书主要变量的相关系数矩阵。

[18]由于无法获得市场集中度的相关数据，本书不能通过引入土地囤积与寡头垄断市场结构的交叉项，对土地囤积与房价的间接影响关系检验。

[19]这里之所以采用对数模型，而不是直接采用水平值估计p＝a－bQ这个需求函数，除了为了克服异方差，一个更重要的目的是由于上述模型的单位不一样，比如人口是万人，销售面积是万平方米，而房价是元／平方米，收入是元／人，取了对数以后，单位不同只会影响截距项而不会影响估计系数（伍德里奇，2003）。

[20]虽然本书没有考虑住房空置的情况，但如果考虑到这一点房地产企业通过限制供给提高价格的策略性行为会表现得更明显。

[21]这个值可能会因为利率与地价的交叉项没有显著性而不大准确，但是这也恰恰反映了利率对房价影响的复杂性所导致的结果高度不确定。

[22]动态面板系统GMM估计中，一差分一滞后就减少了两期的样本，因此本书的有效样本是从2002年到2008年31个省（区、市）7年的数据。下面我们将看到取了两年以后，由于本书设置了undevelop2＊ln c作为前定变量，它需要前一期自身值作为工具变量，因此有效样本又往后推一年，这个时候样本继续变小。

第三节 经验证据

第三节　经验证据