二、研究设计
旅游目的地竞争力影响因素的因子分析主要依据的是针对国内游客的问卷调查所收集的数据,因而本部分有必要首先介绍一下调查过程的安排、调查问卷的编制思路、样本选择情况以及拟采用的主要的数据处理方法等内容。
(一)调查过程的安排
如前文所述,本研究拟包含两个阶段的问卷调查:针对旅游业内人士的问卷调查与针对国内游客的问卷调查。其中,针对旅游业内人士的调查仅仅是为精简变量从而编制针对国内游客的调查问卷而服务的,或者说,可以将针对旅游业内人士的调查看作是针对国内游客的问卷调查的前测研究,后者才是本次研究的核心所在。
通过针对旅游业内人士的调查结果得出针对国内游客的预试问卷,在此基础上安排一次小规模的预测试以检验上述得出的预试问卷的信度与效度,并据此做出修正与完善,从而得到针对国内游客的正式问卷。
(二)调查问卷的编制
调查问卷的合理与否直接关系着数据收集的质量,进而影响到相关实证研究结论的科学性与可靠性。本文将参考问卷编制一般逻辑思路(图4-2)编制针对国内游客的调查问卷。
1.问卷编制的基本流程
图4-2 量表编制构建的流程
资料来源:吴明隆.SPSS统计应用实务.北京:中国铁道出版社,2000,10。
图4-2详细描述了调查问卷的编制应该遵循的逻辑思路,其主要包含六个关键环节。
(1)编制预试问卷
预试问卷的编制大体遵循以下步骤:进行文献回顾,明确变量范围;通过专家访谈,确定所要研究的变量;追踪文献,尤其是国内外此类研究常用的成熟量表;形成预试问卷。
在确定相关题项的基础上,还需选择恰当的量表类型。态度量表一般采用Likert式量表。Berdie根据研究经验提出,在大多数情况下5点式量表最可靠,这是因为3点式量表限制了温和意见与强烈意见的表达;而5点式量表恰好可以表示温和意见与强烈意见之间的区别;此外,对于没有足够辨别力的人而言,7点式量表往往容易导致信度的丧失[18]。本文拟采用5点式量表。
(2)预测试
预测试的目的在于初步检验问卷的信度与效度,找出问卷的不足之处并对其做出修正与完善,这是开展正式研究前的必要阶段。
预测试对象的性质要与将来正式调查对象的性质相同。对于预测试样本的大小,一般认为,预测试对象人数以问卷中包括最多题项的“分量表”题项数的3~5倍为原则[19]。此外,预测试样本应该多大才最恰当,也与是否进行因子分析有很大关系,因为在因子分析时,以较大样本分析得出的因子组型(Factor Pattern)比只用较小样本得出的因子组型更加稳定,而且测试题目数量越多,越应包含更多的受试者[20]。还有研究者建议,在进行因子分析时,每个变量的测试题目数量与预测试样本数的比例大约为1:1~1:10之间[21]。Gorsuch认为,在进行因子分析时,题项与受试者的比例最好是1:5,受试者样本总数不得少于100人[22]。
(3)项目分析
项目分析(Items Analysis),又称条目鉴别力分析,其主要目的是针对预试的题目加以分析,以确定它们是否适合作为正式的选题。进行项目分析时,通常有两种方法,一是使用独立样本T检验,一是使用相关法。
就独立样本T检验而言,其做法是求出每个题项的“临界比率(Critical Ratio,简称CR值)”,求法是将所有受试者在预试量表的得分总和依高低排列,得分前25%~33%为高分组,得分后25%~33%为低分组,求出高低两组受试者在每题得分平均数差异的显著性检验(多数分析均以测验得分最高的27%及最低的27%作为高低分组界限)。如果题项的CR值达到显著水平(α<.05或α<.01),即表示这个题项能鉴别不同受试者的反应程度,这是题项是否需要删除首先应该考虑的标准。针对每个题项进行项目分析的步骤是:求出量表总分,按高低进行排列,找出高低分组上下27%的分数,依据临界分数将观察值在量表的得分分成高低两组,以独立样本T检验两组在每个题项上的差异,将T检验结果未达显著的题项删除[23]。就相关法而言,首先将每个受试者分量表的总得分计算出来,然后以题项为单位,计算每一题项与总得分的相关,一般而言,相关系数达到0.4以上为佳[24]。本文的项目分析拟采用独立样本T检验法。
(4)因子分析
Churchill特别强调,在进行因子分析之前需要净化和消除“垃圾测试条目(Garbage Items)”,如果没有净化测试条目就对其进行因子分析,可能导致多维度现象,从而增加每个因子的解释难度。净化测试条目的处理技术是利用题项对维度的更正相关系数(Correct Item-Total Correlation,简称CITC)。Churchill认为,CITC小于0.4,且删除该题项后Cronbach's α值会增加的题项应删除;Cronbach Appha认为,一般情况下,CITC小于0.5时就应该删除该测试条目[25];卢纹岱认为,0.3也可以达到研究的要求[26]。本研究将参照0.4的标准。
然后,通过探测性因子分析(Exploratory Factor Analysis,简称EFA)来检验量表的结构效度。在进行EFA之前,根据KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)值和Bartlett球度检验(Bartlett test of sephericity)来判断样本是否适合进行因子分析;按照特征值大于1以及碎石图拐点原则来确定提取公共因子的数量;按照方差最大法(Varimax)进行旋转,并根据因子负荷标准来对题项做进一步纯化。一般认为,KMO大于0.9非常适合,0.8~0.9很适合,0.7~0.8适合,0.6~0.7不太适合,0.5~0.6很勉强,小于0.5不适合。Bartlett球度检验的统计值显著性小于等于显著性水平时,适合作因子分析[27]。方差最大法旋转后题项的纯化标准为:旋转后因子负荷值小于0.4,或者同时在两个因子上的负荷值大于0.4者删除[28]。
(5)信度分析[29]
因子分析之后进行量表各层面与总量表的信度检验。信度也称为内部一致性,信度分析通常采用Cronbach's α系数检验。对于α系数到底多大才可以接受,目前还没有形成统一认识。一般认为,0.65~0.70之间是可以接受的最低程度,0.70~0.80之间很好,0.80以上非常好[30]。Nunnally则认为,0.70是一个较低但可以接受的量表边界值[31]。
此外,条目删除Cronbach's α系数检验不仅具有Cronbach's α系数检验的效果,而且还能提出一定的量表一致性改进建议。本文将采用Cronbach's α系数与条目删除Cronbach's α系数检验两种方法来进一步改良预试量表。
(6)形成正式问卷
根据上述分析结果,在删除相关题项、确定Likert量表类型、调整题项顺序等的基础上形成正式问卷。
2.针对旅游业内人士的调查问卷的编制
(1)预试问卷的编制
现有文献中涉及旅游目的地竞争力影响因素的模型主要有Crouch&Ritchie模型、Dwyer&Kim模型以及六因素联动模型,其中后两者是以Crouch&Ritchie模型为基础建立起来的,现将其涉及的旅游目的地竞争力的各项影响因素汇总如表4-1所示。
表4-1 旅游目的地竞争力影响因素汇总
(续表)
资料来源:本研究整理。
除以上三个模型系统论述旅游目的地竞争力的影响因素之外,还有一些研究者单独就某种因素对旅游目的地竞争力的影响展开过论述,例如环境管理因素,有效的环境影响管理与环境质量管理有助于旅游目的地竞争力的提升。
综上所述,将目的地管理与目的地政策规划与开发合并为目的地管理,将涉及旅游目的地区位、安全、物价、形象与知名度的外部环境因素以及涉及相关辅助产业情况的内部因素归为限制性与放大性因素(因为整个外部的宏观大环境对于旅游目的地来说属于不可控因素,因而此处不作涉及)。也就是说,我们可以将旅游目的地竞争力的影响因素总结为四个大的类别:核心资源与吸引物因素、辅助性与支持性因素、目的地管理因素以及限制性与放大性因素。各种影响因素的具体情况参见表4-2。
表4-2 旅游目的地竞争力影响因素分类
资料来源:本研究整理。
预试问卷题项的选取主要以Crouch&Ritchie模型、Dwyer& Kim模型以及六因素联动模型为理论依据,并结合其他因素共计96项;经过专家访谈,对这96个题项进行精炼、增添与修正,最后得到由58个题项组成的预试问卷(见附录A)。
预试问卷内容主要包括四大部分,即核心资源与吸引物因素、辅助性与支持性因素、目的地管理因素以及限制性与放大性因素,四大部分分别包含19、14、12、13个题项。本问卷采用Likert 5点式量表,按照各影响因素对旅游目的地竞争力的重要程度进行打分,其中“1”=很不重要,“2”=不重要,“3”=一般,“4”=重要,“5”=很重要。
(2)预测试
针对旅游业内人士的测试样本主要选取旅游专业的研究生、教师、旅游行政管理部门的管理人员、旅游企业的管理人员、一线导游人员以及旅游策划人员,地点主要以天津和济南为主,涉及大连、北京、南京、广州以及昆明等城市,调查时间安排在2006年12月至2007年1月之间。
根据上述提到的“预测试对象人数以问卷中包含最多题项的“分量表”题项数的3~5倍”以及“在进行因子分析时,题项与受试者的比例最好是1:5,受试者样本总数不得少于100人”等原则,本次调查通过E-mail共发放问卷200份,回收有效问卷124份,问卷回收率为62.0%。
在124位被调查者中,女性占40.9%,男性占59.1%;年龄主要集中于25~44岁,其中,25~34岁的占20.7%,35~44的占33.1%;受教育程度主要以本科和研究生为主,本科占63.2%,研究生占26.7%;旅游行政管理部门人员25人,旅游企业人员32人,高等院校教师24人,高等院校研究生43人;被调查者从事旅游(研究)的时间多在5~7年之间,也有部分被调查者在10年以上。
(3)项目分析
由于上述问卷共包括四大部分,需要对每个部分分别进行项目分析。其具体做法是:先计算每个被调查者在每个部分上的得分,然后针对每个部分,按照高低顺序取得分最高的33份(124×27%)和得分最低的33份(124×27%),用独立样本T检验来测试高分组和低分组被调查者在每个题项得分上是否存在显著性差异。如果该题项的CR值达到显著水平(P<0.05或P<0.01),即表示这个题目能鉴别不同受试者的反应程度,应该保留该题项,否则就要删除该题项。项目分析的结果参见表4-3。
表4-3 预测试项目分析结果
(续表)
(续表)
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
从项目分析结果来看,本研究所涉及的所有题项均有鉴别能力,均能鉴别出不同受试者的反应程度,所有题项均可保留。
(4)因子分析及其信度检验
①核心资源与吸引物因素
在进行因子分析之前需要借助CITC净化和消除“垃圾测试条目”,核心资源与吸引物因素的CITC及条目删除Cronbach's α系数如表4-4所示,CITC小于0.4的题项有“地方手工艺品”“地方方言”“特色美食”“名胜古迹”“宗教氛围”“城市景观”“重大文体赛事”“会议展览”以及“博物馆”等,这些题项应予以删除,删除之后核心资源与吸引物因素剩余10个题项。
表4-4 CITC与条目删除Cronbach's α系数——核心资源与吸引物因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
本文中因子取舍的标准是特征值大于1,因子负荷大于0.4,对于不符合这一标准的题项将在分析中予以删除。核心资源与吸引物因素剩余的10个题项的KMO和Bartlett球度检验结果参见表4-5,代表样本充分水平的KMO值为0.709,说明样本数量比较充分,超过了因子分析的样本限制条件;Bartlett球度检验的χ2统计值为185.893,其显著性水平为0.000,说明数据相关阵不是单位阵,统计数据具有相关性,适合进行因子分析。
表4-5 KMO和Bartlett球度检验——核心资源与吸引物因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
从按方差最大法(Varimax)旋转后得到的因子负荷矩阵(见表4-6)来看,各指标的因子负荷量均在0.4以上,10项指标均可予以保留。
表4-6 旋转后的因子负荷矩阵——核心资源与吸引物因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
接下来对分量表的信度进行检验,本文的标准是将0.70作为一个较低但可以接受的Cronbach's α系数边界值;如果删除某一题项会导致总的Cronbach's α系数提高,那么删除这一题项。核心资源与吸引物因素10项指标的Cronbach's α以及条目删除Cronbach's α系数如表4-7所示,组成三个公共因子的题项的条目删除Cronbach's α值均小于该公共因子所包含的全部题项的α值,所以不需要删除任何题项。
表4-7 Cronbach's α与条目删除Cronbach's α——核心资源与吸引物因素
(续表)
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
②辅助性与支持性因素
在进行因子分析之前同样需要净化和消除“垃圾测试条目”,辅助性与支持性因素的CITC及条目删除Cronbach's α系数参见表4-8。
表4-8 CITC与条目删除Cronbach's α系数——辅助性与支持性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
如表4-8所示,“人力资源的成本”“旅游教育与培训”以及“旅游企业的活力”三项指标的CITC小于0.4,将其删除之后剩余11个题项。
对剩余的11个题项进行因子分析,其标准是保证所提取的因子特征值大于1,因子负荷大于0.4;对那些不纳入分析会提高Cronbach's α的题项予以删除,以求达到最优化量表的目的。辅助性与支持性因素剩余的11个题项的KMO和Bartlett球度检验结果如表4-9所示。代表样本充分水平的KMO值为0.837,说明样本数量是充分的,超过了因子分析的样本限制条件;表明题项间相关程度的Bartlett球度检验的χ2统计值为365.598,其显著性水平为0.000,说明各题项间是相互关联的,提取公共因子是有条件的。
表4-9 KMO和Bartlett球度检验——辅助性与支持性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
按方差最大法(Varimax)对辅助性与支持性因素的相关变量进行旋转,得到其因子负荷矩阵,参见表4-10。
表4-10 旋转后的因子负荷矩阵——辅助性与支持性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
如表4-10所示,所有题项的因子负荷都超过了0.4。由于B24(行政服务设施)在两个公共因子上的因子负荷均超过了0.4,按照惯例需要将其剔除,剔除B24之后,辅助性与支持性因素共剩余10个题项。
关于信度检验的标准仍是Cronbach's α系数大于0.70;与此同时,如果删除某一题项会导致总的Cronbach's α系数提高,那么就删除这一题项。辅助性与支持性因素10项指标的Cronbach's α以及条目删除Cronbach's α系数如表4-11所示,B31(企业家的创新精神)条目删除Cronbach's α系数大于总的Cronbach's α系数,需要将其删除。删除B31(企业家的创新精神)前后量表的总体信度由0.856变为0.864,量表的总体信度有所提高。此外,组成两个公共因子的其余题项在条目删除后的Cronbach's α值均小于该公共因子所包含的全部题项的Cronbach's α值,所以不需删除其他题项。
表4-11 Cronbach's α与条目删除Cronbach's α——辅助性与支持性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
③目的地管理因素
与前文的分析方法一样,因子分析前后共包含三个步骤:首先是借助CITC和条目删除Cronbach's α系数来对问卷题项进行纯化处理,剔除相关性不强的变量;其次是在计算KMO值、Bartlett球度检验统计值以及显著性水平的基础上,展开因子分析,通过分析因子负荷矩阵进一步删除相关题项;然后是借助Cronbach's α以及条目删除Cronbach's α系数来对量表的信度进行检验。
目的地管理因素的CITC及条目删除Cronbach's α系数可参见表4-12,“人力资源开发”的CITC小于0.4,需要将其删除。接着对剩余的11个题项进行因子分析,其标准仍是因子特征值大于1,因子负荷大于0.4,同时还要对那些不纳入分析会提高Cronbach's α的题项予以删除。
表4-12 CITC与条目删除Cronbach's α系数——目的地管理因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
目的地因素剩余的11个题项的KMO和Bartlett球度检验结果(见表4-13)表明适合进行因子分析。代表样本充分水平的KMO值为0.798,说明样本数量是充分的,超过了因子分析的样本限制条件;表明题项间相关程度的Bartlett球度检验的χ2统计值为231.798,其显著性水平为0.000,说明各题项间是相互关联的,适合进行因子分析。
表4-13 KMO和Bartlett球度检验——目的地管理因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
按方差最大法(Varimax)对目的地管理因素的相关变量进行旋转,得到其因子负荷矩阵(表4-14)。所有题项的因子负荷都超过了0.4,由于C45(危机管理)在两个公共因子上的因子负荷均大于0.4,按照惯例需要将其剔除。剔除该题项之后,目的地管理因素共剩余10个题项。
表4-14 旋转后的因子负荷矩阵——目的地管理因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
目的地管理因素的10项指标的Cronbach's α以及条目删除Cronbach's α系数如表4-15所示,组成三个公共因子的题项在题项删除后的Cronbach's α值均小于该公共因子所包含的全部题项的Cronbach's α值,所以不需删除任何题项。
表4-15 Cronbach's α与条目删除Cronbach's α——目的地管理因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
④限制性与放大性因素
在进行因子分析之前需要借助CITC净化和消除“垃圾测试条目”,限制性与放大性因素的CITC及条目删除Cronbach's α系数参见表4-16,D48(与旅游客源地的相对距离)、D49(与其他目的地的关系)、D50(自然灾害)、D58(目的地承载力)四项的CITC小于0.4,必须将其删除。
表4-16 CITC与条目删除Cronbach's α系数——限制性与放大性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
word100在此基础上,对剩余的9个题项进行因子分析,因子取舍的标准是特征值大于1,因子负荷大于0.4,对于不符合这一标准的题项将在分析中予以删除。限制性与放大性因素剩余9个题项的KMO和Bartlett球度检验结果参见表4-17。
表4-17 KMO和Bartlett球度检验——限制性与放大性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
如表4-17所示,代表样本充分水平的KMO值为0.749,说明样本数量比较充分,超过了因子分析的样本限制条件;与此同时,Bartlett球度检验的χ2统计值为173.265,其显著性水平为0.000,说明数据相关阵不是单位阵,统计数据具有相关性,适合进行因子分析。
按方差最大法(Varimax)旋转后得到的因子负荷矩阵参见表4-18,各指标的因子负荷量均在0.4以上,9项指标均予以保留。
表4-18 旋转后的因子负荷矩阵——限制性与放大性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
限制性与放大性因素9项指标的Cronbach's α以及条目删除Cronbach's α系数参见表4-19,9个题项的条目删除Cronbach's α除D54(恐怖活动与战争)为0.697,接近0.7之外,其余均大于0.7。
表4-19 Cronbach's α与条目删除Cronbach's α——限制性与放大性因素
资料来源:本研究借助SPSS13.0统计软件,根据问卷调查数据整理得出。
如表4-19所示,组成三个公共因子的题项在条目删除后的Cronbach's α值均小于该公共因子所包含的全部题项的α值,所以不需要删除任何题项。
基于以上分析,可以得到包含4大类因素、38个题项的旅游目的地竞争力影响因素调查问卷(见附录B),针对国内游客的预试问卷将主要依据上述分析结果进行编制。
3.针对国内游客的预试问卷
(1)题项的选取
针对国内游客的调查问卷共由三大部分组成:第一部分为旅游目的地竞争力影响因素调查,涉及旅游者对各种影响因素重要性与相对表现的评价;第二部分为旅游者满意度调查,涉及旅游者旅游后的满意情况;第三部分则是被调查者个人的基本信息。
①旅游目的地竞争力影响因素调查
第一部分是该调查问卷最为核心的内容,其题项选取主要依据针对旅游业内人士的问卷调查结果。需要注意的是,除了考虑上述核心资源与吸引物因素、辅助性与支持性因素、目的地管理因素以及限制性与放大性因素4大类、38项因素之外,还需要将“旅游企业”这一因素纳入考虑范围。
尽管旅游目的地竞争力关注的是较为“宏观层面”的内容,但旅游目的地的相关企业也是其中非常重要的行为主体,其在目的地竞争力打造中所起的作用绝不可忽视,波特的“钻石模型”便突出强调了企业的战略、结构及其竞争对手等的重要性。尽管Crouch&Ritchie模型以及Dwyer&Kim模型中并未涉及旅游企业的相关内容,但在设计调查问卷时还需将“旅游企业管理”的相关因素纳入其中。将第二部分的B27(旅游从业人员的行为举止与服务态度)调整到旅游企业管理因素当中,笔者在征询有关专家意见的基础上为“旅游企业管理”设计了7个题项,分别是旅游企业员工的服务态度、旅游企业员工的服务技巧、旅游服务的及时性、旅游产品与服务的质量、旅游产品与服务物有所值、旅游企业的宣传促销、旅游企业的售后服务。
此外,将辅助性与支持性因素中的“可进入性”合并入限制性与放大性因素中的“交通便利状况”。本次问卷调查主要是针对前往某些旅游目的地旅游的国内游客,为了使问卷题项更加通俗易懂,笔者在征询有关专家意见的基础上,对“目的地管理因素”相关指标的表述做了相关调整,共设计了11个题项。于是,针对国内游客的预试问卷的第一部分共包含5大类因素、44个题项。其中,5大类因素分别是指核心资源与吸引物因素、辅助性与支持性因素、目的地管理因素、限制性与放大性因素以及旅游企业管理因素,它们分别包含10、8、11、8、7个题项。
本部分除了需要了解旅游者对各种影响因素重要性的评价之外,还需调查旅游者对这些影响因素在某一旅游目的地表现情况的评价。因此,问卷在每个题项后设置了“重要性”和“相对表现”两栏指标。
②旅游者满意度调查
第二部分主要设计了4个题目,了解旅游者的总体满意度、推荐意愿、重游意愿以及提高支付水平的意愿等内容[32]。
③个人基本情况调查
第三部分则是有关被调查者性别、年龄、受教育程度、平均月收入等的基本情况的问题。
(2)量表的设定
调查问卷的第一部分采用Likert 5点式量表,按照各影响因素对旅游目的地竞争力的重要程度进行打分,其中“1”=很不重要,“2”=不重要,“3”=一般,“4”=重要,“5”=很重要;按照各影响因素在特定旅游目的地的实际表现进行打分,“1”=很差,“2”=较差,“3”=一般,“4”=较好,“5”=很好。第二部分同样是5点式量表,第三部分则是单项最佳选择。问卷的大体框架可参见附录C。
(三)调查样本的选取
由于本文的研究目标是基于国内客源市场的分析视角构建一套旅游目的地竞争力评价指标体系,因而本次问卷调查的样本即被限定为前往某些旅游目的地旅游的国内游客。
其中,小样本预测试的数据主要来自青岛,调查地点涉及栈桥、石老人海水浴场、八大关、五四广场以及中山公园等景点景区。样本总量控制在200人左右,调查时间集中于2007年6月份。
正式调查的样本来自青岛和大连。青岛市的正式调查仍在上述景点展开,大连市的调查是在老虎滩海洋公园、金石滩旅游度假区、大连森林动物园、中山广场、海之韵广场以及星海广场等景点景区开展。其中,青岛和大连的样本分别为500,样本总量控制在1 000人左右。调查时间安排在2007年7~9月。
(四)主要的数据处理方法
本文以SPSS13.0为主要的分析工具,通过因子分析来对相关变量进行精简与分析,因而有必要介绍一下因子分析的基本原理及其涉及的几个核心概念的内涵。此外,正式调查阶段涉及多个调查地点的数据采集,所以需要对样本是否来自于同一母体进行检验,还要涉及同源偏差检验等内容。因此,本部分将简要介绍一下因子分析、同一样本母体检验以及同源偏差检验等数据处理方法。
1.因子分析
(1)因子分析的基本思想
因子分析(Factor Analysis)是多元统计分析技术的一个分支,其基本思想是根据变量相关性大小对变量进行分组,使得同组变量之间的相关性较高,不同组变量之间的相关性较低。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结构。这些假想变量能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系,我们把这些假想变量称之为基础变量,即因子(Factors)。因子分析就是研究如何以最少的信息丢失把众多的观测变量浓缩为少数几个因子,并使因子具有较强的可解释性。因子分析的主要目标就是浓缩数据。
(2)因子分析的数学模型
因子分析最初是由Spearman于1904年提出的,其基本原理可以参见下面的数学模
型:
其中,m<k;
fj为公共因子(Common Factor);
ei为特殊因子(Unique Factor);
aij为公共因子负荷(Factor Loading),是第i个变量在第j个因子上的负荷。
通过因子分析,我们不但可以找到变量的基本结构,而且还能简化数据,并继续对其进行回归分析、聚类分析以及判别分析等。
(3)因子分析涉及的几个核心概念的内涵
为了更好地理解因子分析的相关结果,在此有必要阐释一下因子分析模型中涉及的几个概念的内涵。
Bartlett球度检验(Bartlett test of sephericity)用于检验各个变量是否为相关矩阵,其零假设是单位阵,如果不能拒绝零假设,则需重新考虑因子分析的使用。KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)反映样本的充足程度,从比较观测变量之间的简单相关系数和偏相关系数的相对大小出发,其值的变化范围从0到1。KMO值越接近1,说明观测变量越适合作因子分析。
因子负荷是因子分析模型中最重要的一个统计量,它不仅表示了观测变量是如何由因子线性表示出的,而且反映了因子和变量之间的相关程度,aij的绝对值越大,表示公共因子fj与变量xi关系越密切。
公因子方差也叫共同度,是指观测变量方差中由公共因子决定的比例,其意义在于说明如果用公共因子替代观测变量之后,原来的每个变量的信息被保留的程度。
方差贡献率是指每个因子对数据的解释能力,可以用该因子所解释的总方差来衡量,又称为因子的贡献。
2.同一样本母体检验
由于针对国内游客的正式调查涉及两个城市,这种取样法可能会对样本的独立性、有效性等产生一定程度的影响。为了验证它们是否来自于同一群体,即母体是否相同,就必须先对样本的来源进行检验。本文采用独立样本T检验(Independent Sample Test),以测试两组样本的填写者对各项变量的反应。如果在某些个别题项上出现细小差异,但并不是特别显著,也可以证明取样来自同一母体。
3.同源偏差检验
问卷调查时,在所有题项均由同一填写者填写的情况下,容易出现叫作同源偏差(Common Method Variance,简称CMV)的问题。在很多情况下,CMV会导致概念间相关性的膨胀,从而导致第一类误差(Type I Error),造成知识累积错误;与此同时,CMV有时也会造成概念间相关性的降低,从而导致第二类错误(Type II Error),造成错失显著的概念相关。
消除CMV的方法是在研究前尽可能使用提高事前预防的措施,例如匿名问卷调查、反向条目设计法等。检测CMV的方法是菲利普·潘德斯科夫(Philip Podsakoff)和丹尼斯·奥甘(Dennis Organ)于1986年提出的哈曼(Harman)单因子检验方法,即问卷所有条目一起作因子分析,在未旋转(Un-rotated)时得到的第一个主成分反映了CMV的量[33]。