研究技术路线及操作

二、研究技术路线及操作

本研究的文本内容是12位英国模式行业从业人员的深访资料,半结构化的采访内容围绕英国模式何以畅销世界及其发展趋势展开。大致的研究路线如下:

图2.1:深度访谈文本量化流程图

第一步是原始资料的采集,依次访问12位模式行业者,获得他们的允许使用录音设备记录。由于深度访谈的特性与独立研究的限制,采访的人数有限,为了尽可能降低原始资料的主观性和弥补样本量较少的缺憾,研究在选择采访对象时就尽可能覆盖模式行业的各方面。选择标准主要是受访者的从业机构以及具体工种两个方面。受访者分别来自模式行业最重要的三类机构:制作公司、主流播出平台(BBC,ITV,Sky TV)以及第三方市场支持。在职业工种的选择上基本按照模式研发到播出执行的流程各环节来寻找受访者,主要涵盖:模式研发者、制作人、受众调研、模式节目的许可者(commissioner)、国际营销专员、行业组织者。受访者中男性略多,占8人,平均从业时间在10年以上。这种选择目的是为了能够平衡来自该行业各方的观点和意义表达,同时保持客观、中立的研究立场。这些受访者由于机构和工种的区别天然对真人秀节目模式有着不一样的观点和见解,然而词频分析可以反映他们共同的价值观念和特征。

第二步是把录音资料文本化。首先进行翻录:将录音内容逐字逐句转录成文字,包括虚词、语气词、重复等。其次校正:检查文义,以确保文稿通顺。再次校对:将二稿发给受访者校对,检查文稿里的信息是否正确。为了减少翻译造成的语意误差,所有的分析都是基于英文文本的分析,仅将最终的词频分析结果翻译成中文。

第三步是词频分析。由于英文单词的特性,无需对词汇做分词处理,可直接对文本全文进行词频分析。这一过程使用词频分析软件Rostcm 6 来进行词频统计,分别对12个独立文本和合并文本做高频词分析。筛出“and”,“the”,“a”等无意义的虚词和由口语习惯大量重复的词。此外,由于they,we,you等代词由于口头语言的用语习惯,其出现频率远高于其他高频词(三个词的词频皆超过千次),却指代不明,虽与身份认同有密切联系但与职业实践有较小关联,因此不计入高频词库,会在身份认同的结果分析中另行讨论。单篇选择词频次数超过5次的词汇,合并文本选取词频数超过50次的词汇分别形成高频词汇表。对12个独立文本的高频词与合并文本高频词列表进行对比统计,避免有所遗漏和偏颇。由于受访者用语习惯存在差异,以及口头语言的随意性,在表达同一意义时所用的单词不同,导致某些词汇虽未在综合文本中达到50次的词频数,但其同义词项在高频词列。例如:global(全球的)一词,虽然综合词频仅为28次,但与词频数为64次的高频词international(国际的)为同义词,故归为一个中文词项;又如表示英国的UK(306次),Britain(13次),England(1次)的词频次总和记入UK这一个词的词频数。US,USA,America,United State,the State 都算作“美国”一词的词频。经过上述删减与合并,从13个高频词汇表中提取出一个53个词的核心词表(如下),核心词表相较于高频词表与文本的主题表达具有更密切的关系。

表2.1 核心词汇表

第四步是网络化。在完成核心词库的建立后,进一步分析各核心词之间的关联。核心词汇之间的关系主要体现在关联次数,一个词与其他词的关联次数越高,关联度就越高,说明这个词与其他词之间的联系越频繁,进而在整个词汇的关系网络中就越活跃或强势,由此也能够看出词汇在整个关系网络中的重要程度[28]。按照句号为一句话的原则,对12个文本的句拆分。两个核心词出现在同一个句子的次数计为关联度数。例如,BBC 和show这两个单词在全部文本的9个句子中同时出现,其关联度计为9。使用批量文本软件Replace Pioneer,分别运算每个词和另外52个核心词的关联度。为了保证运算的准确性,在上文中提及的已合并计算词频的高频词,如international 和global,在此处进行拆分运算,最后把结果相加计入词汇关联度表如下图所示。

表2.2 高频词关联度拆分计算(部分)图示

接下来,考虑到中英文语言上的差异,为了更为直观地体现文本的核心主题,在对各核心词的关联度运算完成后,进一步合并同义的核心词。例如,都表示“美国”这一词义的US和America,表示“节目”的show和program,以及表示疆域概念的“国家”(country)和“地区”(territory)两个词。计算方式如下所示:

表2.3 高频词关联度合并计算(部分)图示

最后精简为50个词的核心主题词库,将词汇关联度处理成标准N*N的矩阵,画出有向图。

表2.4 核心主题词库关联度矩阵(部分)图示[29]

续表

完成以上变量的测量后,将结果导入社会网络分析软件Ucinet 6.216 生成SNA 网络图,以中心性分析绘图,形成可视化的词汇关系网。度中心性(Degree Centrality)是在网络分析中刻画节点中心性(Centrality)的最直接度量指标。一个节点的节点度越大就意味着这个节点的度中心性越高,与其他词汇的关联度越高,该节点在网络中就越重要。如图,“节目”处于所有关键词的中心。

图2.2 核心主题词关联度网络图[30]