典型爆款文标题样本的选取
2025年09月26日
(一)典型爆款文标题样本的选取
爆款文标题语料的选取。首先,样本选取应考虑同类文章的爆款文标题,以尽可能减少因专业领域内容差异过大造成的干扰;其次,应选取同一个编辑部的原创文章,因其一般有一以贯之的写作要求,所以符合此两点的标题容易形成具有研究价值的语言分布规律。本文选取公众号中的影评类文章标题为主要研究对象,收集了影评类头部排名的四个公众号“sir电影”“整点电影”“独立电影”“电影派”。这四个公众号符合上述两点标准,选题范围有限且有较高密度的发文,还能做到每篇阅读量最低也在数万以上,甚至经常连续多日多篇达到10万以上,足见其写作的技巧高且稳定。
随机选择日期并逐日收集以上四个公众号[10]标题,分别是“sir电影”319条,“整点电影”219条,“独立电影”169条,“电影派”169条,一共876条。为了保障文章足够“爆”,删除广告和阅读量为8万次以下的样本,最终得到标题731条。这731条标题的“阅读”量平均为9.8万次,“在看”量均值为1709.6次,符合爆款文标准。
对照语料的选取。一般标题的语料从传统媒体,主要是人民网、光明网、《新京报》等媒体搜集了文艺评论文章标题86条、社会新闻评论101条,作为参照数据。本文后文凡提到与一般标题的对比,未经特别说明的均指与此数据进行的对比。
其他类型语料和非爆款文语料的收集。选取“丁香医生”“十点读书”连续多天的文章各15篇,“阅读”量均为10万;同为文艺类评论的公众号“新京报·书评周刊”15篇,“阅读”量均值不到4万,“在看”量均值仅200有余,“北青艺评”影评内容17篇,仅2篇阅读量超过5000,“在看”量仅为十位数,因此将这二者归入非爆款文。[11]