医学文献评价

第十三章 医学文献评价

问题1 文献的主题是否突出?

答:本次文献的主题突出,是一项关于绝经妇女生育史与其发生结直肠癌风险关系的研究。论文题为“绝经妇女生育史与结直肠癌的风险关联”,作者以一项大型队列研究为基础,通过问卷调查的方式从美国妇女人群中收集了有关社会人口学信息和生育史信息,并随访观察结直肠癌的发生情况,探讨了绝经妇女的生育史对其发生结直肠癌的影响,因而从总体设计上来说本文献的主题较为突出。

问题2 是否阐述了问题的重要性?

答:本文对研究的重要意义进行了详细、综合的叙述,主要集中在文章的背景部分,如强调了研究的问题是一类常见的癌症和重要死因,表述如下:“结直肠癌是第四大最常见癌症,位列美国癌症死因第二位。”可以看出所研究疾病对整个人群的危害及其公共卫生意义和重要性。同时,文章也介绍了研究的相关现状,如:“观察性和实验室证据提示,性激素尤其是雌激素在结直肠癌发生机制中发挥重要作用。最值得注意的是,大量流行病学数据支持绝经后激素替代治疗(HRT)与结直肠癌之间的负向关联”。这样的表述从侧面印证了所研究问题的公共卫生意义。

问题3 该问题目前国内外进展情况?

答:文章就所涉及的科学问题进行了描述,主要可见于文章的背景介绍部分。作者进一步对研究现状作了简要分析:“生育因素,如经产情况、初产年龄、初潮年龄、绝经年龄等,常被用作女性一生中内源性雌激素暴露的替代指标,而血清学研究则通常检测某一特定时间的内源性雌激素水平。这些生育因素已证实与性激素相关肿瘤如乳腺癌和子宫内膜癌有显著关联。有前瞻性研究估计了生育史及口服避孕药使用与结直肠癌风险的关系,但是研究结果并不一致。”

另一方面也可发现,近期研究中所涉及的内容也有一定的不一致的地方,如:“分析HRT与结直肠癌关系时发现,内源性和外源性激素在结直肠癌的发生过程中可能起不同的作用。”这样的内容不仅介绍了研究所涉及领域的进展情况,也提示本次研究的必要性。

文章中还对一些既往研究的问题进行了简要分析,也给本次研究提供了参考,如:“绝经前后妇女的内分泌明显不同,之前的几项研究均发现生育因素与结直肠癌的关联因绝经状态不同而异。”因为前述研究可能有一定程度的不足之处,所以本次研究则更为重要。

问题4 本课题是否为当前重大的公共卫生(医学)问题?

答:首先所研究疾病是美国女性中一类重要的疾病,文章中提到,“结直肠癌是第四大最常见癌症,位列美国癌症死因第二位。每年约有142 570新发病例,预计2010年将有51 370人死于结直肠癌。”其次,雌激素在结直肠癌发生中的作用存在争议,报告指出“与使用安慰剂的妇女相比,使用雌激素加孕激素制剂的妇女(不包括仅使用雌激素的妇女)患结直肠癌的风险显著下降。”另有研究发现“绝经后妇女内源性雌激素水平与结直肠癌存在正向关联”,由于西方女性采用激素替代治疗比例较大,因此,明确雌激素与结直肠癌的关联尤为重要。由此可见,本研究主题具有重要的公共卫生意义。

问题5 本次研究是一项什么类型的研究?

答:本次研究是一项前瞻性的队列研究。研究中一共选择了214 162名绝经后妇女进入队列研究,1995~1996年开展基线调查,收集相关信息,然后随访观察个体结直肠癌的发生情况,通过肿瘤登记系统获得至2003年12月31日为止发生的新发结直肠癌病例。因此,暴露信息的收集在疾病的发生之前。

问题6 研究对象是否有代表性?是否需要设立对照组?对照组的选择程序是否阐述清楚?病例组与对照组在重要的研究因素是否可比?是否作了配对研究?对参加者可能承担的风险是否已作了说明,并征得了参加者的同意?

答:本文中的就所涉及调查对象作了相关说明,作者在一项大型队列的基础上开展了本次研究,因而研究对象是本次大型队列研究的成员,具体如下:调查对象主要来源于美国加利福尼亚等地区,年龄在50~71岁的上述地区的美国退休协会人员,总人数可达到300万人之巨。因此该研究并未采取传统随机抽样方法,而是针对所选择地区所有登记在册的退休人员进行调查,样本量大,结果可信。样本人群有较好的代表性。

同时在调查中发现的病例与非病例资料详见附表1。表中详细列举了调查对象的社会人口学特征,文章如下说明:结直肠癌病例组对象年龄稍大,有较高的BMI,更可能有结直肠癌家族史和患有息肉的个人史,更有可能是现在或以前的吸烟者,并更可能是糖尿病患者。此外,据报告结直肠癌患者与非病人比较,体力活动较少,教育程度较低,摄入较多的饱和脂肪,红肉消费量较多。关于生育因素,与非患者比较,结直肠癌患者较少使用口服避孕药或较少接受激素治疗或已经发生卵巢切除术,平均经历绝经期年龄较长,首次生育年龄较小。

本项目研究是已经过美国国家肿瘤研究所伦理学委员会批准;另一方面,因为本次研究是通过信访对潜在的调查对象进行流行病学问卷调查,则可认为同意参加者,才会完成调查问卷。

问题7 如何收集暴露信息?是否考虑到偏倚和误差?是否采取了特殊的步骤以保证所需信息测量资料的可靠性、完整性?

答:本次研究主要通过自填式的问卷的方式来收集调查对象有相关研究信息,文章中的表述如下:“自填式问卷邮寄给AARP约350万50~71岁男性、女性成员;被访问者接受并完成邮寄的调查问卷后,返回给研究人员。”因此,在一定程度上可能会影响结果的可靠性。一些信息偏倚可能存在,例如所研究的因素,生育史的数据是完全由于本次调查者的自愿应答而获得,因此在本次研究中回忆偏倚不能排除,将在一定上会影响到结果的可信性;另一方面,本次研究通过采用生育因素对雌激素水平的暴露进行替代,不是直接的指标测量激素水平,对研究结果外推至不同激素水平的暴露与癌症发生关系有局限性。研究中对自我报告的生育史与医疗记录进行比对,在一程度上可保证所得信息完整真实。

问题8 有否资料整理内容?资料整理是如何进行的?

答:本次研究资料的整理细致、合理。例如,最初的受访者中,作者排除了重复调查问卷179份,调查期间死亡的261人,搬出调查区域的321人,退出的6人,以及所有男性(n=339 669),剩余226 733名女性研究对象。接着,作者又排除了基线调查时仍有月经的妇女(9 684例)及报告患有癌症的妇女(n=2 887)。因此,研究人群包括214 162名绝经后妇女。

问题9 病例的诊断标准是否明确?用何测量指标?这些指标是否有明确的定义?测量方法是否标准化(调查表、测量仪器和试剂等)?资料收集是否完整?是否采用了“盲法”?测量指标的种类或分类是否恰当?如果采用抽样方法,则下述几个方面是否阐述清楚?抽样范围的描述及确定,抽样范围的完整性,抽样方法,样本大小的确定。

答:对于病例的诊断内容可参见文中的“材料与方法”部分。文章中具体的内容如下:对疾病的判定是根据ICD编码,采用联邦癌症登记处资料确定结直肠癌的发病。资料收集是建立在一项大型队列研究的基础上的前瞻性资料。作者在文章中对结直肠癌的判定所述如下:“肠癌的发生通过与联邦癌症登记处进行记录联动而获得,该登记处由北美癌症登记协会论证,>90%的病例已完成确认。结直肠癌的确认根据国际疾病分类肿瘤学(ICD)编码(第3版),编码为C180~C189,C199或C209。研究分析包含所有在2003年12月31日前确诊的结直肠癌病例。”

文章中并没有提及具体的对于所述疾病进行判定的操作,而根据联邦癌症登记处的资料,此机构是根据北美癌症登记协会中心的结果进行登记的,其中90%是经过北美癌症登记协会中心确认,该协会是1987年建立的专业组织,就其在美国癌症资料中的地位来说,资料应当是可信的。另外,在文章中,作者是将本次研究建立在既往研究的一项大型研究基础上的,并未采取传统随机抽样方法,但是针对所选择地区所有登记在册的退休人员进行调查,样本量大,结果可信。

问题10 论点是否明确?论据是否充分?推论是否合理?

答:本次研究是一项建立在大型队列基础上的前瞻性队列研究,用以来探明生育史和结直肠癌的危险关系,论点为内源性雌激素与结直肠癌发生有关,文章此次前瞻性的研究结果为论据,通过本次大规模的绝经后妇女前瞻性调查,研究发现绝经期年龄和首次生育年龄与结直肠癌的危险关系呈现统计学上显著的正相关。由此结果推论出生育史与结直肠癌相关,提示内源性雌激素与结直肠癌发生有关,推论合理、可信,但是缺少直接证据。

问题11 研究的结论能否外推到其他人群?

答:此项研究的结果,是建立在大样本人群资料基础上的流行病学调查,研究设计、资料收集及分析处理均较为得当,结论可以在美国绝经期妇女中适用,因为无论从遗传背景或者生活习惯、地理因素等诸多方面,均与调查人群相似,有较好的一致性。

问题12 是否论及该研究结果的局限性及可能的偏倚和混杂?

答:作者在文章针对本次研究可能的不足之处在讨论部分进行了阐述。

一方面在本篇文章中,作者对可能存在的偏倚和混杂进行了研究。例如,在本文中作者主要叙述如下:本研究所感兴趣的主要变量是根据自报信息,因此也不能排除有关不准确的回忆偏差的可能性。但是自我报告的生育史与确认后研究医疗记录有较好的一致性。

对于可能的混杂因素,如年龄因素、激素治疗进行了调整和分层分析,如在文章附表2和附表3中均有论述。

问题13 是否考虑到研究结果还有其他解释?

答:作者对部分结果给予了其他的解释,例如,在没有使用激素治疗的妇女中,初潮年龄和经产情况与结肠直肠癌危险呈负相关,尽管后者的统计学关联并不显著。值得注意的是,这些关系与生育因素和乳腺癌以及子宫内膜癌的风险报告关系相似。例如,初潮年龄早,绝经期年龄晚,从未怀孕妇女,首次生育年龄晚,都是已经确定的乳腺癌和子宫癌的风险因素,这些因素被认为是通过增加一生内源性性激素如雌激素的暴露来影响恶性肿瘤的发生风险。研究发现,这些危险因素同样也是结直肠癌的危险因素,表明类似的内分泌机制可能参与了结直肠癌的形成。

另外,文章中也有对经产情况与结直肠癌风险负相关关系的解释,作者认为这种关系只是在未使用过激素疗法的妇女中明显。虽然以前的研究大多没有发现经产情况和直肠癌的风险有统计学上显著关联,但是一项队列研究表明,与未生产过的妇女相比较,生育两个或两个以上孩子的妇女会降低恶性盲肠和升结肠肿瘤的风险。怀孕会导致可能对结直肠癌的起保护作用的激素发生很大的变化。

问题14 是否考虑到资料不全和混杂因素对结论的影响?

答:在本篇论文中,作者对资料不全及混杂因素对结论影响情况进行了分析,表现在以下两个方面,首先,本次研究中的年龄别结直肠癌发病率与SEER数据高度一致,提示本研究结直肠癌发病率数据的完整性,同时,根据对NIH-AARP的饮食问卷调查的自愿应答来选择队列并不存在任何实质性的偏倚,由此可见资料不全情况并不存在或者并不影响最终结果。其次,作者对混杂因素在分析过程中也进行了分层分析,如附表3中对激素替代治疗进行了分层分析。

问题15 样本量是否足够?

答:本次研究建立在一项大型队列研究的基础之上,研究中的调查对象有300万,最终能够符合筛选条件的调查对象约21万人,观察时间相对较长,平均随访8.2年,有2 014名绝经后妇女被诊断患有结直肠癌,其中1 483人为结肠癌,531人为直肠癌,因而可认为本次样本含量足够大。如文章中所述,这项研究的优势是一个大样本的基本特征较好的前瞻性队列研究,包括200多万名绝经后妇女研究对象,超过2 000例肿瘤登记记录核实的结直肠癌病例,相对较长时间的随访。在这项研究中年龄别结直肠癌发病率与监测,流行病学报道高度一致,提示结直肠癌发病率数据的完整性,同时显示并且根据对NIH-AARP的饮食问卷调查的自愿应答来选择队列并不存在任何实质性的偏倚。大样本量使我们有足够的统计效能进行分层分析,按BMI或激素治疗使用,这两个可能在生育史和结直肠癌的关联中起混杂作用的因素进行分层分析。

问题16 列出的数据在不同的表格和图之间是否有相互不符合的地方?

答:本次作者共列出3张表格,附表1调查对象的基本情况,附表2绝经期妇女生育史与结直肠癌的相关性,附表3月经初潮年龄和经产状况与结直肠癌关联的分层分析。表格的内容与表头相符合,表头能够反应所表述内容,另一方面表格中的数字准确,无不符合处。在本篇文章中,作者所使用的表格均为三线表,在必要时添加了附线和表注,表内各项所含的内容和数字没有重复,对所采取的统计方法、统计量均在表格中明确标识。

问题17 表格中所列数据是否有错?不同的表格数字是否相符?缺项资料是否用了说明?

答:本次作者所列出3张表格中的数字表达准确,不同表格间的数字无冲突,表内各项所含的内容和数字没有重复,所缺资料在数据整理过程中已作充分说明。

问题18 病例和非病例在重要因素上的差异是否进行了标化?

答:这是一项队列研究,研究中已通过多因素的统计模型对一些可能的影响因素进行了控制,主要有:年龄、体质指数、教育程度、酒精使用量,家族史,种族,吸烟史,糖尿病史、体力活动水平及激素治疗情况。

问题19 是否用了统计方法进行了检验?检验方法是否恰当?解释是否准确?

答:作者在本篇文章中对所涉及的统计问题进行了深入描述,详细内容表达在文章的统计分析部分及上述3个表格当中。根据病例和非病例的基本特征分布的差异,采取不同的统计学方法,连续性资料采用Wilcoxon秩和检验,分类数据采用Pearson卡方检验。使用Cox比例风险回归模型估计风险比值(HR)检验生育因素与大肠癌风险的关联,从研究登记开始以天为基本时间度量。监查个体结直肠癌的诊断,死亡,搬出研究区域的最后一次接触之日,随访结束(2003年12月31日)。图形检查验证了数据的均衡性,以上所述统计方法对所采集的资料进行统计较为合理,方法的使用方面是适当的。文章中也相关变量如年龄、BMI及酒精消费量等指标进行了详细的定义。

文章对所得到的结果进行了合理的解释。如,55岁或年龄更大的绝经妇女,相较于年龄<40岁绝经的妇女,增加了患结直肠癌的风险(≥55与<40,HR:1.50,95%CI:1.23~1.83)。指示组是绝经期年龄时包括了最多的妇女人数,这个关系没有改变(≥55岁与50~54岁,HR:1.33,95%CI:1.12~1.58;趋势检验P=0.008)。首次生育年龄与结直肠癌发生的风险呈正向关联(趋势检验P=0.046)。初产年龄19岁及以下妇女较初产年龄30岁及以上者发生结直肠癌的风险增加(HR:1.26,95%CI:1.01~1.58)。

问题20 如需要进一步改进此类研究,你会从哪里着手进行?

答:对今后大型前瞻性的研究,如果针对相同或类似的科学问题,可采用更精确的测量方法,如可以考虑采集多种生物学样本,检测相应的生物标志物,如内源性雌激素水平,这样指标更加明确;同时可以将个人的生物学信息更科学地与人群流行病学问卷调查的资料相互结合。此例中如果深入了解所关心的雌激素和其他激素水平,如雌二醇,排卵前期为48~521pmol/L,排卵期为70~1 835pmol/L,排卵后期为272~793pmol/L,这样的检测指标可提供更加丰富的信息,反应机体暴露情况,可直接探明其与结直肠癌之间的危险关系。

(张铁军)