病例-对照研究

第七章 病例-对照研究

问题1 本研究是什么类型的研究?

答:本研究是一项以人群为基础的频数匹配的病例对照研究。

1.病例-对照研究的定义:病例-对照研究是比较患某病者与未患该病的对照者既往暴露于某个(或某些)可能危险因素的百分比差异,以判断这(些)因素与该病有无关联及关联强度的一种观察性研究方法。本研究中,患某病者指2 400例1991年上海市区所有30岁以上男性肺癌新发病例;未患该病的对照指2 500例上海市区某区选取的30岁以上正常男性;可能危险因素是吸烟;研究疾病是肺癌;观察性体现在本次研究未给予任何干预措施。

2.病例-对照研究中,病例和对照的基本来源有两个:①医院的现患病例或医院和门诊病案及出院记录记载的既往患者,称为以医院为基础的病例-对照研究;②社区、社区的监测资料或普查、抽查的人群资料,称为以社区为基础的病例-对照研究,或以人群为基础的病例-对照研究。前者的源人群往往不能识别,因为它代表了一组人,这些人如果发生了所研究的疾病将会去一定的医院就诊;而后者可以较好地确定源人群。本次研究中,虽然病例来源于医院,但为一定时间内上海市区所有医院的新发病例,相当于一定时间内上海市区人群产生的所有病例,可以首先确定源人群。因此,本研究是一项以人群为基础的病例-对照研究。

3.频数匹配(frequency matching)又称成组匹配(category matching),是指使匹配的因素在对照组与病例组所占的比例一致。本次研究采用5岁一组年龄频数匹配的方法,使对照组30~34、35~39、40~44、45~49……各年龄组的构成比与病例组一致或接近。因此称为频数匹配的病例-对照研究。

问题2 本研究的源人群是什么?

答:源人群可根据病例的定义来确定。本次研究中的病例是“1991年上海市区所有30岁以上男性肺癌新发病例”,由此可以确定,本次研究的源人群是“1991年上海市区所有30岁以上男性”,所有病例均是从该人群中产生。

问题3 本次研究的对照应该如何选择?小王选择对照的方法是否正确?

答:病例-对照研究中,对照应该来自产生病例的总体,能代表产生病例的人群。因此,对照应当是从源人群中抽取,代表的是整个源人群,而不是未患病的人群。对照组的暴露率应反映源人群的暴露水平。

本次研究的源人群是“1991年上海市区所有30岁以上男性”,因此,对照应当从“1991年上海市区所有30岁以上男性”中随机选择。小王是从上海某区选取1991年30岁以上正常男性作为对照,无论他是否采用随机抽样,他所选对照只是来自上海的某一个区,而不是整个上海市区,因此是错误的。

问题4 本次研究的暴露因素是什么?是否有明确的定义?

答:“暴露”是流行病学研究常用的术语,指研究对象接触过某物质、具备某些特征,或处于某种状态。这些因素、特征或状况若与研究疾病有关,即为暴露因素。暴露因素要有明确而统一的定义,调查时对病例组和对照组采用相同的方法调查。本次研究的暴露因素是指“吸烟”,有研究表明“吸烟”可能增加肺癌的发病危险。此外,该研究将吸烟定义为“每天至少一支,持续6个月及以上”,有明确的定义,便于在病例组和对照组采用相同标准进行调查,也便于将研究结果与其他研究进行比较。

问题5 本次研究“吸烟对肺癌有保护作用”的结果可能是什么原因造成的?

答:该结果的产生主要是由于对照选择不当,对照组的暴露率不能代表源人群所致。小王所选对照来自上海的一个区,经济较不发达,居住人群的社会经济地位低于上海市区平均水平,男性吸烟率也远高于上海市区总体水平。

问题6 小李想在上海市开展一项以医院为基础的乳腺癌病例-对照研究,他与肿瘤医院合作,想以肿瘤医院今后两年确诊的女性乳腺癌新发病例为病例组,他该如何选对照?

答:对照必须来自产生病例的人群,能代表产生病例的人群,即源人群。以医院为基础的乳腺癌病例-对照研究的源人群往往为一个假设的人群,该人群中任何个体如果发生了所研究的疾病将会去该医院就诊。本例的源人群应该是这样的一个女性人群,她们一旦患了乳腺癌,就会去肿瘤医院就诊。

在医院选择对照时,可以选那些患与暴露无关联病种的患者,也就是说,要注意对照不患有与所研究疾病有共同已知病因的疾病。如研究吸烟与肺癌关系时,不能以慢性支气管炎病例作为对照,因为吸烟同时是这两种疾病的可能病因。

由于小李合作的医院是肿瘤医院,为专科医院,缺少肿瘤之外的其他患者作为对照。理想的方法是:首诊病例的对照从门诊排除肿瘤的女性中抽取,而转诊病例的对照从转诊医院非肿瘤病例中抽取,因为这些对照一旦确诊乳腺癌,她们将被同样转诊而成为肿瘤医院的患者。此外,还要注意对照所患疾病与乳腺癌无共同病因。肿瘤医院男病例的配偶也可用作对照,因为丈夫患肿瘤后到肿瘤医院就诊,妻子如果患乳腺癌,到肿瘤医院就诊的可能性也很大。

问题7 该研究发现,高脂膳食与2型糖尿病呈负向关联,即高脂膳食可能对2型糖尿病有保护作用。该结果与以往报道的结果正好相反,可能的原因是什么?

答:本次研究中病例组为2型糖尿病现患病例,其膳食习惯在患病后已经发生了改变,膳食脂肪的摄入水平低于一般人群。因此会得到高脂膳食与2型糖尿病呈负向关联的结论。

问题8 该研究设计可能存在哪些问题?

答:横断面研究有以下一些特征:①人群一直处于迁出、迁入的动态变化之中,横断面研究的调查人群可能不是产生病例的人群;②现有病例可能不是调查人群产生的所有病例,那些已死亡、治愈、迁出或没有登记的病例不包括在内;③现患病例可能和与其存活相关因素有关,如病情较轻、营养和身体状况较好等;④疾病本身可能导致暴露的改变,如本例中糖尿病现患病例改变了其膳食习惯。因此,在横断面研究的基础上开展病例对照研究会有许多问题。

只有满足下列条件时,横断面研究可作为病例-对照研究的特殊类型:①人群动态(迁入、迁出、死亡等)与暴露和疾病均无关;②存活病例的暴露和疾病信息与死亡病例相同;③暴露因素不影响患者的生存;④疾病不影响暴露因素的分布。

问题9 如果他在本次调查时对无糖尿病史的9 000例对象进行空腹血糖检测和(或)OGTT试验,新发现2型糖尿病病例300例,他以这300例新诊断病例为病例组,同样采用配对方法,从血糖正常人群中按性别和年龄等条件随机选取对照300名,开展配对病例-对照研究,研究生活方式与2型糖尿病的关联,是否可行?

答:相对来说是可行的。病例为新发病例,其发病尚未对其生活方式产生影响,而且因为刚发病,对发病前暴露的回忆较为可靠。但由于人群的动态变化,无糖尿病史的9 000例对象可能并非产生300病例的源人群,因此,即使对照是从无糖尿病史的9 000例对象中抽出的随机样本,也可能只代表部分源人群。即便如此,该研究设计已大大优于上述以已确诊的现患病例为对象的设计。

问题10 如果请你来设计一项研究,探讨生活方式与2型糖尿病的关联,你会如何设计?

答:2型糖尿病并非罕见疾病,病例-对照研究并不是最佳选择,可考虑进行前瞻性队列研究。

问题11 如何评价该研究中可能存在的选择偏倚和信息偏倚?

答:病例-对照研究是一种回顾性研究,比较容易产生偏倚,最常见是选择偏倚和信息偏倚。

病例-对照研究常见的选择偏倚有入院率偏倚(berkson bias)、现患病例-新病例偏倚(neyman bias)、检出偏倚、排除偏倚、时间效应偏倚等。本次是以人群为基础的病例-对照研究,不存在Berkson偏倚;研究对象为新发病例,不存在Neyman偏倚;已排除子宫切除史者,排除偏倚可能性小;子宫内膜癌多发于中老年女性,且有明显的症状(阴道出血),但人工流产这种早期事件与肿瘤的检出关系不大,因此可排除检出偏倚;虽然许多子宫内膜癌有阴道出血的症状,能及时就医确诊,但不能完全排除时间效应偏倚的存在。

病例-对照研究中信息偏倚不可避免,主要有回忆偏倚和调查偏倚。回忆偏倚的产生与调查时间、事件发生的时间间隔、事件的重要性等有关。本次调查的暴露因素是人工流产史,是女性一生中较为重要的事件,不太容易存在回忆偏倚。此外,本次研究的病例和对照均以家访形式进行,且多为中老年女性,人工流产在该人群中不属于敏感事件,调查偏倚的可能性也较小。

综上所述,该研究在分析人工流产史与子宫内膜癌关系时,可能存在的选择偏倚和信息偏倚不足以影响关联的评估。

问题12 如果不存在选择偏倚和信息偏倚,本次研究所得OR值是否为RR值的无偏估计?

答:可以这么说。如果不存在选择偏倚和信息偏倚,本次病例-对照研究相当于从1997年1月1日开始,将上海市区符合条件(女性,上海市区户口,居住上海两年及以上,年龄25~69岁,无恶性肿瘤史,无子宫切除史)的人群作为一个队列,随访至2001年12月31日为止。

本次研究是以人群为基础的病例-对照研究,源人群定义明确,即女性,上海市区户口,居住上海两年及以上,年龄25~69岁,无恶性肿瘤史,无子宫切除史。如果不存在选择偏倚,则病例为源人群1997~2001年产生的所有病例,对照为源人群的一个有代表性的样本,如果不存在信息偏倚,病例组和对照组都不存在对暴露因素的错分,对照组的暴露比例能代表源人群中的暴露比例。

OR=ad/bc=(a/b)/(c/d)

d/c为对照组暴露者与非暴露者的比值,如果不存在选择偏倚,则c/d=n1/n0

OR=(a/b)/(n1/n0)=(a/n1)/(b/n0)=RR(如下图所示):

问题13 为何需要列出表7-1的结果?

答:表7-1所列是病例和对照组人口学信息及部分子宫内膜癌危险因素的比较,该结果的列出可使读者详细了解研究对象的一般情况,便于读者将研究结果与其他报道比较,观察是否具有一致性。一致性较好,表明研究质量基本可靠;如果结果与其他研究差别较大,又无特别的原因可以解释,则表明研究结果不可靠。例如,本次研究未发现病例组与对照组HRT频率有显著差异,该结果不同于西方女性中得到的结果。可能原因是中国女性HRT使用频率远低于西方女性,统计把握度(power)不够,而非研究结果不可靠。

问题14 如何描述表7-1的结果?

答:病例组与对照组在年龄、文化程度、HRT、体育锻炼及膳食热能摄入等方面无显著差别。但与对照组相比,病例组初潮晚、绝经早、行经年数短、自然绝经比例高、怀孕次数多者和服用口服避孕药者比例高、有家族史者较多,饮酒和参加体育锻炼者多。这些研究结果中,除了因该人群中使用HRT较少而与以往结果不一致外,其他结果均与以往其他研究结果一致。

问题15 请计算表7-2中BMI四分位较高各组相对于最低组的粗OR值。

答:病例-对照研究四格表构成:

因此,相对于BMI≤21.4组

BMI 21.5~23.7组的粗OR=a1d/b1c=(170×211)/(211×120)=1.4

BMI 23.8~26.2组的粗OR=a2d/b2c=(214×211)/(212×120)=1.8

BMI>26.2组的粗OR=a3d/b3c=(322×211)/(210×120)=2.7

问题16 为何在分析BMI与子宫内膜癌关联时,需要调整WHR,而在分析WHR与子宫内膜癌关联时,需要调整BMI?

答:根据以往研究结果,BMI与WHR均为子宫内膜癌危险因素,且两者有显著的相关关系,因此,研究其与子宫内膜癌的关联时,两者互为混杂因素。

问题17 表7-2的结果如何解释?

答:从表7-2可见,只调整年龄、文化程度、是否绝经、行经年数、怀孕次数和总热能摄入时,BMI和WHR均与子宫内膜癌呈正向关联;随BMI或WHR的增加,其与子宫内膜癌的OR值呈显著的上升趋势,趋势检验P<0.01。进一步调整WHR后,BMI与子宫内膜癌的显著关联不复存在,而进一步调整BMI后,WHR与子宫内膜癌仍呈显著正向关联。提示中心性肥胖可能是子宫内膜癌的独立危险因素。

(徐望红)