第六章 队列研究

第六章 队列研究

目的:通过学习,掌握队列研究的基本原理和研究方法。

课时:3学时。

通过对4个小案例进行课堂讨论,学习队列研究的概念、原理、特点和应用,掌握队列研究的实施和资料统计分析方法。

一、Framingham队列介绍

美国Framingham心脏研究堪称医学研究的典范。1948年,美国国立卫生研究院(NIH)决定开始在马萨诸塞州Framingham镇启动一项心血管病研究,其最初目的是研究在正常人群中冠心病的表现和导致冠心病的决定因素,建立新的筛查方法。选择Framingham作为研究基地是因为20世纪初该镇曾成功开展过结核病的防治,且因为邻近波士顿几个医学中心,便于获得科研和临床方面的支持。此外,当地医生较为配合,居民失业率低,人口较为稳定。

问题1 讨论开展长期随访研究的前提条件。

Framingham研究的初始队列由5 209名28~62岁的男女两性组成,包括1 644对夫妻和596个家庭。经过10余年的随访后,1961年Framingham研究在Annals of Internal Medicine杂志上发表了题为“Factors of risk in the development of coronary heart disease—six year follow-up experience”的论文,肯定了高血压、高胆固醇血症对冠心病的影响,并明确提出下一步研究需要验证“纠正这些危险因素是否可以改变发病危险”。这项里程碑式的研究不仅创造性地提出了“危险因素”的概念,也是心血管病防治的根基。此后的实践证明,对高血压、高胆固醇血症等危险因素的预防和干预有效地降低了心血管病的发病率和死亡率,挽救了无数患者的生命。

1971年和2002年,Framingham子代研究和第三代研究分别启动。在研究内容上,Framingham从初期主要致力于阐明心血管病与传统危险因素的关系逐步发展为关注整个动脉粥样硬化的过程,进行了大量有关亚临床动脉粥样硬化和新危险因素的研究。

1980年以后,Framingham研究在分子遗传学方面进行了许多探索,该研究对三代人长期随访的资料已成为遗传流行病学研究的宝贵资源。

二、Framingham队列研究的目的

队列研究的目的一般包括:检验病因假设,评价预防效果,研究疾病自然史。

在早期阶段,Framingham地区心脏病研究的主要目的,是在一般人群中前瞻性地观察冠心病的发病率及年龄、性别、家族史、职业、文化水平、国籍、血压、血脂、体力活动、吸烟、饮酒等因素在冠心病发生、发展中的作用。

三、选择对象的原则和原因

研究对象包括暴露组和对照组,暴露组中有时还有不同暴露水平的亚组。根据研究目的和研究条件的不同,研究人群的选择有不同的方法。

1.暴露人群的选择 暴露人群即对待研究因素有暴露的人群。根据研究的方便与可能,通常有下列4种选择。①职业人群;②特殊暴露人群;③一般人群;④有组织的人群团体。

2.对照人群的选择 设立对照是分析流行病学的基本特征之一,其目的是为了比较,为了更好地分析暴露的作用。选择对照组的基本要求是尽可能保证与暴露组的可比性。选择对照人群的常用形式有下列4种:①内对照;②特设对照,也称外对照;③总人口对照;④多重对照。

问题2 在研究设计中,研究人群为未患CHD的一般人群,为什么?在最后的样本中,包括了随机样本和志愿者,选择志愿者会带来什么样的潜在问题?这样设计的优点是什么?还可以如何选择人群?不同人群选择对结论有何影响?(表6-1)

表6-1 Framingham研究人群的组成

问题3 在研究中,应答率成为了一个关注的问题,为了确保样本的代表性,你认为需要做什么分析?

四、暴露和暴露组

问题4 本研究中的暴露因素是什么?暴露人群是哪些人?

问题5 确定了暴露因素后,需要确定非暴露人群(或称对照组)。对照组选择的基本原则是什么?在本研究中,该对照是什么类型的对照?如此选择的优缺点是什么?

五、随访

研究对象的随访是队列研究中一项十分复杂细致,又至关重要的工作,随访的对象、内容、方法、时间、随访者等都直接与研究工作的质量相关,因此,应事先计划、严格实施。随访的基本原则包括:①对暴露组和对照组应采取相同的随访方法,且在整个随访过程中,随访方法应保持不变。②一般与获取的基线资料内容一致,但此处收集的重点是结局变量。

在随访过程中,研究人员严格按照研究方案收集研究对象的信息,并进行两年一次的检查。在研究进行过程中,87.3%的人完成了6年的随访。2.4%的对象在第四次检查前死亡(表6-2)。

表6-2 6年随访结果

问题6 对未接受第四次检查的对象该如何处理?对第四次检查前死亡者又该如何处理?

六、研究结局

结局变量(outcome variable)又称结果变量,简称结局。是指随访观察中将出现的预期结果事件,也即研究者希望追踪观察的事件。结局就是队列研究观察的自然终点,它与观察期的终止不是一个概念。

研究结局的确定应全面、具体、客观。结局不仅限于发病、死亡,也有健康状况和生命质量的变化;既可是终极的结果(如发病或死亡),也可是中间结局(如分子或血清的变化);结局变量既可以是定性的,也可以是定量的,如血清抗体的滴度、尿糖及血脂等。队列研究的优点之一是一次可以同时收集到多种结局资料,研究一因多果的关系,故在队列研究中除确定主要研究结局外,可考虑同时收集多种可能与暴露有关的结局。

队列研究由于跨时间较长,观察对象经常处于动态之中,队列内对象被观察的时间可能很不一致,因此以人为单位计算率就不合理。较合理的办法是加入时间因素,以人时来计算观察对象的暴露经历。在对队列研究资料进行分析之前,应计算不同组(暴露与非暴露组、不同年龄组,不同性别组等)的观察人时数,常用的人时单位是人年,常用的人年计算方法有下列3种。

(1)以个人为单位计算暴露人年:该法结果精确,但手工计算很费时间,一般需选用恰当的计算机程序。在此以某研究中的3个研究对象为例说明其计算方法和原理。

(2)用近似法计算暴露人年:如果不知道每个队列成员进入与退出队列的具体时间(精确到天),就不能用上述方法直接计算暴露人年数;如果研究样本太大,也不能用上法计算;另外,如果对暴露人年计算的精确性要求不高时,都可应用近似法计算暴露人年。

(3)用寿命表法计算人年。

在Framingham研究中,研究人员首先展示了6年随访的CHD的发病率,研究者发现在30~44岁的人群中,男女性别的发病率之比约为13倍;但在45~62岁组,其差别仅为2倍左右。

问题7 其计算发病率的分子、分母各是什么?可以这样计算的一个前提条件是什么?如果不能满足这个条件,则需要如何计算发病率或用其他指标代替?

问题8 表6-3中所计算的发病率,与教材中的发病率计算方法有何不同?如果要计算年发病率,如何计算?

表6-3 不同年龄和性别人群6年的CHD发病率(1/1 000)

问题9 除了发病率之外,研究人员也观察了其他结局,如观察到19人因心肌梗死死亡,作者也发现CHD的临床表现在男、女性别之间存在显著差异。在结局的确定上,队列研究与病例-对照研究有何区别?

七、关联的测量

队列研究较之病例-对照研究的最大优点就在于可以从队列研究直接计算出研究结局的发生率,因而也就能够直接计算出暴露组与对照组之间的率比和率差,即相对危险度RR与归因危险度AR(attributable risk),从而直接准确地评价暴露的效应。

研究发现,在几个年龄组的人群中,与暴露人口相比,新发CHD患者的血清胆固醇水平存在显著升高。在男性中,这种情况普遍存在;在女性中,40~49岁的人群中存在这种显著差异。

问题10 造成男、女性别之间差别的可能原因有哪些?在研究血清胆固醇水平和CHD的关联时,为了排除高血压对两者关系的影响,应该怎么进行分析?

根据年龄、性别和不同血清胆固醇水平分组,研究人员发现,随着胆固醇水平的升高,CHD的发病危险出现有梯度的上升。如,胆固醇水平≥245mg/dl的对象其CHD发病率为<210mg/dl组的3倍多,而这里也能排除年龄的混杂作用,因为研究已指出胆固醇水平并没有随年龄有显著上升(表6-4)。

表6-4 40~59岁人群不同初始胆固醇水平与CHD发病的关系

*:部分病例的血样不能获得,因此新发CHD和暴露人口数在不同单元格有所差异。
**:观察的发病率和期望发病率存在显著差异(P<0.05)。

问题11 在观察血压与CHD的关联时,通过观察发病率与预期发病率的比,作者在45~59岁的CHD人群中观察到了显著的血压值(收缩压和舒张压)升高,在这个年龄组的男性中,高血压的发病风险增加了2.6倍;在女性中,增加了6倍。但在其他年龄组中,没有观察到这种差异,可能的解释是什么?

八、偏倚

像其他类型的流行病学研究一样,队列研究也会产生偏倚,因此在设计、实施和资料分析等各种环节都应注意预防和控制偏倚的产生。与其他研究比较,队列研究中的偏倚在偏倚来源与控制策略等方面有一些特点。

问题12 研究中可能产生的主要偏倚有哪些?对研究结论的影响大吗?你觉得该如何正确评估这些偏倚给结果带来的影响?

(王伟炳)