二、分析性研究
分析性研究(Analytical Study)主要任务是检验描述性研究提出的病因假说,找出与疾病有关的影响因素,包括病例对照研究和队列研究。
(一)病例对照研究
1.基本概念
病例对照研究(Case-control Study)是根据研究按照有无所研究的疾病(或健康相关状况)将研究对象分为病例组和对照组,分别追溯其既往暴露情况,并对病例组与对照组中各因素的暴露比例进行比较。如果病例组的暴露比例与对照组的暴露比例差别有统计学意义,则认为这种暴露与所研究疾病存在统计学关联,进而分析暴露与疾病的关联强度。病例对照研究是一种回顾性、由果推因的观察性研究方法。其原理示意图见图8.2。
图8.2 病例对照研究基本原理示意图
2.特点
①属于观察性研究。病例对照研究中,研究者只是收集两组对象有关研究因素既往暴露情况的资料,暴露与否是客观事实,没有任何人为干预,因此属于观察性研究。
②必须事先设立对照。病例对照研究是通过比较病例组与对照组两组对象有关研究因素既往暴露情况的差异来推断研究因素与研究疾病之间有无关联,因此在研究设计阶段必须设立一个与病例组均衡可比的对照组。
③研究方向是由“果”溯“因”。病例对照研究是先根据是否患有所研究疾病确定病例和对照,然后调查两组对象既往对研究因素的暴露情况,在时间顺序上属于回顾性,因此又称为回顾性研究(Retrospective Study)。
④无法确证因果关联。判断事物之间是否有因果关联一个必要条件是明确知道“因”在前,“果”在后,而病例对照研究属于回顾性研究,研究因素与研究疾病之间的时间先后顺序无法确定,因此无法证实研究因素与疾病之间的因果关联。
3.研究类型
按照病例与对照的关系,可以将病例对照研究分为两大类,即非匹配(成组)病例对照研究和匹配病例对照研究。
(1)非匹配(成组)病例对照研究
从患有研究疾病的人群和未患所研究疾病的人群,分别抽取一定量的研究对象,组成病例组和对照组进行比较。该设计除要求病例组和对照组来自同一个源人群,对照的人数不少于病例人数外,对对照组的设置无其他条件限制。
(2)匹配病例对照研究
匹配(Matching)是选择对照的一种方法,指应用特殊的限制方法,要求对照与病例在某些特征上保持一致,以排除两组进行比较时匹配因素的干扰。这些用来匹配的特征或因素称为匹配因素或匹配条件。根据匹配的方式不同,病例对照研究可分为成组匹配和个体匹配两种形式。
①成组匹配(Category Matching):在选择对照时,要求对照组匹配因素的比例与病例组一致。例如,病例组中男女比例为4∶6,则对照组男女比例也应如此。
②个体匹配(Individual Matching):病例和对照以个体为单位进行的匹配。根据匹配的对照数量,可分为1∶1、1∶2、1∶3及1∶4的匹配病例对照研究。其中,1∶1匹配病例对照研究也可称为配对病例对照研究。
4.病例和对照的选择
(1)病例的选择
病例应符合统一的、明确的疾病诊断标准。尽量采用国际通用或国内统一的诊断标准,以便与他人的工作比较。如果需要自订标准,则要注意均衡诊断标准的假阳性率和假阴性率,使宽严适度。病例来源基本上分两大类:一类从医院(门诊或住院)获取;另一类来自自然人群(社区),可从现况调查或发病登记报告中获取。病例的类型包括新发病例、现患病例和死亡病例。新发病例由于患病时间较短,对相关暴露的回忆较为准确,但收集新发病例需要的时间长、费用高。患病多年的现患病例提供的暴露信息可能是患病后已经改变的暴露情况,或者因时间太久,使得病例对暴露史的回忆出现偏性。死亡病例的相关暴露信息一般是由家属提供的,信息的准确性较差。因此,如条件允许,应尽可能地选择新发病例。
(2)对照的选择
对照是指未患所研究疾病的个体,可以是健康个体,也可以是其他疾病的患者。若为后者,则不能选择与研究病因有关的其他疾病的患者作为对照。例如,研究运动与高血压发病关系时,不能选择冠心病患者作为对照,因为冠心病的发病本身也与运动直接相关,以冠心病患者作为对照,可低估运动与高血压之间联系的强度,甚至出现假阴性结果。与病例一样,对照的来源也分为两大类:第一类来源于医院内其他的病人:非研究疾病的病人,体检者。第二类是自然人群或健康人群:一般人群的抽样样本,熟人、朋友,同事,邻居,家庭内其他成员。
在实际工作中,可以设多种形式的对照,如既有医院的其他疾病患者,又有病例的亲属或邻居作为对照。多种形式的对照不仅可增强对照的代表性,还可能发现另外一些病因线索。
5.估计样本量
影响样本含量的因素如下:
①研究因素在病例组和对照组的估计暴露率(p1和p0)的差别,差别越小,需要的样本含量越大;
②比值比(OR),病例对照研究中反映暴露因素与研究疾病之间关联强度的指标;
③检验水准α,通常取α=0.05;
④检验效能(1-β),通常设定1-β=0.9,一般不宜低于0.8。
不同类型的病例对照研究的样本含量计算方法不同。
(1)非匹配或成组匹配的病例对照研究
通常,病例组和对照组的样本量相等或者对照组人数更多。当病例与对照组的例数相等时,样本含量可用式(8.3)估计:
式中,n为病例组或对照组的样本含量;zα与zβ分别为α、β对应的标准正态分布临界值;=(p1+p0)/2;p1=(OR×p0)/(1-p0+OR×p0)。
(2)配对病例对照研究样本含量估计
①计算病例与对照暴露情况不一致的对子数m。
式中,p=OR/(1+OR)。
②计算研究需要的样本含量总数M。
式中,p1和p0分别为目标人群中病例组和对照组某因素的估计暴露率。
6.资料整理分析
不管哪种类型的病例对照研究,资料的统计推断主要有3个方面:
①推断暴露因素与疾病有无关联;
②暴露与疾病的关联强度分析;
③总体参数估计,计算总体OR值的可信区间。
(1)非匹配或成组匹配病例对照研究资料分析
先将病例组和对照组按某个暴露因素的有无整理成四格表的模式(表8.1),再进行暴露因素与疾病的关联性及关联强度的分析。
表8.1 非匹配或成组匹配病例对照研究资料整理表
①暴露与疾病的关联性分析:从表8.1可知,病例组的暴露率为a/m1,对照组的暴露率为b/m0。暴露与疾病的关联性分析就是做假设检验,比较两组人群的暴露率。当N≥40、T≥5时,采用四格表χ2检验,如式(8.6)所示:
如果N≥40,当1≤Tmin<5时(Tmin为最小理论数,Tmin=mmin nmin/N),则应采用校正式(8.7)计算:
若χ2>χ2α,υ,则P<α,表明病例组与对照组暴露率差异有统计学意义,即所研究的暴露因素与疾病存在统计学关联;反之,若χ2<χ2α,υ,则P>α,即所研究的暴露因素与疾病无统计学关联。
②暴露与疾病的关联强度分析:在病例对照研究中,常用比值比(Odds Ratio,OR)来反映暴露因素与疾病关联强度的大小。OR也称为优势比,是指病例组某因素的暴露比值与对照组该因素的暴露比值之比。从表8.1可知,病例组的暴露比值为(a/m1)/(c/m1)=a/c;对照组的暴露比值为(b/m0)/(d/m0)=b/d。OR值的计算公式如下:
OR的含义与队列研究中的相对危险度(Relative Risk,RR)相同,指暴露组发生某病的危险性是非暴露组的多少倍。若OR=1,表明暴露因素与疾病无关联;若OR≠1,表明暴露因素与疾病有关联。若OR>1,称为正关联,该暴露因素为疾病的危险因素;若OR<1,则称为负关联,该暴露因素为疾病的保护性因素。
③总体OR的可信区间的估计:前面计算得到的OR是通过抽样调查所获得的样本OR,需要在此基础上进一步推论总体OR的可信区间(Confidence Interval,CI)。通常计算总体OR95%CI,较为常用的计算总体OR可信区间的方法是Miettinen法:
计算OR95%CI的意义:如果不包括1,则表示暴露因素与疾病有统计学关联;如果包含1,则表明暴露因素与疾病的联系无统计学意义。
【例8.1】一项关于饮酒与肝癌关系的病例对照研究,选择了200例肝癌患者作为病例组。另外,选择了200例未患肝癌者作为对照组,调查其既往饮酒的情况。具体资料见表8.2。
表8.2 饮酒与肝癌关系的非匹配病例对照研究
【解】①判断饮酒与肝癌有无关联。
因为χ2>χ02.05,1,所以P<0.05,表明肝癌组与对照组饮酒比例差异有统计学意义,说明饮酒与肝癌存在统计学关联。
②估计关联强度。
表明饮酒者是不饮酒者发生肝癌危险性的3.5倍。
③估计总体OR95%CI。
总体OR95%CI为(2.33,5.26),可以认为饮酒是肝癌的危险因素之一。
(2)配对(1∶1匹配)病例对照研究资料的分析
配对病例对照研究资料的整理格式见表8.3。
表8.3 配对病例对照研究资料整理表
配对病例对照研究资料的分析内容仍然有3个方面,但其χ2与OR的计算公式均与非匹配或成组匹配病例对照研究所用公式不同。
配对四格表资料χ2检验的计算公式如下:
如果b+c<40,则采用校正公式计算:
配对病例对照研究资料OR的计算公式如下:
【例8.2】某研究者采用1∶1配对病例对照研究对出生体重与成年期糖尿病的关联进行探讨。该研究按照年龄、家庭经济状况相同的原则,共选择160对病例和对照,收集其出生体重资料。该研究的资料整理见表8.4。
表8.4 出生体重与成年期糖尿病关联的配对病例对照研究
【解】①判断出生体重与成年期糖尿病有无关联。
因为χ2>χ02.05,1,所以P<0.05,表明出生体重与成年期糖尿病有统计学关联。
②估计关联强度。
表明出生体重超重者成年期发生糖尿病的危险性是出生体重正常者的3.5倍。
③估计总体OR95%CI。
总体OR95%CI为(2.20,5.58),可以认为出生体重超重是成年期糖尿病的危险因素。
7.优点与局限性
(1)优点
①与队列研究相比,所需样本量小,研究时间短,出结果快,节省人力、物力,容易组织实施。
②一次研究可同时调查多个因素与疾病的关联,如开展肺癌相关危险因素的病例对照研究,可同时调查吸烟、接触石棉、接触放射线、环境因素、家族史等多种因素与肺癌发病的关联。
③适用于罕见的、潜伏期长的疾病病因的研究,也适用于研究一些新出现的或原因不明的疾病,能广泛探索其影响因素。
(2)局限性
①不适用于研究人群中暴露率很低的因素。因所需要的样本量较大,影响研究的可行性。
②容易发生各种偏倚。病例对照研究发生各种偏倚的机会较大,尤其是极易发生回忆偏倚。
③暴露与疾病的时间先后顺序难以判断,因此无法直接推论因果联系。
④不能直接计算暴露组与对照组的发病率,无法直接计算相对危险度,只能计算比值比(OR)来估计联系强度。
(二)队列研究
1.基本概念
队列研究(Cohort Study)是将研究对象按暴露因素的有无或暴露水平分为若干组,追踪观察并比较各组人群在特定时间内与暴露因素相关结局(如疾病)发生率有无差异,从而判断暴露因素与疾病有无关联及关联程度的一种观察性研究方法。队列研究也被称为前瞻性研究、发生率研究、随访研究或纵向研究等。队列研究设计基本原理见图8.3。
图8.3 队列研究设计基本原理
2.特点
①研究方向是由“因”及“果”。队列研究是在尚未发生研究结局(如发病)前就确定了研究对象的暴露状况,前瞻性随访观察研究结局的发生情况,能检验暴露因素与一个或多个研究结局的因果关联。
②属于观察性研究范畴。队列研究中的暴露因素不是人为给予的,暴露组与非暴露组是根据研究对象“自然状态”下的暴露情况分组的,不受研究者控制,属于观察性研究的范畴。
③需要设立对照组。队列研究在研究设计阶段需要设立具有可比性的对照组,队列研究中的对照组即非暴露组,可以与暴露组来自同一人群,也可以来自不同人群。
④可以直接计算疾病发病频率的指标。队列研究要求在研究开始阶段所有研究对象均未发生研究结局,通过随访观察一段时间后,收集结局的发生数据,可以直接计算发病率、死亡率等指标。
3.研究类型
队列研究根据研究对象进入队列及终止观察的时点不同,可以分为3类,即前瞻性队列研究、历史性队列研究和双向性队列研究。队列研究类型见图8.4。
(1)前瞻性队列研究(Prospective Cohort Study)
研究对象的确定和分组是根据研究开始时的状态进行的,研究结局需要随访观察一段时间后才发生,因此又称即时性队列研究。这种设计类型可以直接获得暴露和结局的准确信息,资料偏性小,结果比较可靠,是队列研究的基本形式。其主要缺点是需要随访观察一定时间才能得到结局情况,研究周期长、花费大。
(2)历史性队列研究(Historical Cohort Study)
历史性队列研究又称回顾性队列研究。研究对象的确定和分组是根据研究对象在过去某个时点的暴露状态进行的,在研究开始的时候研究结局已经发生,研究者回顾性地收集相关信息开展研究。这种设计相比前瞻性队列研究周期短、投入少、很快能够得出比较可靠的结论,常被用于职业暴露人群的研究。其缺点是暴露因素和结局信息的准确性受多方面因素的影响,资料的偏倚较大。
图8.4 队列研究类型示意图
(3)双向性队列研究(Ambispective Cohort Study)
研究对象的确定和分组与历史性队列研究相同,是历史性队列研究的延续,又称为混合型队列研究。这种设计模式兼有前瞻性队列研究和历史性队列研究的优点。双向性队列研究适用于评价对人体同时具有短期和长期作用的暴露因素的效应,在研究开始时暴露因素导致的短期效应已经出现,而与暴露因素有关的长期效应(如致癌)还需要随访一段时间才能观察到。
4.研究对象
研究对象包括暴露组和非暴露组(对照组),暴露组有时可以根据暴露程度的不同分为不同暴露水平的亚组。根据不同的研究目的和研究条件,研究人群的选择有不同的方法。
(1)暴露组的选择
①一般人群:为一个范围明确地区的全体人群或其样本,选择其中暴露于欲研究因素者为暴露组。对于这类人群,所研究因素为一般人群的相关信息,如性别、年龄、生活习惯、环境因素等。研究疾病也多为常见病种,如高血压、糖尿病、冠心病等。其适用于同时观察多种暴露和多种疾病间的关系,可以获得疾病在一般人群中的发病率。例如,美国Framingham地区心脏病研究的主要目的是在一般人群中前瞻性地观察冠心病的发病率及年龄、性别等因素在冠心病发生、发展中的作用。
②职业人群:某些职业中常存在特殊暴露因素,使职业人群中某病的发病率或死亡率远远高于一般人群。职业人群的暴露史一般较明确,有关暴露与疾病的历史记录较全面、真实,故常作为历史性队列研究的首选,用来评价职业暴露因素与疾病的关系。例如,以煤矿工人为研究对象,观察游离二氧化硅粉尘暴露与肺癌的关系,选择染料厂工人研究联苯胺的致癌作用等。
③特殊暴露人群:对某因素具有特殊的暴露经历且暴露水平较高的人群。例如,选择核电站爆炸后的幸存者作为暴露组,研究放射线暴露与白血病的关系。在临床研究中,往往把接受了某种防治措施的患者看作是特殊暴露人群,用来研究该防治措施与疾病的关系。例如,以口服避孕药的妇女为暴露组,研究口服避孕药与妇女冠心病的关系;以服用小剂量阿司匹林的人为暴露组,研究阿司匹林预防脑卒中的效果等。
(2)对照组的选择
队列研究结果的真实性依赖于是否正确选择了对照组(非暴露组)。理想的对照组应该是除未暴露于所研究的因素外,其他因素的影响或人群特征(如年龄、性别、职业、民族、文化程度等)都应与暴露组相同。队列研究中的对照可分为4种,即内对照、外对照、总人口对照和多重对照。
①内对照:选择同一研究人群中的非暴露人群或具有最低暴露剂量的人群为对照。例如,研究吸烟与肺癌的关系,不吸烟者或吸烟量小者作为对照组,就是内对照。这种对照是比较理想的对照组,暴露组和非暴露组来自同一个人群,可比性好。
②外对照:选择人口学特征与暴露人群相似的另一个人群作为对照。在以职业人群或特殊暴露人群为暴露组时,常需选择外对照。例如,研究放射线的致病作用时,以放射科医师为暴露组,以不接触或极少接触放射线的五官科医师为外对照。
③总人口对照:在采用职业人群或特殊人群作为暴露组时,以该地区的全人口的发病或死亡率作为对照。这种对照并非真正意义上的对照,因为总人口中包含暴露者。总人口对照的资料容易得到,可以节约研究时间和经费。
④多重对照:即选择上述两种或两种以上的人群同时作为对照,以减少只用一种对照所带来的偏倚。
5.估计样本量
队列研究样本含量的计算指标主要包括随访期内对照组中研究结局发生率p0、暴露组研究结局发生率p1、统计学检验水准α和检验效能1-β。当暴露组与对照组样本含量相等时,其计算如下:
式中,n为暴露组和对照组分别需要的样本含量;p1=RR×p0,RR为估计的相对危险度;=(p1+p0)/2;α通常取0.05,u0.05=1.96;β通常设定为0.1,u0.1=1.28。考虑到失访率的影响,常在计算所得样本含量的基础上增加10%。
【例8.3】某医师欲采用队列研究阐明雌激素水平与老年人骨质疏松的关系。已知正常老年人骨质疏松的发生率为1%,估计血清雌激素水平低于正常值者发生骨质疏松的RR为2.2,设α=0.05、β=0.10,计算所需样本量。
【解】μ0.05=1.96,μ0.1=1.28。
按照10%的失访率计算,最终确定的样本量为2294+2294×10%=2524,即此项研究暴露组和对照组各需要随访观察2524例。
6.资料的收集与随访
(1)收集基线信息
基线信息包括研究对象在研究开始时所有相关的信息,如暴露情况、疾病情况、基本人口学资料以及其他可能的影响因素等。基线信息是确定暴露组和对照组的依据,也是将来分析数据的重要变量,应制订收集基线信息的详细计划和相关表格。为避免单一途径收集资料的不足,宜通过多种途径收集数据,如现场调查、查阅病历、日常报表以及研究对象既往的体检资料等。
(2)随访
随访(Follow Up)是队列研究的基本特征,通过随访,可以确定研究对象是否有失访、收集研究人群中结局事件的发生情况以及暴露因素和混杂因素的信息。在制订随访计划时,需要考虑以下5个问题:
①暴露组和对照组应采用相同的方法进行随访,并观察至研究终点。现实研究中失访是不可避免的,对失访者要进一步追访,收集所有可能的信息来了解失访的原因,比较失访者与未失访者基线资料的差异,以评估失访对研究结果的影响程度。
②确定可行的随访方法。常用的随访方法包括面对面访问、电话访问、信件访问、定期体检或复查以及查阅常规记录等。不同的随访方法各有优缺点,实际工作中可考虑多种方法综合应用。
③确定合理的随访时间间隔。队列研究往往需要多次随访,一般的慢性病随访间隔为1~2年。
④选择合适的随访人员,避免研究者主观因素对随访结果的影响。可以选择经过统一培训的技术人员、大学生、社区工作者或临床医师,最好不是研究者自己随访。对于已经制订的随访计划,要自始至终严格执行,不能随意更改。
⑤当某研究对象出现了研究结局时,就不再对其继续随访。
7.资料的分析
1)描述性分析
描述性分析包括描述研究对象的人口学特征、随访时间、失访情况;计算结局的发生率,根据研究资料的不同特点,可计算不同的描述指标。
①累积发病率(Cumulative Incidence,CI):已知无某种疾病的人群,经过一段特定的观察期之后,发生某病的频率。以整个观察期间内发生的所有病例数为分子,观察开始时队列人数为分母计算某病的累积发病率。累积发病率常用于队列人群数量较大且稳定的情况。
②发病密度(Incidence Density,ID):在一定时间内某人群发生某病新病例的速率。如果队列人口不固定时,研究对象进入和退出队列的时间先后不同、出现研究结局的时间不同等可造成每个研究对象被观察的时间不一致。例如,随访周期为10年,在研究结束时有的对象可能只被观察了7年、5年、3年或几个月不等,若以总人数为分母计算发病率是不合理的,因为失访者若能坚持到随访期结束,则仍有发病的可能性。此时,需以观察人时(观察人数与随访时间的积)为分母,观察期间所有新发病例数为分子计算发病率。常用的人时单位是人年。发病密度常用于队列人群变动较大、观察时间较长的情况。
2)描述性分析
队列研究资料的推断性分析包括比较暴露组与非暴露组结局发生率的差异,推断暴露因素与疾病有无关联,计算关联强度指标。
(1)比较暴露组与对照组结局发生率的差异
通过u检验、卡方检验或Fisher精确概率法等假设检验方法,比较暴露组与对照组之间结局发生率的差异。当假设检验结论为暴露组与对照组的结局发生率差异有统计学意义时,说明暴露因素与疾病有关联,需要进一步计算暴露因素与疾病的关联强度。
(2)计算关联强度
队列研究资料一般整理成表8.5的形式。
表8.5 队列研究资料归纳整理表
①相对危险度(Relative Risk,RR):暴露组的发病率(或死亡率)(I1)与对照组的发病率(或死亡率)(I0)的比值,是反映暴露因素与发病(或死亡)关联强度最常用的指标。
式中,RR表示暴露组发病(或死亡)的危险是对照组的多少倍:RR=1表示两组的发病率(或死亡率)没有差别;RR>1表示暴露组的发病率(或死亡率)高于对照组,该暴露因素为危险因素;RR<1表示暴露组的发病率(或死亡率)低于对照组,该暴露因素为保护性因素。RR离1越远,表明暴露因素与结局的关联强度越大。
由样本资料计算的RR只是总体RR的一个点估计值。对于总体RR,需要按照一定的可信度估计其可信区间,常用的是95%可信区间。Woolf法是建立在RR的方差基础上的一种简单计算方法,具体如下:
lnRR的方差的计算:
lnRR的95%可信区间的计算:
其反自然对数即为RR的95%可信区间。
②归因危险度(Attributable Risk,AR):又称特异危险度、超额危险度,是暴露组发病率(或死亡率)与对照组发病率(或死亡率)的差值,表示发病(或死亡)危险特异地归因于暴露因素的程度。
③归因危险度百分比(Attributable Risk Proportion,AR%):又称病因分值,是指暴露组中的某病发病(或死亡)归因于暴露因素的部分占暴露组全部发病(或死亡)的百分比。
也可以根据已知的RR计算AR%:
④人群归因危险度(Population Attributable Risk,PAR):总人群中某病发病率(或死亡率)(It)与非暴露组发病率(或死亡率)(I0)的差值,表示总人群中因暴露于某因素而引起的某病发病率(或死亡率)。
⑤人群归因危险度百分比(Population Attributable Risk Proportion,PAR%):又称人群病因分值,是指总人群的某病发病(或死亡)归因于暴露因素的部分占总人群该病发病(或死亡)的百分比。
【例8.4】已知吸烟者肺癌年死亡率(I1)为0.4833‰,非吸烟人群肺癌年死亡率(I0)为0.0449‰,全人群的肺癌年死亡率(It)为0.2836‰,计算RR、AR、AR%、PAR、PAR%。
【解】RR=I1/I0=0.4833/0.0449=10.8,说明吸烟者的肺癌死亡危险是非吸烟者的10.8倍。
AR=I1-I0=0.4833-0.0449=0.4384,说明如果去除吸烟因素,则可使吸烟人群肺癌死亡率减少0.4384‰。
说明吸烟人群中由吸烟引起的肺癌死亡占所有肺癌死亡的90.7%,亦即吸烟人群中有90.7%的肺癌死亡是由吸烟引起的。
PAR=It-I0=0.2836-0.0449=0.2387,说明如果去除吸烟因素,则可使全人群减少0.2387‰的肺癌死亡。
说明全人群中由吸烟引起的肺癌死亡占所有肺癌死亡的84.2%,亦即全人群中有84.2%的肺癌死亡是由吸烟引起的。
从上述计算结果可知,虽然吸烟导致肺癌的AR%达90.7%,但因人群中只有部分人吸烟,故PAR%仅为84.2%。
8.优点与局限性
(1)优点
①资料可靠性高,一般不受回忆偏倚影响。
②暴露资料的收集在结局发生之前,因果时间顺序明确,检验病因假说的能力较强,一般可达到验证病因假设的目的。
③能够直接获得暴露组和非暴露组的发病(死亡)率,可以直接计算相对危险度、归因危险度等评价暴露因素与疾病关联强度的指标。
④随访过程有助于了解疾病的自然史。
⑤在一次研究过程中,可以观察到一种暴露因素与多种疾病结局的关联。
(2)局限性
①对于发病率低的疾病,需要观察的人群样本量大,一般难以达到。
②随访过程中,由于退出、死亡、人口流动等原因造成的失访难以避免。
③研究耗时长、花费高,组织实施过程中面临的困难较大。
④随着时间的推移,结局受不可预知因素的影响较多,资料分析复杂。