五、人类基因组
人类基因组DNA总量约3×109 bp,编码序列占基因组DNA总量的5%以下,非编码序列占95%以上。非编码序列包含启动子、增强子、内含子等序列,另外还有大量的重复序列。基因组中DNA重复序列承受的选择压力较小,因此在个体间较易积累变异,这是形成DNA多态性的重要遗传基础。
1.人类基因组DNA的多态性
正常群体(如正常人群)的DNA分子或基因的某些位点或区段,由于遗传或环境的原因可以发生序列改变,使不同个体在这些位点的DNA一级结构各不相同,这种现象称为DNA多态性。将易于鉴别的DNA多态性开发成DNA指纹图谱,可作为在分子水平上区别个体差异的遗传标志。
人类基因组中DNA序列的多态性可分为两类,即DNA位点多态性和长度多态性。位点多态性是指等位基因之间在特定位点上DNA序列的差异,这些位点上某一碱基存在与否或序列异同,将决定这段DNA能否被某一限制性核酸内切酶水解,从而获得大小不等的片段,这种多态性常用来分析个体间DNA的位点差异;长度多态性是指由不同个体等位基因之间存在的DNA序列长度差异构成的多态性。这种长度多态性形成的原因有两种:一种是等位重复序列的重复次数不同,常称为可变数目串联重复序列(VNTRs),又称小卫星DNA,是一种数十到数百个核苷酸的重复短序列,重复拷贝数可以是10~1 000不等,VNTRs在人群中出现的频率极高;另一种是某一等位片段的插入或缺失,常简称为Indel。
2.人类基因组的重复序列
(1)反向重复序列 反向重复序列是指两个顺序相同的拷贝在DNA链上呈反向排列。这种反向排列的拷贝之间或有一段间隔序列(可形成茎环结构),或两个拷贝反向串联在一起,中间没有间隔序列,这种结构亦称为回文结构,如图2-7所示。人类基因组约含5%的反向重复序列,散布于整个基因组中,常见于DNA复制起点、基因转录的终止子及调控区,与DNA复制和基因表达调控有关。
(2)串联重复序列 串联重复序列的特点是,具有一个固定的重复单位,该重复单位头尾相连形成重复顺序片段,串联重复序列约占人类基因组的10%。
图2-7 反向重复序列和回文结构示意图
串联重复序列按其存在的位置分为编码区串联重复序列、非编码区串联重复序列和散在重复序列。而非编码区串联重复序列通常存在于间隔DNA和内含子内。串联重复单位的长短不等,重复次数从几次到数百次,甚至几十万次,这类重复序列是组成卫星DNA的基础。
(3)散在重复序列 人类基因组DNA中除串联重复、反向重复之外的重复序列,不论重复次数多少,都可归为散在重复序列。