第六章 DNA 序列多态性 人类基因组DNA序列差异是个体间最本质的差异。 (sequence polymorphism)。 同一个体不同组织、器官的细胞中基 因组DNA序列一致,是法医学个体识别鉴定的基本前提。
DNA 序列多态性常用检测技术: 1)序列测定 2)斑点杂交技术 3)PCR-RFLP技术 4)序列特异性PCR技术 5)其他:SSCP, MVR-PCR 新技术:DNA芯片技术 DHPLC技术 MALDI-TOF-MS技术
DNA 序列测定 DNA序列测定(DNA sequencing) 是对 DNA分子一级结构的分析。从多态性的概念分 析,序列测定的靶位点碱基种类,实质是SNP:在 特定的染色体、特定的靶位点上,不同个体、不同 等位基因的碱基种类。 一、双脱氧核苷酸 链终止法测定原理 经典的核酸序列测定方法有: Sanger 双脱氧核苷酸链终止法 Maxam化学降解法
DNA复制的基本条件: ▲单链DNA模板 ▲DNA聚合酶 ▲寡核苷酸引物 ▲dNTP合成原料 基本过程: 1)引物与模板退火形成双链区。 2)DNA聚合酶结合并启动引物延伸。 3)dNTP按照碱基配对原则逐个连接在引物的3’端,以5’→3’方向延伸合成一与模板互补的DNA新生链。
1.DNA聚合酶与模板结合,在模板链上移动方向:由模板的3’→5’;引物延伸方向是5’→3’。 2.dNTP按照碱基配对原则,连接在引物3’末端。 3.新合成链碱基与模板对应碱基间以氢键连接;连接引物末端与新连接的碱基之间是磷酸二酯键。
磷酸酯键 连接
2’-d-脱氧核糖 2’,3’dd-双脱氧核糖
在DNA合成体系中如果加入2’,3’-ddNTP,当ddNTP按照碱基互补原则连接到引物3’端,该最后一个碱基没有3’-OH ,无法连接后续的dNTP,使该引物链终止在这个碱基位置上,不再延伸。 由于反应体系中还加有dNTP,与ddNTP形成竞争状态。引物末端连接有dNTP者,可以继续延伸。最后DNA合成的产物是一系列具有不同ddNTP终端的新合成DNA链。 例如,在反应体系中加dCTP和ddCTP:
设置一套四组反应体系:A,T,G,C: 每组除正常反应需要的dNTP外,分别加入:ddATP, ddTTP, ddGTP, ddCTP。 复制产物经过电泳后,直接银染显带,或采用同位素标记放射性自显影,或者四组引物分别用4种荧光染料标记。 经过DNA合成反应后,由ddNTP终止的不同长度的新生DNA片段。然后分四泳道分离。检测被终止DNA片段长度并确定碱基种类,可以直接读出DNA序列。
自动循环测序技术: 利用PCR技术,以靶片段为测序模板,反应体系中同时加入有dNTP和ddNTP,PCR产物是不同长度的被终止片段。 标记方式:多采用:Dye-terminators。如果4种ddNTP分别 标记不同的荧光: (例如:A-绿、C-红、G-蓝、T-黄) 荧光染料基团标记的 基本特点: ▲激光诱发吸收光谱在可见光范围。 ▲不影响引物延伸反应。 ▲不影响标记后DNA片段的电泳性质。 ▲4种荧光的吸收和激发波长有足够的差异。
四组反应安排在同一管中进行。循环测序只需要一条引物,模板DNA以线性方式扩增,引物延伸分子以不同碱基对应位置终止的片段。 电泳技术的检测灵敏度要求高,必须能够区分相差一个碱基对的DNA片段。 毛细管电泳自动检测目前是常规检测技术 读序原则与依据: ▲荧光波长(颜色),判定引物链终止在哪一种核苷酸, ▲由DNA片段电泳通过激光检测窗口的即时时间判定片段长度。 从电泳图谱可以直接读出模板的碱基序列。
二 等位基因特异性探针杂交技术 Allelic specific oligonucleotide (PCR-ASO) 杂交的定义与条件
法医学应用:HLA-DQA1基因座和PM系统。 ▲等位基因特异性探针杂交技术原理: 依据序列等位基因的序列差异,设计针对不同等位基因的DNA探针,并标记有示踪物。与样本DNA扩增产物杂交,有杂交信号,证实样本个体具有相应的等位基因。 ▲基本步骤:1)PCR扩增 2)杂交 3)杂交信号显示 法医学应用:HLA-DQA1基因座和PM系统。
反向斑点杂交(reverse blot hybridization):
固定载体膜上的 探针, 可以呈点状(点印迹 dot blot); 也可以呈线条状(线条状印迹 line blot)。
1. HLA-DQA l 基因座 (旧称HLA-DQα) 反向斑点杂交检测HLA-DQα是法医学应用最早的PCR技术序列多态性分型技术。 已确定的HLA-DQAl基因座可表达的等位基因有12个,反向杂交法用11个寡核苷酸探针可区分其中的8种等位基因: HLA-DQαl.1、1.2、1.3、2、3、4.1、4.2和4.3。 反向杂交技术商品试剂盒主要检测的是前6个常见等位基因。
Polymarker system: 包括:低密度脂蛋白受体,血型糖蛋白A,血红蛋白Gr球蛋白,D7S8,型特异性成分等 5 基因座。
PM系统同步检测5个基因座,个体识别能力达到0.99以上。 不同人群基因频率分布见表6-3 (p154)。 ASO杂交技术 优点: ▲分型操作简单,结果判定容易。 ▲无须电泳,避免片段长度检测误差。 ▲重复性好。 ▲灵敏度和特异性好。 技术 缺陷:信息量低。价格因素。
原理:依据等位基因碱基序列差异,选择适当的限制酶,对等位基因PCR产物作RFLP分析,可以区别不同的等位基因。 (注意与DNA指纹RFLP的区别)
谷丙转氨酶(GPT)基因-RFLP分型 GPT基因定位8q24. 3,基因跨距2 谷丙转氨酶(GPT)基因-RFLP分型 GPT基因定位8q24.3,基因跨距2.7kb。基因有11个外显子。 GPT多态性由第1外显子密码子14出现一个点突变:C304A。 等位基因 *1序列:CATG (Nla III) *2序列:AATG
1 PCR:GPT基因扩增引物(产物长 163bp): 5’-CCTTCCCGCCTGGTCTGGGT-3’ 5’-AGCTCCAAGGCTCGCTGCAC-3’ 限制酶消化: Nla III 消化, GPT 1-1型:67,40,31,25bp GPT 2-1型:71,67,40,31,25bp GPT 2-2型:71,67,25bp
PCR-RFLP分析技术特点: ▲技术简单,分型结果容易判定。 ▲电泳后图谱无须准确确定片段长度。 ▲重复性好,灵敏度高。 问题: ▲ 单就某个基因座而言,等位基因数有限,多态性程度不高。 ▲ 不是所有点突变都能利用RFLP技术检测,只有涉及到限制酶识别点时才能够采用RFLP分析,观察发现:基因组DNA中的点突变,大约只有 1/3 与限制酶识别点有关。 ▲ 酶切条件要求严格,影响到可重复性。 ▲ 不能解决混合斑迹的个体识别问题。
PCR-RFLP技术简单实用、成本低,广泛地应用在点突变检测。 Rousselet(1998)总结人mtDNA-D环1100bp中有88个突变点,其中只有21个可以采用RFLP技术检测,HV-I区段18个,HV-II区段中有3个。 法医生物学检材的特殊性,以及RFLP分析的酶切条件要求十分严格,影响了检测结果的可重复性。多态性程度不如序列多态性检测。 mtDNA序列变异的RFLP分析实际应用受限。
(sequence specific primer-PCR) 根据等位基因碱基序列设计 ‘等位基因特异性引物’, 例:Gc基因定位:4q11-13,编码区长度1377bp,编码485个氨基酸。 变异位于11号外显子 416密码子G1248T; 420密码子A1259C。
PCR反应特异性的关键因素在于引物3’末端碱基与模板的匹配,控制引物链能否顺利退火和延伸。
五 PCR-SSCP 技术 单链构象多态性(single strand conformation polymorphism ,SSCP) 在正常情况下,双链DNA凝胶电泳的迁移率主要与分子量有关。而单链DNA在非变性PAG中,迁移率不仅与分子量有关,而且与单链分子的构象也有关。单链分子的构象主要与碱基构成有关,相同长度的单链DNA,因内在碱基组成不同,甚至单个碱基差异,可以形成不同的空间构象,出现迁移率的差异。最终表现成SSCP电泳图谱的差异。
PCR-SSCP技术简单,检测灵敏度高。多用于单个碱基突变形成DNA序列多态性的筛选。 (2)扩增产物96℃变性10m,立即冰浴3min。 (3)T6%C3% PAG加样电泳。 (4)银染显带(或扩增产物标记显示)。
HLA-Cw-PCR-SSCP分型
mtDNA-PCR-SSCP
PCR-SSCP技术的优点: 1)操作简单,无须复杂的专业设备。 2)试验周期短,可用于大量样本的排查。 3)可以通过标识物或者银染显带,成本低。 4)检测灵敏度较高,无假阳性结果。 缺陷: 1)可以发现点突变,但不能确定碱基位置,须要进一步测序。 2)迁移率与分子构型相关,不能确定片段的准确长度。 3)无法标准化命名。 4)可重复性问题。信息量问题。
六 MVR-PCR技术 1) D1S8(MS32)小卫星,重复单位29bp。串联重复单位碱基组成不是一成不变。大约有一半的重复单位内含A-G替换,构成一个Hae III识别点(-GGCC-)。称为: Microsatellite variant repeat mapping, MVR。 2)能被Hae III识别的重复单位称a型;不能被Hae III识别的称t型。 3) 针对A/G设计特异性引物: 32-TAG-A和32-TAG-G, 上游的公共引物为:32D。 4)电泳:
5)显带 6)判型数字编码(含Hae III点为A;不含Hae III为T): ①A+;T-为1型; ②A-;T+为2型; ③A+;T+为3型。记录2个体的前40个重复单位: A: 11223 21311 21332 12123 12122 12312 13112 11122 B: 21112 12311 13221 11121 13221 13213 11231 22113 对200名汉族人群调查,统计前40个重复单位,没有发现相同的个体,计算平均匹配概率为10-15。 D1S8(MS32)小卫星理论上有240个重复单位。理论计算可以鉴别2241=3×1072种等位基因。
(single nucleotide polymorphism, SNP) 单核苷酸多态性 (single nucleotide polymorphism, SNP) 特点: 1 基因组中含量丰富,按1/1000碱基突变率计算,SNP估计有300万座位。 2 从本质上反映出个体差异,群体结构差异的标记系统。 3 信息量大,同步检测50-100个SNP,可以达到15个STR基因座的信息量。 4 二等位基因系统,利于信息数据化,利于自动检测。 5 检测SNP的PCR产物长度在100bp左右,利于降解DNA的分析检测。也利于复合扩增体系建立。
SNP基因座选择基本条件: 1 数据库中候选SNP,必须经过群体调查证实是随机人群中存在的二态遗传标记,并出现在主要人群中。 2 等位基因频率其中一个在0.5~0.7 (DP值在0.625~0.580),有足够的多态性。 3 突变率低。 4 SNP基序列不存在串联重复结构,GC含量平衡。 5 SNP附近不能有容易突变的碱基,有利于引物设计。 6 遗传连锁问题。SNP间距大于1000kb为基本要求。
所有的DNA序列分析技术理论上都可以利用来检测SNP。 突破点在于多基因座同步检测,达到一次检测可以获取大量的遗传信息,才有实用价值。 新技术: 1. DNA芯片技术 2. DHPLC技术 3. MALDI-TOF-MS技术
生物芯片技术 (DNA chip) 基本原理是DNA分子杂交。 靶SNP的PCR扩增片段与固定在膜上的探针杂交。根据杂交阳性或阴性,以不同标记荧光波长呈现,在激光共聚焦显微镜下收集信号并判读,由计算机记录和处理。
技术为DNA chip提供强大的技术支撑。‘微 缩芯片实验室’的技术设想。 法医学DNA分析技术的新领域 技术优势: ▲ 巨大的信息量。在同一时间和条件下,快速获取样本SNP信息。 ▲ 高度专一性和敏感性。可靠并准确检测 出10pg/µl的DNA样本。 ▲ 高度的可重复性。尼龙膜探针阵列可重 复应用。 ▲ 微型化与自动化。微加工技术、计算机 技术为DNA chip提供强大的技术支撑。‘微 缩芯片实验室’的技术设想。 法医学DNA分析技术的新领域 (目前存在问题)
基质辅助激光解析电离/飞行时间 质谱技术(MALDI-TOF-MS) 基本原理:样本分子分散在基质分子中形成晶体。用激光→晶体,基质吸收能量→样本分子解吸附→电离样本分子在电场的作用下→飞过检测真空管→依据到达检测器的飞行时间不同→测到分子质量差异→获得序列差异信息(m/z)。
MALDI-TOF-MS技术检测SNP实例 检测apoE SNP(334T/C位点) 1.样本基因组DNA提取。 2.PCR扩增靶片段,产物纯化。 3.特异性单碱基延伸反应,产物纯化。 4.样本TOF-MS分析,计算引物峰与样本峰 之间的m/z之差,推断SNP(334T/C位点) 的碱基种类。 技术优势: 高灵敏度,高信息量
变性高效液相色谱技术(TmHPLC) 基本原理:
生物芯片、MALDI-TOF-MS、DHPLC等均是解决多SNP座位同步检测的前沿技术。目前开发的还有焦磷酸测序技术、微测序技术、实时荧光定量PCR技术等。但是从目前的研究看,它们存在问题主要是法医物证检材的特殊性造成的。 2004年,欧洲法医科学中心(ENFSI)DNA工作组、美国DNA分析方法科学工作组(SWGDAM)联合评估结论: 未来很多年内,SNP不太可能取代STR作为法医科学样本的参考检测方法。