第三章 遗传的分子基础
第一节 DNA的组成与结构 一、组成 DNA与RNA的化学组成 核 糖 碱 基 磷 酸 RNA 核糖 AGCU 磷酸 核 糖 碱 基 磷 酸 RNA 核糖 AGCU 磷酸 DNA 脱氧核糖 AGCT 磷酸
碱基的种类: (1)双环结构的嘌呤: 腺嘌呤(A) 鸟嘌呤(G) (2)单环结构的嘧啶: 胞嘧啶(C) 胸腺嘧啶(T) 尿嘧啶(U)
核苷酸:每个核苷酸分子是由一个戊糖、 一个含氮的碱基和一个磷酸脱 水缩合而成的。
核苷酸: 腺苷酸(AMP)、鸟苷酸(GMP) 尿苷酸(UMP)、胞苷酸(CMP) 脱氧腺苷酸(dAMP)、脱氧鸟苷酸(dGMP) 脱氧胸苷酸(dTMP)、脱氧胞苷酸(dCMP)
二、结构
双螺旋结构要点: ①为两条反向平行的多核苷酸链,碱基在 螺旋内侧,磷酸和脱氧核糖位于外侧; ②两条链之间靠碱基对之间氢键连为一体, A=T G≡C; ③螺旋直径2nm,每个螺圈含10个碱基对, 螺距3.4nm; ④表面的深沟、浅沟为蛋白识别DNA单一序 列并发生作用的基础。
第二节 真核基因的分子结构 一、人类基因组的组成 单一序列(unique sequence) 第二节 真核基因的分子结构 一、人类基因组的组成 单一序列(unique sequence) 重复序列(repetitive sequence) 高度重复序列 中度重复序列 多基因家族 拟基因
单一序列 单一序列:占基因组的60%-65%,一个基因组中只有1个或很少几个拷贝,由800-1000bp组成,构成结构基因(2-2.5万)。
高度重复序列 高度重复序列:由很短的碱基序列重复而成,长度2~200 bp,重复次数106~108。 Back 1. 卫星DNA(satellite DNA): 2~10bp,用梯度离心法将它与主体DNA分开,其序列成串排列,简单重复,集中分布在染色体的着丝粒和随体上。 2. 小卫星DNA (minisatellite DNA): 2~25bp重复单位。 微卫星DNA (microsatellite DNA) or STR: 2~6bp为重复单位,长度10~60bp,高度重复,表现为高度多态。 Back
3. 反向重复序列(inverted repeat sequence):由两个相同顺序的互补拷贝在同一DNA链反向排列而成。变性后再复性时,同一条链内的互补的拷贝可以形成链内碱基配对,形成发夹式或“+”字形结构。 回文结构(palindrome):倒位重复没有间隔者称回文结构。
中度重复序列 中度重复序列:由长度300 bp~7000 bp的序列重复而成,重复次数102~105。 Back 1. 短分散元件(short interspersing element,SINE):重复顺序平均长度为300~500bp的短分散片段(short interspersed repeated segments, SINES),拷贝数102~105。 如Alu家族、Hinf家族等。 2. 长分散元件(long interspersing element,LINE): 以及重复顺序平均长度5000~7000bp的长分散片段(LINES),拷贝数3000~4000个,如KpnⅠ家族等。 Back
Alu家族 Alu序列分散在整个哺乳动物基因组中,平均每5kb就有一个Alu顺序。在间隔DNA,内含子中都有Alu序列。约占人基因组的3~6%。 Alu序列长度约300bp,每个序列中有一个限制性内切酶Alu的切点(AG↓CT)而定名为Alu家族。 Alu顺序具有种的特异性,人的Alu顺序制备的探针只能用于检测人的基因组中的Alu序列。 Alu家族的功能:由于在许多hnRNA中含有大量的Alu顺序,而且,Alu顺序含有与某些真核基因内含子剪接接头相似的序列,因而,Alu顺序可能参与hnRNA的加工与成熟。 KpnⅠ家族 用限制性内切酶KpnⅠ切灵长类动物的DNA,在电泳谱上可看到4个不同长度的片段,这就是KpnⅠ家族。占人体基因组的1%。 KpnⅠ家族成员顺序比Alu家族长,而且不均一,呈散在分布,属于中度重复顺序的长分散片段型。
多基因家族 多基因家族(multigene family):由一个祖先基因经过重复和变异形成的一组来源相同、结构相似、功能相关的基因。 两种类型: 由一个基因产生多次拷贝,具有几乎相同的顺序,成簇地排列在同一条染色体上,形成一个基因簇(gene cluster)。它们同时发挥作用,合成某些蛋白质。如rRNA、tRNA和组蛋白的基因。 一个多基因家族的不同成员成簇地分布在几条染色体上,成员间序列有所不同,编码一组关系密切的蛋白质。如珠蛋白基因。
拟基因 拟基因(pseudogene):也称假基因,指在多基因家族中,某些成员不产生有功能的基因产物,这些基因称为拟基因,常用ψ表示。 Back
二、真核基因的分子结构特征 断裂基因(split gene):基因的编码序列被非编码序列所间隔,形成嵌合排列的断裂形式称为断裂基因。 exon enhancer CAAT box TATA box GC box intron AATAAA CAAT box G G C A A T C A C T T A T A A A T Hogness box GC box GGCGGG GT — AG law
结构基因 外显子:具有编码意义 转录单位 内含子:无编码意义( 5′GT、 3′AG;GT -AG法则) TATA框 前导区 启动子 CAAT框 非编码区 尾部区 增强子 GC框:调节转录活动。 调控 区 mRNA裂解信号 终止子 回文结构
Interrupted gene
(一) 外显子和内含子 外显子(exon) 断裂基因中编码序列称为外显子,它是基因中可表达为多肽的部分。 内含子(intron) 断裂基因中的非编码序列称为内含子。 外显子与内含子接头——“GT–AG法则” 外显子与内含子相连接的部位通常是一段高度保守的特定序列,即内含子5′端都是GT开始,3′端都是AG结尾,这种接头方式称为“GT–AG法则”。 在RNA中对应为GU–AG,是RNA剪接的信号。
(二)结构基因的侧翼序列 1.启动子 2.增强子 3.终止子
启动子(promoter): 是指位于转录起始点上游(通常位于基因转录起点上游的100bp范围内)的特异序列,是转录起始时RNA聚合酶识别和结合的部位,与转录的启动有关,但本身并不转录。
名称 TATA框 (TATA box) CAAT框 (CAAT box) GC框 (GC box) 所处位置 转录起始点上游约19~27bp处 位于转录起始点上游70~80bp 有两个拷贝,分别位于CAAT框的两侧 组成 TATA(A/T)A(A/T) GG(T/C)CAATCT GGCGGG 功能 与转录因子TFⅡ结合,能够准确识别转录起始点 与转录因子CTF结合,促进转录 与转录因子SP1结合,起增强转录效率的作用
2.增强子(enhance):真核基因转录起始点的上游或下游的一段不能启动基因的转录,但能增强转录的DNA序列。 由串联重复的72bp长的两个相同顺序组成。 特点: 1.它与启动子位置无关,不论在启动子上游或下游,甚至隔几千个bp对,只要存在同一DNA分子上,都能对其作用。如果邻近有几个启动子,增强子总是优先作用与最近者。 2.它无方向性;作用方向可以是5'- 3’也可以是3’- 5' 。 3.有种属特异性;不同细胞核有不同的特异性因子与增强子结合, 对基因表达有组织器官,时间不同的调节作用。 例:胰岛素B细胞中有一特异蛋白因子能于5'末端上游250bp处的组织特异性增强子结合,促进胰岛素基因转录和翻译,其它组织中则无。
3.终止子(terminator): 是位于基因末端的一段特异序列,具有终止转录的功能。它位于转录终止点的上游,由一段反向重复序列及特定的序列5'-AATAAA-3'组成,二者构成转录终止信号。
第三节 DNA复制
1. 双向复制 真核生物(Eukaryote) : 多复制起点 即--一个genome中有多个复制单位
2. 半保留复制(semiconservative replication)
3. 半不连续复制 复制起始点 复制叉 复制起始点 岗崎片段 复制叉 先导链 RNA引物 后导链(延迟链) 5 3 5 3 5 3. 半不连续复制 复制起始点 5 3 5 3 复制叉 复制起始点 岗崎片段 复制叉 5 3 5 3 5 3 5 3 先导链 RNA引物 后导链(延迟链)
第四节 基因表达 DNA RNA 蛋白质 基因表达:DNA序列所携带的遗传信息,通过转录和翻译形成具有生物活性的蛋白质的过程。 转录 翻译 第四节 基因表达 基因表达:DNA序列所携带的遗传信息,通过转录和翻译形成具有生物活性的蛋白质的过程。 转录 翻译 DNA RNA 蛋白质 逆转录 复制 复制
(一) 转录 对于任一个特定的基因,DNA双链分子中只有一条链带有遗传信息,称为编码链(coding strand),与之互补的称为反编码链(anticoding strand)。 转录(transcription):在RNA聚合酶的催化下,以DNA的反编码链为模板,按照碱基互补配对原则,以dNTPs为原料合成RNA的过程。
编码链:5' - ATG AAA CGA GTC TTA TGA -3' 反编码链: 3'- TAC TTT GCT CAG AAT ACT -5' mRNA: 5'- AUG AAA CGA GUC UUA UGA -3'
DNA的初始转录产物是mRNA的前体,比成熟的mRNA大4~5倍,称为核内异质RNA(hnRNA)。hnRNA需要经过转录后加工才能成为成熟的mRNA。 1. 戴 帽 2. 剪 接 3. 加 尾
(二)翻译 1.人体中的蛋白质由20中氨基酸组成。 密码子:是指核酸分子中的碱基序列与蛋白质中的氨基酸序列之间的对应关系。RNA只有4种核苷酸,而蛋白质中有20种氨基酸。如果以一对一的方式,即一个核苷酸决定一个氨基酸,RNA只能决定4种氨基酸。若是2个核苷酸为一个氨基酸编码,则遗传密码只能代表16种氨基酸。如果以3个核苷酸编码一个氨基酸,则能形成64种密码子,完全可以满足编码20种氨基酸的需要。
2.蛋白质合成
(三) RNA编辑及意义 RNA编辑(RNA editing):导致生成的mRNA分子在编码区的核苷酸顺序不同于其DNA模板相应顺序的过程。 1. 尿嘧啶核苷酸的加入或删除 2. C→U、A→G或G→A的RNA碱基转换 3. C→G、G→C或U→A的RNA碱基颠换
(三) 遗传印记 遗传印记(genetic imprinting):不同性别的亲体传给子代的同一染色体或基因,当发生改变时可引起不同表型的现象,也称为基因组印记(genomic imprinting)。 父母双方的某些同源染色体或等位基因存在着功能上的差异。 母系印记:母源基因失活,父源基因表达 父系印记:父源基因失活,母源基因表达
Prader-Willi综合征(PWS) & Angleman综合征(AS) PWS和AS的发生都涉及15q13的基因异常 父系印记使位于15q13的 某些基因失活,导致PWS 的发生 母系印记使位于15q13的 某些基因失活, 导致AS的发生
特殊面容,大嘴,呆笑,红面颊,步态不稳等。 智力低下,过度肥胖,身材矮小。
Huntington舞蹈症系谱(MIM 143100) 1 2 3 4 5 Ⅰ Ⅱ Ⅲ 1 2 1 2 3 4 5 44 45 42 31 41 30 46
第五节 基因突变 (一) 基因突变的概念 基因突变(gene mutation):基因在结构上发生碱基对组成或排列顺序的改变。 第五节 基因突变 (一) 基因突变的概念 基因突变(gene mutation):基因在结构上发生碱基对组成或排列顺序的改变。 点突变(point mutation):基因(或DNA链)中一个或一对碱基改变时。 突变基因(mutant gene):基因突变后在原有基因座上出现的新基因。
(一) 基因突变的结果 1. 中性突变(neutral mutation) 2. 造成个体化学组分的遗传学差异 3. 有益突变 (一) 基因突变的结果 1. 中性突变(neutral mutation) 2. 造成个体化学组分的遗传学差异 3. 有益突变 4. 有害突变 —— 遗传病 5. 致死突变(lethal mutation)
(二) 基因突变的分子机制 1. 碱基替换 :指一个碱基对被另一个不同的碱基对所替换,为DNA分子中单个碱基的改变,即点突变。 (二) 基因突变的分子机制 1. 碱基替换 :指一个碱基对被另一个不同的碱基对所替换,为DNA分子中单个碱基的改变,即点突变。 转换(transition):指嘌呤取代嘌呤,或嘧啶取代嘧啶。 颠换(tranversion):指嘌呤取代嘧啶,或嘧啶取代嘌呤。
(二) 基因突变的分子机制 1. 碱基替换 同义突变(same sense mutation) :指碱基替换后,一个密码子变成另一个密码子,但是所编码的氨基酸没有改变。 例:DNA GCG mRNA CGC 都是编码精氨酸的密码子。 GCA CGU
(2) 错义突变(missense mutation):是指碱基替换后 使 mRNA的密码子变成编码另一个氨基酸的密码子, 改变了氨基酸的序列,影响蛋白质的功能。 例:DNA TTT mRNA AAA (赖氨酸) TGT ACA (苏氨酸) (3) 无义突变(nonsense mutation):是指碱基替换后,使一个编码氨基酸的密码子变为不编码任何氨基酸的一个终止密码子UAG,UAA,UGA),造成多肽链合成的提前终止肽链长度缩短,成为无活性的多肽片段。
(4) 终止密码突变(termination codon mutation): DNA分子中一个终止密码突变成编码某一氨基酸的密码子时,多肽链的合成将继续进行,直至遇到下一个终止密码子方停止,形成延长的异常肽链。
2.移码突变(frame shift mutation):碱基的插入和缺失 (非三联体密码子及其倍数)如果造成插入点或缺失点下游 的DNA编码框全部改变,使突变点以后的氨基酸序列都发生改变。 整码突变(code mutation):在DNA的密码子之间插入或 丢失一个或几个密码子,合成的肽链将增加一个或几个 氨基酸,但插入或丢失部位的前后氨基酸顺序不变。
移码突变 UAC AGU CCU ACA GAA UGG GAG 酪 丝 脯 苏 谷 色 谷 酪 丝 脯 苏 谷 色 谷 UAC AGU CCU ACA GAA UGG GAG UAC AAG UCC UAC AGA AUG GGA G 酪 精 丝 酪 精 亮 甘 UAC GUC CUA CAG AAU GGG AG 酪 缬 亮 谷酰 天酰 甘
3. 动态突变(dynamic mutation) 脆性X综合征 (CGG)n n = 6 ~ 50; 正常人群 n = 60 ~ 200; 无临床症状的携带者 n = 200 ~ 230; 有临床症状的患者
临床表现: ①中度到重度的智力低下,大多数男性患者 IQ<50,随着年龄增长而下降; ②语言障碍、碎语现象、多动症、孤僻、 害羞; ③三大(人高马大、耳大、睾丸大); ④特殊面貌(脸窄长、下颌长且前突)。