第十四章 真核生物的遗传分析 1.教学目的和要求 (1)掌握真核生物基因组的结构特点。 (2)了解基因家族的概念与类型。 2.教学重点 (3)熟悉真核生物基因组的包装形式。 (4)学习常见遗传标记的类型、特征和应用。
第一节 真核生物基因组 一、基因组与C值 基因组:一个物种单倍体的染色体的数目及其所携带的全部基因称为该物种的基因组(genome) DNA 。 C值:一个物种单倍体基因组的DNA含量是相对恒定的,它通常称为该物种DNA的C值。 最小的C值:支原体(106bp), 最大的C值:某些显花植物和两栖动物(1011bp)
真核生物的基因组比较庞大 人:单倍体基因组3.16×109 bp 按1000个碱基编码一种蛋白质计:理论上,有300万个基因,实际大概10万个基因 说明:有许多DNA序列并不转录成mRNA指导合成蛋白质。
C值悖理(C value paradox):C值的大小并不能完全说明生物进化的程度和遗传复杂性的高低,也就是说,物种的C值和它进化复杂性之间没有严格的对应关系。
二、真核生物基因组的结构特点 真核生物基因组大部分位于细胞核中,一般由多条染色体组成,每条染色体又是由DNA分子与蛋白质稳定地结合成染色质的多级结构。 每条染色体的DNA分子具有多个复制起点,基因内存在着不表达的插入序列,即内含子。功能上密切相关的基因集中程度不如原核生物,在真核生物中尚未见到有关操纵子的报道。
C.存在大量不编码蛋白质的DNA序列,果蝇的基因数约为5000个,占基因组DNA序列的10%左右,人的基因数推测为50000个,约占基因组DNA序列的1%。 D.真核生物的蛋白质编码基因往往位于基因组DNA单拷贝序列中,除单拷贝序列外还存在大量重复序列(repeat sequence),重复序列的拷贝数可高达百万份以上,在人的基因组中,至少具有20份拷贝的DNA,占总DNA的30%左右。
E.真核生物基因组中,有许多结构相似、功能相关的基因组成所谓的基因家族(gene families)。 F.真核生物除了主要的核基因组外,还有细胞器基因组,而且细胞器基因组对生命是必须的,不像原核生物质粒DNA基因对细菌生存不是必须的。
第二节 真核生物基因组DNA序列的复杂度 一、重复序列的检测 C为单链DNA的浓度(单位是每升的核苷酸摩尔数); C0为DNA总浓度; t为时间(单位为s); k为重组速率常数(单位是L/mol·s),k取决于阳离子浓度、温度、片段大小和DNA序列的复杂性。
复性的分数C/C0是起始浓度和经过时间的乘积C0t的函数,这样的函数绘成图称为C0t曲线(图7-3)。 当t=0时,C=C0,表明所有DNA都是单链。
如果基因组中每一种基因只有一个,即都是单拷贝序列,那么基因组愈大则基因组的复杂性愈大,复性速率愈小,k也愈小,所以C0t1/2与非重复序列的基因组大小呈正比。
二、DNA序列的类别 不同生物基因组的C0t1/2是不相同的,C0t1/2的位置除了决定于基因组的大小以外,还取决于每个基因的核苷酸序列的重复次数,重复次数愈少则复性愈慢,C0t1/2的位置愈后,重复次数愈多,C0t1/2位置愈前。
真核生物基因组序列分类 (一)单拷贝序列(unique sequence)亦称非重复序列(nonrepetitive sequence):在一个基因组中只有一个拷贝或2-3个拷贝 (二)中度重复序列(moderately repetitive sequence) (三)高度重复序列(highly repetitive sequence)
卫星DNA(satellite DNA) 重复顺序:由2-10bp组成重复单位,重复单位成串排列而成 由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA 分开,因而称为卫星DNA (或随体DNA) 在人细胞组中,卫星 DNA约占 5-6% ,按其浮力密度不同,可分为Ⅰ、Ⅱ、Ⅲ、Ⅳ四种; 果蝇的卫星DNA顺序已经清楚,可分为三类,都是由7bp组成的高度重复顺序: 卫星Ⅰ为:5’ ACAACTT 3’ 卫星Ⅱ为:5’ ACAAATT 3’ 蟹的卫星DNA为只有AT两个碱基的重复顺序组成。
高度重复顺序的功能 1. 调节反向序列常存在于DNA复制起点区的附近。另外,许多反向重复序列是一些蛋白质(包括酶)与DNA的结合位点 2. 参与基因表达的调控DNA的重复顺序可以转录到核内不均一RNA(hnRNA)分子中,并形成发夹结构,这对稳定RNA分子,免遭分解有重要作用
3. 参与转位作用 几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp 到1400bp,形成回文结构,在转位作用中既能连接非同源的基因,又可以被参与转位的特异酶所识别。
4. 与进化有关 不同种属的高度重复顺序,具有种属特异性,但相近种属又有相似性。如:人与非洲绿猴的α卫星 DNA长度仅差1个碱基(前者为171 bp,后者为172bp),而且碱基序列有65%是相同的,表明它们来自共同的祖先
5. 同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹 6. α卫星 DNA 成簇的分布在染色体着丝粒附近,可能与减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序
第三节 基因家族 一、基因家族的类型和Alu家族 基因家族(gene family):真核生物的基因组中有许多来源相同、结构相似、功能相关的基因,这样的一组基因称为一个基因家族。 假基因(pseudogene):同一个基因家族的成员也不一定都是有功能的,没有功能的成员称为假基因。
二、基因簇和假基因 根据基因家族的复杂程度,可以把它们区别为几种类型: ①简单的多基因家族; ②复杂的多基因家族; ③不同场合表达的复杂多基因家族(图7-7)。 二、基因簇和假基因
真核生物基因结构示意图
第四节 真核生物基因组的包装 一、DNA与染色体 染色体的单线性(mononemy):在真核细胞中每条染色由一个DNA分子组成,即一个DNA分子从染色体一端连续地走向另一端。 单线性的证据:蝾螈卵母细胞在双线期的灯刷染色体和在黑腹果蝇细胞中抽取的DNA 分子的相对分子质量测量。
灯刷染色体(lampbrush chromosome)形如灯刷状,是一类处于伸展状态具有正在转录的环状突起的巨大染色体。常见于进行减数分裂的细胞中。因此它常是同源染色体配对形成的含有4条染色单体的二价体。
灯刷染色体首次由W.弗勒明在1882年报道,但未肯定这是一种染色体。1892年J.吕克特对在鲨鱼卵母细胞中的这种巨大染色体的结构进行了研究,并因其形状酷似欧洲当时擦洗煤油灯罩的灯刷,取名为灯刷染色体。50年代在H.G.卡伦等人改进了研究技术后,灯刷染色体的研究才蓬勃发展起来。
不同物种灯刷染色体的大小十分悬殊。一般说来,凡单套染色体中DNA的含量(C值)高的动物,灯刷染色体大,侧环长,而且灯刷染色体持续时间也比较长。两栖类的具有最高的C值,灯刷染色体也最大,是研究灯刷染色体的常用材料,其中研究得最为详尽的是某些有尾两栖类。
(1)灯刷染色体是两栖类卵母细胞在进行减数分裂的第一次分裂时停留在双线期的染色体,它是一个二价体,包含4条染色单体,此时同源染色体尚未完全解除联会,因此可出现几处交叉,当用RNA酶和胰蛋白酶去掉染色体中的RNA和蛋白质后,每条染色单体是一条连续的纤丝,其直径为2-3nm,相当于一条DNA双螺旋的直径,进一步用DNase处理后,该纤丝断裂,由此证明染色单体中每条染色单体的主体是一条连续的DNA双螺旋分子。
(2)野生型黑腹果蝇的细胞用去垢剂溶解并用蛋白酶消化,可得到近乎完整的染色体DNA分子。发现染色体大小与DNA分子相对分子质量密切相关,染色体愈大,所含DNA分子的相对分子质量愈大
二、核小体结构与包装模型 (一)核小体模型 核小体是构成染色质的基本结构单位,使染色质中DNA、RNA和蛋白质组成一种致密的结构。
(二)染色体包装的四级结构 (1)串联排列直径11nm的核小体的形成是DNA压缩的第一步 (2)在组蛋白H1存在下,核小体进一步螺旋化,每一圈由六个核小体构成外径300nm,内径10nm,螺距11nm的中空螺旋管。 (3)螺旋管再次螺旋化形成直径0.4nm的圆筒状超螺旋管,DNA又压缩了将近40倍,直径加粗了10余倍。 (4)超螺旋管再螺旋,折叠压缩5倍而形成2-10的染色单体,即染色体包装的四级结构。
第五节 真核生物基因的丢失、扩增与重排 一、基因丢失 基因丢失(gene elimination):通过丢失染色体,丢失某些基因而去除这些基因的活性的现象。
二、基因扩增(gene amplification):是指基因组内某些基因的拷贝数专一地大量增加的现象。是细胞在短期内为满足生长发育或生理适应的需要而产生足够多的基因产物的一种调控手段,它的实质是通过
三、基因重排(gene rearrangement) 基因重排:指DNA分子核苷酸序列的重新排列,这些序列的重排不仅可形成新的基因,还可调节基因的表达。 四、基因突变:指染色体上某一基因位点内部发生了化学性质的变化,又称点突变。
第六节 遗传标记 遗传标记(Genetic marker)指可识别的等位基因。它具有两个基本特征,即可遗传性和可识别性,因此生物的任何有差异表型的基因突变型均可作为遗传标记。 类型: 形态标记(morphological marker) 细胞学标记(cytological marker) 生化标记(biochemical marker) 和分子标记(molecular marker)
在植物遗传育种研究中可被利用的遗传标记应具备以下几个条件:(1)多态性高;(2)表现共显形;(3)对农艺性状影响小;(4)经济方便,容易观察记载。
一、形态标记 即植物的外部形态特征。主要包括肉眼可见的外部特征,如:矮秆、紫鞘、卷叶等;也包括色素、生理特性、生殖特性、抗病虫性等有关的一些特性。形态标记简单直观、经济方便;但其数量在多数植物中是很有限的,且多态性较差,表现易受环境影响,并且有一些标记与不良性状连锁。此外形态标记的获得需要通过诱变、分离纯合的过程,周期较长。因此形态标记在作物遗传育种中的作用是有限的。
二、细胞学标记 即植物细胞染色体的变异:包括染色体核型(染色体数目、结构、随体有无、着丝粒位置等)和带型(C带、N带、G带等)的变化。与形态标记相比,细胞学标记的优点是能进行一些重要基因的染色体或染色体区域定位。但细胞学标记材料需要花费较大的人力和较长时间来培育,难度很大;同时某些物种对染色体变异反应敏感;还有些变异难以用细胞学方法进行检测。因此到目前为止,真正应用于作物遗传育种研究中的细胞学标记还很少。
三、生化标记 主要包括同工酶和等位酶标记。同工酶是:指结构不同、功能相似的酶,也即具有同一底物专一性的不同分子形式的酶。属于一个以上基因座位编码的酶的不同形式;而等位酶是指由一个基因座位的不同等位基因编码的酶的不同分子形式。分析方法是从植物组织的蛋白粗提物中通过电泳和组织化学染色法将酶的多种形式转变成肉眼可辩的酶谱带型。
与形态标记、细胞学标记相比,生化标记具两个方面的优点:一是表现近中性,对植物经济性状一般没有大的不良影响;二是直接反映了基因产物差异,受环境影响较小。但目前可使用的生化标记数量还相当有限,且有些酶的染色方法和电泳技术有一定难度,因此其实际应用受到一定限制。
四、分子标记(DNA标记) 在遗传学研究中广泛应用的DNA分子标记已经 发展了很多种,一般依其所用的分子生物学技 术大致可以分为两大类:
(1)是以Southern杂交技术为核心的分子标记,(如RFLP),这类分子标记被称为第一代分子标记。 (2)是以PCR技术为核心的分子标记,(如STS、RAPD、AFLP、SSR)等,这类分子标记被称为第二代分子标记;单核苷酸多态性(SNP)标记被称为第三代分子标记 。它也是以以PCR技术为基础的分子标记技术。
几种主要的DNA分子标记 英文缩写 英文名称 中文名称 RFLP Restriction fragment Iength polymorphism 限制性片段长度多态性 STS Sequence tagged site 序列标签位点 RAPD R andom amplified polymor- Phic DNA 随机扩增多态性DNA AFLP Amplified frangment length Polymorphism 扩增片断长度多态性 SSR Simple sequence repeat 简单序列重复 SNP Simple mucleotide polymor- phism 单核苷酸多态性
几种主要的分子标记 (一)RFLP标记:称为限制性片段长度多态性,是指用某一种限制性内切酶来切割来自不同个体的DNA分子上,内切酶的识别序列有差异,即是由限制性酶切位点上碱基的插入、缺失、重排或点突变所引起的。这种差异反映在酶切片段的长度和数目上。
RFLP标记是发展最早的DNA标记技术。 DNA提取 用限制性内切酶酶切DNA 、 用凝胶电泳分开DNA片段 把DNA片段转移到滤膜上 利用放射性标记的探针杂交显示特定的DNA片段(Southern杂交)和结果分析。
特点 A 无表型效应,RFLP标记的检测不受环境条件和发育阶段的影响。 B RFLP标记在等位基因之间是共显性的,因此在配制杂交组合时不受杂交方式的影响。 C 在非等位的RFLP标记之间不存在上位效应,因而互不干扰
D RFLP标记起源于基因组DNA的自身变异,在数量上几乎不受限制 E DNA需要量大,检测技术繁杂,难以用于大规模的育种实践中。在植物分子标记辅助育种中需要将RFLP转换成以PCR为基础的标记。
(二)AFLP标记 AFLP标记是扩增片段长度多态性的简称 是RFLP与PCR两项技术相结合的产物,AFLP技术的主要步骤: DNA提取 有两种限制性内切酶酶切DNA 寡聚核苷酸接头的连接 对限制性酶切片段的选择性扩增 扩增产物的电泳分析。由于不同材料DNA酶切片段存在差异,因而便产生发扩增产物的多态性。
AFLP标记的主要特点有: (1)由于AFLP分析可以采用的限制性内切酶及选择性碱基种类、数目很多,所以该技术所产生的标记数目是无限多的; (2)典型的AFLP分析,每次反应产物的谱带在50-100条之间,所以一次分析可以同时检测到多个座位,且多态性极高; (3)表现共显性,呈典型孟德尔式遗传; (4)分辩率高,结果可靠; (5)目前该技术受专利保护,用于分析的试剂盒昂贵,实验条件要求较高。但也存在假阳性带出现频繁、技术复杂、成本高等缺点。
AFLP分析有不同的形式,如专一扩增多态型(SAR)既包括扩增片段长度的多态性,还包括扩增片段序列的多态性。
(三)RAPD标记 RAPD标记的基本原理是利用合成的随机引物(一般为8~10个碱基)对基困组DNA进行PCR扩增 ,然后电泳检测PCR产物的多态性。
RAPD标记的主要特点有: (1)不需DNA探针,设计引物也无须知道序列信息; (2)显性遗传(极少数共显性),不能鉴别杂合子和纯合子; (3)技术简便,不涉及分子杂交和放射性自显影等技术; (4)DNA样品需要量少,引物价格便宜,成本较低; (5)实验重复性较差,结果可靠性较低。
又叫微卫星DNA标记,它是指基因组中存在的由2-5个核苷酸为重复单位组成的长达几十个核苷酸的串联重复序列,广泛分布于真核生物基因组中。 (四)SSR标记 又叫微卫星DNA标记,它是指基因组中存在的由2-5个核苷酸为重复单位组成的长达几十个核苷酸的串联重复序列,广泛分布于真核生物基因组中。 SSP标记具有共显性、高多态性和易于检测等优点,是一种理想的分子标记,
SSR标记的主要特点有: (1)数量丰富,广泛分布于整个基因 (2)具有较多的等位性变异; (3)共显性标记,可鉴别出杂合子和纯合子; (4)实验重复性好,结果可靠; (5)由于创建新的标记时需知道重复序列两端的序列信息,因此其开发有一定困难,费用也较高。
(五)SNP标记 也是以PCR技术为基础的分子标记技术。它是指不同生物个体基因组DNA序列之间单个核苷酸的差异,这种差异可以通过设计特异PCR引物扩增和电泳检测显示出来。 SNP标记是根据基因组测序结果发展起来的,因而它的数量非常丰富。检测SNP的最佳方法是新近发展起来的DNA芯片技术。 目前SNP作为一种的分子标记技术,已有2000多个SNP标记定位在人类染钯体上,在稻和大豆等植 物上也发展了一些SNP标记。
DNA分子标记是现代植物生物技术中应用的重要工具,其应用主要包括以下几个方面: 构建高密度的遗传连锁图 :在经典遗传学中由于遗传标记的数量较少,只能建立稀疏且分布不均匀的遗传连锁图。DNA分子标记数量丰富,为高密度遗传图谱的制作提供了可能,促进DNA指纹的分析。 进行基本定位:基本定位就是寻找与目的的基因紧密连锁的遗传标记并确定其在染色体上的位置,高密度遗传连锁图的建立使目的基因的定位更为方便。
遗传多样性和物种亲缘关系:分子图谱的构建和基因定位更加有利于遗传多样性和物种亲缘关系的研究。植物的遗传多样性是品种遗传改良的基础。 种质鉴定和遗传背景分析:利用DNA分子标记可以鉴别品种,评估品种纯度,分析农艺形状基因,分离和鉴别遗传材料,确定染色体同源性,对异源染色体和染色体结构畸变的检测。 育种中的分子标记辅助选择:长期以来,植物育种都是依植株的表型性状进行选择的。DNA标记的出现使植物育种从表型选择过渡到分子育种的新阶段。