原核与真核生物 的染色体结构.

Slides:



Advertisements
Similar presentations
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
Advertisements

DNA 的 结 构 DNA 的 结 构. 课 前 提 问 1. 噬菌体侵染细菌的实验步骤、阶段: 2. 遗传物质的特点: 3. 证明 DNA 是主要遗传物质的实验什么 ? 4. 如果噬菌体 DNA 用放射性 31 P 标记,请问, 在正常细菌体内合成的子代噬菌体 DNA 中, 是否全部含有放射性 31.
第四节 RNA 的空间结构与功能. RNA 的种类和功能 核糖体 RNA ( rRNA ):核蛋白体组成成分 转移 RNA ( tRNA ):转运氨基酸 信使 RNA ( mRNA ):蛋白质合成模板 不均一核 RNA ( hnRNA ):成熟 mRNA 的前体 小核 RNA ( snRNA ):
第 二 章 核酸的结构和功能 核酸: 是以核苷酸为基本组成单 位的生物大分子,携带和传递遗 传信息。
植物生理 植物细胞生理基础 同工酶. 学习目标 Click to add title in here Click to add title n here  掌握同工酶的概念。  了解同工酶的意义。
分子生物学部分开发实验 植物遗传亲缘关系研究.
第十一章 细胞核与染色质.
第二节 人 类 基 因 组 ( The Human Genome) 许冰莹 ,昆明医科大学法医学院
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
DNA多态性分析基础.
减数分裂与生殖细胞的形成 复习课.
医 学 遗 传 学 遗传的细胞学基础.
§6.3 性别决定和伴性遗传. §6.3 性别决定和伴性遗传 人类染色体显微形态图 ♀ ♂ 它们是有丝分裂什么时期的照片? 在这两张图中能看得出它们的区别吗?
生命的物质基础.
细胞核是遗传信息库.
C 1.关于生物体内的遗传物质 下列说法正确的是( ) A.细菌的遗传物质主要是DNA B.病毒的遗传物质主要是RNA
问 题 探 讨 1.DNA的中文全名是什么? 2.为什么DNA能够进行亲子鉴定? 3.你还能说出DNA鉴定技术在其他方面的应用吗?
22-1 DNA是主要的遗传物质.
教学目标 1. 掌握基因的含义,以及基因、DNA、染色体之间的关系 2. 理解基因控制蛋白质合成(转录、翻译的含义、过程)
第4章 基因的表达 第1节 基因指导蛋白质的合成.
基因的表达 凌通课件.
第二节 染色质 1848年,Hofmeister从鸭跖草的小孢子母细胞中发现染色体。 1879年,W. Flemming提出了染色质(chromatin)这一术语, 用以描述染色后细胞核中强烈着色的细丝状物质。 1888年,Waldeyer正式提出染色体(Chromosome)的名称。 一、染色质的化学组成.
减数分裂 制作:乌海市第十中学 史姝婉.
The regular mechanism of eukaryotic DNA replication
第十四章 真核生物的遗传分析 1.教学目的和要求 (1)掌握真核生物基因组的结构特点。 (2)了解基因家族的概念与类型。 2.教学重点
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
特异性免疫过程 临朐城关街道城关中学连华.
全国计算机等级考试 二级基础知识 第二章 程序设计基础.
Geophysical Laboratory
高通量测序 高通量测序的应用 朱伟珊 高通量测序 朱伟珊 东盛生物.
第十章 方差分析.
第8章 遗传密码 8.1 遗传密码的基本特性.
第8章 静电场 图为1930年E.O.劳伦斯制成的世界上第一台回旋加速器.
2.1.2 空间中直线与直线 之间的位置关系.
胚胎原位杂交检测基因的时空表达模式.
基因组多态性.
第三节 聚合酶链反应(polymerase chain reaction,PCR)
第二节 免疫球蛋白的类型 双重特性: 抗体活性 免疫原性(抗原物质).
专项考能集训(四)  碱基含量及DNA复制有关的计算.
D1 Prokaryotic chromosome structure
细胞分裂和细胞周期.
第二节 DNA分子的结构.
第四专题 遗传物质和遗传病 阅读材料 温州中学白荣宣.
超越自然还是带来毁灭 “人造生命”令全世界不安
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
遗传物质--核酸 核酸分子组成 核酸分子结构.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
AD相关LncRNA调控及分析方法研究 项目成员:魏晓冉 李铁志 指导教师:张莹 2018年理学院大学生创新创业训练计划项目作品成果展示
光合作用的过程 主讲:尹冬静.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第七章 基因的表达与调控(下) —真核基因表达调控的一般规律
基于高中生物学理性思维培养的实践性课例开发
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
H基因库(重链基因连锁群): --- 第14号染色体 κ基因库(κ链基因连锁群): --- 第2号染色体 λ基因库(λ链基因连锁群):
基因 遗传物质的结构单位和功能单位 肤色 基因 有遗传效应的DNA片段 眼皮单双 血型 控制生物性状 在染色体上呈线性排列.
第 二 章 遗传的细胞学基础.
癌基因、抑癌基因 与生长因子 Oncogenes, Anti-oncogenes and Growth Factors
基因信息的传递.
主要组织相容性复合体及其编码分子.
第三节 真核基因转录调节.
第三节 转录后修饰.
电影《侏罗纪公园》中恐龙复活的场景 在现实生活中,我们能不能像电影《侏罗纪公园》中描述的那样,利用恐龙的DNA,使恐龙复活呢?
细胞分裂 有丝分裂.
第十一章 RNA的生物合成 (转录).
五.有丝分裂分离和重组 (一) 有丝分裂重组(mitotic recombination) 1936 Curt Stern 发现
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
第二章 基因与基因组 2019/11/8.
讨论:利用已经灭绝的生物DNA分子,真的能够使灭绝的生物复活吗?
第二章 组成细胞的分子 第3节 遗传信息的携带者——核酸 (第二课时).
Presentation transcript:

原核与真核生物 的染色体结构

一、原核生物的染色体结构

较简单,只有一个核酸分子(DNA或 RNA),大多呈环状。

大肠杆菌基因图 大肠杆菌的细胞核无核膜和核仁,没有固定的形态,结构简单,称为拟核,也称细菌染色体。 拟核具有高度紧密的结构,由RNA、蛋白质和超螺旋环闭环DNA分子组成,该区域DNA浓度高达30~50mg/ml。生长时,DNA持续复制,生长速率最大时,每个细胞平均有基因组的两个拷贝。 环状DNA的总长度可达1300μm,分子量为2.8×109 D,4.6Mb,大约含有3000~4000个基因,目前已经确定了1400多个基因的结构、功能及在基因图上的位置。 通过研究大肠杆菌基因的结构、功能及表达调控可揭示其它生物的遗传现象和规律。

大肠杆菌基因组为双链环状的DNA分子,在细胞中以紧密缠绕成的较致密的不规则小体形式存在于细胞中,该小体称为拟核(nucleoid),其上结合有类组蛋白蛋白质和少量RNA分子,是其压缩成一种手脚架形的(scaffold)致密结构(大肠杆菌DNA分子长度是其菌体长度的1000倍,所以必须以一定的形式压缩进细胞中)。大肠杆菌及其他原核细胞就是以这种拟核形式在细胞中执行着诸如复制、重组、转录、翻译以及复杂的调节过程。基因组全序列测定于1997年由Wisconsin大学的Blattner等人完成,

大肠杆菌DNA由50~100个环或结构域组成,各个结构域可保持不同水平的超螺旋,整个染色体为负超螺旋。 。 这些环或结构域的末端被与细胞膜相连的蛋白固定。 环的大小50~100kb。 结构域被非特异结合蛋白如HU和H-NS等类组蛋白缠绕,使一半超螺旋被束缚。 RNA聚合酶及mRNA等有助于类核的组构。 尚未发现核小体。

大肠杆菌DNA结合蛋白:                             每个细胞 H                    两个28KD的相同亚基         30000个二聚体 HU                 两个各9KD的不同亚基        40000个二体聚体 HLP1                  17KD的亚基                  20000个单体 P                      3KD的亚基                   未知 这些DNA结合蛋白,使E.coli染色体DNA压缩成为一个手脚架形结构,结构中心是多种DNA结合蛋白,DNA双螺旋分子有许多位点与这些蛋白结合,形成约100个小区,每个小区的DNA都是负超螺旋,一个小区的DNA有两个端点被蛋白质固定,每个小区相对独立。

超螺旋结构域

HU被称为类组蛋白(Histone—like protein)。 在动物、植物细胞里,很长很长的DNA分子靠一些叫做组蛋白的蛋白质来组织、压缩,才能装进空间较小的细胞核。 在细菌细胞内,HU被认为起类似组蛋白的作用。HU由两个相似的亚基构成,分别称为HU-和HU-。两个亚基各形成一个类似受臂的结构,将双螺旋的DNA分子抱住。

二、染色质结构 真核生物 DNA总长度比原核生物大数千倍,并由一定数目分散的染色体组成。每条染色体中的DNA为单一线性分子,长度可达几厘米。

组蛋白:是染色质中主要的结合蛋白,分5类:H2A、H2B、H3、H4,以及H1。所有组蛋白带有大量正电荷,序列中20%—30%由精氨酸和赖氨酸组成,这样组蛋白与带负电的DNA紧密结合。

染色体中的五种蛋白 组蛋白 类别 碱性氧基酸%Lys Arg 酸性氨基酸% 碱/酸 氨基酸残基数 分子量(dallton) H1 极富Lys 29 1 5 5.4 215 23,000 H2A 11 9 15 1.4 129 13,960 H2B 稍富Lys 16 6 13 1.7 125 13,774 H3 10 1.8 135 15,342 H4 富Arg 14 2.5 102 11,282

组蛋白的基因非常保守。亲缘关系较远的种属中, 四种组蛋白(H2A、H2A、H3、H4)氨基酸序列都非常相似, 如海胆组织H3的氨基酸序列与来自小牛胸腺的H3的氨基酸序列间只有一个氨基酸的差异, 小牛胸腺的H3的氨基酸序列与豌豆的H3也只有4个氨基酸不同。 不同生物的H1序列变化较大, 在某些组织中,H1被特殊的组蛋白所取代。如成熟的鱼类和鸟类的红细胞中H1 则被H5 所取代, 精细胞中则由精蛋白代替组蛋白。 染色质中的组蛋白与DNA的含量之比为1:1。

核小体 是染色质的基本构成单位。长约200bp,与由H2A、H2B、H3、H4各2分子构成的八聚体核心紧密结合,以及1分子H1松散结合。 除去H1,剩下与组蛋白八聚体结合的146bp的核小体核心。 围绕核小体的DNA左手环绕形成负超螺旋(扭曲)。

核小体由核心颗粒(coreparticie)和连接区DNA(linkerDNA)二部分组成. 这二部分结构也是通过核酸酶解实验而确定的 核小体由核心颗粒(coreparticie)和连接区DNA(linkerDNA)二部分组成.这二部分结构也是通过核酸酶解实验而确定的.核小体单体被小球菌核酸酶处理后,随着时间延长,其降解产物(DNA片段)会逐渐缩短,从200bp降至146bp至此变为很难进一步降解的稳定状态.对此稳定降解产生进行分析,证明它是由146bp的DNA片段和H2A、H2B、H3和H4各二分子组成,这种结构称为核心颗粒.

而H1总是随着核心颗粒的形成而消失,通常是在DNA被降解至160bp以后,提取物中H1丢失,提示H1位于"裸露"DNA与核心颗粒的毗邻区 而H1总是随着核心颗粒的形成而消失,通常是在DNA被降解至160bp以后,提取物中H1丢失,提示H1位于"裸露"DNA与核心颗粒的毗邻区.核心颗粒外,"裸露"的DNA长度为60bp左右,称为连接区DNA.连接区DNA的长度在不同物种差异较大,其范围在10--140bp.

核小体 组蛋白 DNA

生物物理的有关研究说明,DNA盘绕在组蛋白八聚体的周围,呈很有规律的螺旋状 生物物理的有关研究说明,DNA盘绕在组蛋白八聚体的周围,呈很有规律的螺旋状.虽然DNA双链分子位于核心颗粒的外围,但DNA与组蛋白八聚体的这种相互作用,对保护DNA链免受细胞核中核酸酶的消化十分重要. 染色质中的DNA双螺旋链,等距离缠绕组蛋白八聚体形成众多核心颗粒,各颗粒之间为带有H1组蛋白的连接区DNA.这种组成染色质的重复结构单位就是核小体。

[1]核心颗粒外观呈椭圆形,轴比为0. 5,颗粒直径11nm,高5. 5nm [1]核心颗粒外观呈椭圆形,轴比为0.5,颗粒直径11nm,高5.5nm.绕颗粒的DNA长度为50nm(146bp),连接区DNA长度为20nm(约60bp). 30nm和11nm染色质纤维

[2](H2A.H2N.H3.H4)2构成的致密八聚体位于颗粒中央,外绕1. 75圈左走向的DNA链,每圈约85bpDNA,螺旋间距为2 [2](H2A.H2N.H3.H4)2构成的致密八聚体位于颗粒中央,外绕1.75圈左走向的DNA链,每圈约85bpDNA,螺旋间距为2.8nm.组蛋白主要为α-螺旋,处于DNA双螺旋的大沟中.靠静电引力与DNA保持稳定结合.由于空间构象的关系,缠绕在蛋白八聚体上的DNA链并非所有部分都与组蛋白结合.

[3]相邻核心颗粒由连接区DNA连接,其伸展长度约20nm,据认为天然状况下由于核小体是紧挨着的,此一空间距离可能并不存在 [3]相邻核心颗粒由连接区DNA连接,其伸展长度约20nm,据认为天然状况下由于核小体是紧挨着的,此一空间距离可能并不存在.H1组蛋白结合在靠核心颗粒的连接区DNA上.

H1的功能 H1与核小体结合,对DNA起稳定作用,免受核酸酶的降解。 核小体核心与H1构成染色小体。

连接DNA 核小体间由连接DNA串联,平均长度为55bp,不同组织中其长度在0—100bp内变化。

30nm纤丝 核小体进一步被组装成高度有序的左手螺旋(螺线管),即30 nm纤丝,每圈螺旋约6个核小体。 30nm和11nm染色质纤维

高级结构 30nm纤丝构成100kb的环,被核基质蛋白复合体所固定。

染色体的包装实际上是指细胞核DNA在双螺旋基础上的进一步结构变化,巨大的DNA链要包装成染色体需经多层次的结构变化才能实现 上面讨论的核小体,可视为染色体DNA的一级包装,即由直径2nm的DNA双螺旋链绕组蛋白形成直径11nm的核小体"串珠"结构.若以每碱基对沿螺旋中轴上升距离为0.34nm计,200bpDNA(一个核小体的DNA片段)的伸展长度为68nm,形成核小体后仅为11nm(核小体直径),其长度压缩了6-7倍.在低离子强度和去H1组蛋白的条件下,电镜下可清晰地看到染色体一级包装的核小体纤维。

若增大离子强度,并保留H1,通过电镜可观察到10nm纤维会折转成较粗的30nm纤维,这种纤维即染色体DNA的二级包装,目前较公认的二级包装结构模型是螺线管纤维(solenoidalfiber).它是由核小体纤维盘绕形成的一种中空螺线管,其外径为30nm,每圈含6个核小体,因此,螺线管的形成使DNA一级包装又压缩小6倍.若以充分伸展的DNA双螺旋论,每个螺线管包含了408nm(6×68nm)长度的DNA链,而每圈螺线管的长度几乎等于核小体直径,即11nm,故染色体的二级包装相当于将DNA长度压缩了近40倍.H1组蛋白在维持毗邻核小体的紧密度及核小体纤维折转形成螺线管中起了重要作用.  

螺线管纤维基础上的更高一级包装是形成环状螺线管 螺线管纤维基础上的更高一级包装是形成环状螺线管.电镜观察结果提示,这种结构是30nm纤维缠绕在一个由某些非组蛋白构成的中心轴(centralaxis)骨架上形成的.即螺线管纤维相隔一定间距的某些区段被“拉拢”固定在蛋白轴上,从而产生了许多从骨架上伸出的纤维环(loops).动物细胞中每个纤维环包含了5-10×10kbDNA,这显然使螺线管纤维得到了较大程度的压缩.据认为,纤维环的形成是基因表达较理想的结构,这些环状区是基因表达的活性单位所在.从纤维环DNA比其它区域有更伸展的结构来理解这一点似乎是合理的.

上述三级包装完成后,DNA链被压缩的程度仍远不足以形成能被细胞核容纳的染色体 上述三级包装完成后,DNA链被压缩的程度仍远不足以形成能被细胞核容纳的染色体.具环形区的螺线管纤维需进一步以某种方式盘绕、折叠,最终完成细胞生长和繁殖的不同时期的染色体包装.这种在更高层次上的复杂的包装是以何种方式进行的,目前尚无明确定论.但无疑是染色体DNA包装的重要内容.从螺线管纤维环到包装形成染色体,应该是DNA压缩程度最高的阶段,估计在200-240倍.经各级包装后染色体DNA总共被压缩了数千倍,这样,才能使每个染色体中几厘米长(如人染色体的DNA分子平均长度为4cm)的DNA分子容纳在直径数微米(如人细胞核的直径为6-7μm)的细胞核中。

染色体的结构模型 一级结构:核小体,直径10nm。 二级结构:螺线体,直径30nm。 三级结构:超螺线体,直径400nm。

染色体的包装方式

三、真核生物的染色体结构

有丝分裂染色体 有丝分裂染色体 呈高度浓缩状态,两个姐妹染色单体在着丝粒处相连,染色体末端是端粒。

染色体(chromosome)是细胞在有丝分列时遗传物质存在的特定形式,是间期细胞染色质结构紧密包装的结果。 由两条相同的姐妹染色单体(chromatid)构成,彼此以着丝粒相连。 染色体沿着纵轴出现着丝粒区/主缢痕、染色体臂、副缢痕、随体和端粒等不同结构域

着丝粒 着丝粒(centromere)指中期染色单体相互联系在一起的特殊部位。 酵母着丝粒仅由88bp长的富含AT的序列组成,而哺乳动物的着丝粒序列很长,其侧翼是大量的重复序列,即卫星DNA。

端粒(telomere) 端粒是染色体DNA末端特化的 序列,其生物学作用在于维持染色体的稳定性。如果用X射线将染色体打断,不具端粒的染色体末端有粘性,会与其它片段相连或两端相连而成环状。 端粒由高度重复的短序列串联而成,在进化上高度保守, 不同生物的端粒序列都很相似,人的序列为TTAGGG。

荧光原位杂交显示的端粒(上)和端粒序列(下)

端粒起到细胞分裂计时器的作用,端粒核苷酸复制和基因DNA不同,每复制一次减少50-100bp,其复制要靠具有反转录酶性质的端粒酶(telomerase)来完成,正常体细胞缺乏此酶,故随细胞分裂而变短,细胞随之衰老。

间期染色体 在间期,染色体的基因被转录,DNA被复制,染色体呈松散状态。 间期核中染色质可分为异染色质(heterochromatin)和常染色质(euchromatin)。

异染色质(核内深染部分)和常染色质(核内浅染部分)

常染色质是进行活跃转录的部位,呈疏松的环状,电镜下表现为浅染,为解螺旋状态,在遗传行为上表现为活性;易被核酸酶在一些敏感的位点(hypersensitive sites)降解。

异染色质 染色质线中染色很深的区段,是间期染色体内保持高度浓缩的部分。它大部分由靠近着丝粒的重复卫星DNA构成,无转录活性,也叫非活动染色质(inactive chromatin);是遗传惰性区;在细胞周期中表现为晚复制、早凝缩,即异固缩现象(heteropycnosis)。 雌性哺乳动物的两条X染色体都呈异染色质状态。

DNase Ⅰ超敏性 DNase Ⅰ超敏性 DNase Ⅰ可切割裸露DNA,较长的敏感区域代表着那里正在进行转录,因此染色质对DNase Ⅰ的敏感性可被用来定位细胞中具转录活性的染色质。

当一个基因成为转录活性状态时,含有这个基因的染色质区域对DNaseⅠ(一种内切酶)降解的敏感性要比无转发活性区域高得多。这是由于此区域染色质的DNA蛋白质结构变得松散,DNaseⅠ易于接触到DNA之故。

一个很好的研究系统是鸡的珠蛋白和卵清蛋白系统。 来自鸡胚红细胞的核中,珠蛋白的基因对DNaseⅠ的降解是敏感的,而编码卵清蛋白的基因在红细胞中是不表达的,它对DNaseⅠ的降解也是具有抗性的。 相反,在母鸡输卵管细胞的核中,卵清蛋白的基因是具有转录活性的,但却不能产生珠蛋白的RNA,卵清蛋白基因的序列对DNaseⅠ 的降解要比珠蛋白基因的序列敏感得多。

此实验以克隆的特异基因为探针,应用Southern杂交技术来论证DNA序列对DNaseⅠ敏感性的改变。 用不同浓度的DNaseⅠ来处理样品,然后从各染色质样品中抽取DNA,再用限制性酶BamHI来降解,它可在珠蛋白基因两侧中的任一侧剪切,两个BamHI位点在染色体DNA上相隔4.5Kb,此DNA片段经琼脂糖电泳并通过Southern吸印技术转移到尼龙膜上,此膜和放射性珠蛋白探针进行分子杂交,来确定珠蛋白基因DNA片段的大小,从而可以推断是否被DNAase降解过。

实验结果如下:红细胞中提取的染色质,珠蛋白基因含有的DNA片段看来随着DNasⅠ浓度的增加4 实验结果如下:红细胞中提取的染色质,珠蛋白基因含有的DNA片段看来随着DNasⅠ浓度的增加4.5Kb BamH1-BamH1逐渐消失,表明含有珠蛋白基因的染色质片段对DNaseⅠ的降解是敏感的,即珠蛋白的基因区域染色质组成是松散的,珠蛋白基因DNA序列很容易和DNaseⅠ接触。通过对照,从对照组细胞(不产生珠蛋白)中分离的染色质其4.5Kb BamH1 DNA片段未被任何浓度的DNaseⅠ所降解。此结果表明不产生珠蛋白的细胞中相关的染色质是高度凝聚的。结果珠蛋的基因序列不易于和DNaseⅠ接触,从而不发生降解。

用克隆的卵清蛋白基因为探针,来分析红细胞中的卵清蛋白基因(用BamH1酶来处理,可切成20-Kb DNA片段)表明卵清蛋白基因对DNaseⅠ的降解不敏感,20-Kb BamH1-BamH1 DNA片段在各种浓度的DNaseⅠ作用下依然存在,结果表明在细胞中不产生卵清蛋白,因此基因组中这一区域并不变得松散。

很多这类实验得出的结论几乎都是有转录活性的基因对DNaseⅠ的敏感性增加,DNaseⅠ敏感区的范围随着基因序列的不同而变化,从基因周围几个Kb到两侧20Kb大小不等。

仔细分析具有转录活性基因周围的DNA区域,表明有一个中心区域存在,称为超敏感区域(hypersensitive region)或超敏感位点(hypersensitive site),它对DNaseⅠ是高敏感的。这些位点或区域将首先受到DNaseⅠ的剪切。由于对DNaseⅠ的敏感性反映了染色质中DNA的有效性,我们将这些位点描述为染色质中特殊DNA暴露区域,一般在转录起始点附近,即5′端启动子区域,少部分位于其它部位如转录单元的下游。

超敏感位点建立于转录起始之前,转录的诱导物除去后虽超敏感位点信然存在,但转录却很快停止,说明超敏感位点的存在是转录起始的必要条件,但不是充分条件。 超敏感位点是一段长200bp左右的DNA序列,这些区域是低甲基化区;并可能有局部解链的存在;不存在核小体结构或结构不同寻常,此区因DNA的裸露易和多种酶或特异的蛋白质结合,也就是说易于和反式作用因子结合。

染色质对DNaseⅠ的敏感性与2种非组蛋白有关,那就是高泳动蛋白14(HMG14,high-mobility group)和HMG17,这是两种高丰富度小分子量(30KDa)的蛋白,活化染色质中和每10个核小体就结合一个HMG分子,当从红细胞中提出这两种蛋白时,珠蛋白基因不再对DNaseⅠ出现敏感,当将这两种蛋白重新加入到此系统中,敏感性又可得到恢复。

HMG蛋白的C端含活性氨基酸,可与核小体核心组蛋白的碱性区域相结合。HMG蛋白的N端1/3的区域氨基酸序列与H1和H5的C端十分相似。而HMG在核小体上位置与H1相近,HMG和组蛋白相互作用。可以竞争性取代H1或H5,核小体缺乏H1和H5将使染色质变得松散,成为具有转录活性的状态。

除HMG以外可能还有别的因素会影响到染色质的活性,当把上述两种HMG加鸡脑细胞的染色质中,其中珠蛋白基因所在区域并不表现出对DNaseⅠ的敏感,表明红细胞和脑细胞还存在其它因子的差异,这些因子在盐抽提后仍留在染色质中,它们决定了红细胞珠蛋白基因区域在HMG14和HMG17存在时对DNaseⅠ敏感。

CpG 甲基化 真核生物基因组中存在着广泛的甲基化,DNA甲基化主要发生在CpG岛的5C上,其作用是导致基因的失活。一般说,DNA甲基化程度越高,这段DNA被转录成RNA并翻译成有功能蛋白质的可能性越小。甲基化作用好像是基因组用来防御寄生性遗传元件(parasitic genetic elements),如转座子转移的。 哺乳动物DNA中5/—CG—3/序列通常在胞嘧啶碱基处被甲基化,它与染色质中的非转录区相连。 基因组中还有未甲基化的CpG“岛”,包围着持家基因的启动子区域,形成DNase Ⅰ敏感区。

组蛋白变异体和修饰 组蛋白的共价修饰可通过影响组蛋白与DNA双链的亲和性,从而改变染色质的松散或凝集状态,来调节基因的表达。组蛋白共价修饰研究较为深入的是组蛋白乙酰化和甲基化。 被包装的染色质的快速变化可通过组蛋白的化学修饰来调控,如核心组蛋白N端赖氨酸残基的乙酰化;而有丝分裂中染色体的浓缩伴随着组蛋白H1的磷酸化。 通过乙酰化或磷酸化等化学方法对组蛋白进行修饰,可以引起染色质结构的改变,从而导致基因活性的改变。

组蛋白乙酰化 组蛋白乙酰化是由组蛋白乙酰转移酶(TACs)和组蛋白去乙酰化酶(HDACs)协调进行的,主要发生在组蛋白N末端的赖氨酸,组蛋白乙酰化呈多样性,核小体上有多个位点可提供乙酰化,但特定基因部位的组蛋白乙酰化和去乙酰化以一种非随机的、位置特异的方式进行。 例如,IFN-β基因启动子附近组蛋白赖氨酸(H4 K8,H3 K9和K14)乙酰化,该表面能与特异的蛋白识别模块(protein recognition modules)结合。H4 K8修饰产生的特异信号是SWI/SNF复合物BRG1组分的识别结合面(binding surfaces),而H3 K9和K14修饰产生的信号是TFIID组分TAFII250的识别结合面。因此,这些特异的蛋白识别面代表了IFN-β启动子组蛋白乙酰化“密码”,并参与IFN-β转录激活作用的调节。

组蛋白甲基化 组蛋白甲基化是由组蛋白甲基化转移酶(histone methyltransferases)完成的,甲基化可发生在赖氨酸和精氨酸残基上,赖氨酸残基能够单、双、三甲基化,而精氨酸残基能够单、双甲基化,这就极大的增加了组蛋白修饰调节基因表达的复杂性。

当前的证据表明,组蛋白精氨酸甲基化是一种相对动态的标记,精氨酸甲基化与基因激活相关,而H3和H4靶精氨酸的甲基化丢失与基因沉默相关。相反,赖氨酸甲基化似乎是基因表达调控较为稳定的标记,例如,H3 第4位的赖氨酸残基甲基化与基因激活相关,而第9位和第27位赖氨酸甲基化与基因沉默相关

其他组蛋白修饰方式 其他几种方式如磷酸化、腺苷酸化、泛素化、ADP核糖基化等等。 这些修饰可能通过两种机制影响染色体的结构与功能。首先,这些修饰几乎都能改变组蛋白的电荷,因此改变了组蛋白与DNA结合的特性;第二,这些修饰能够产生蛋白识别模块(protein recognition modules)的结合表面,因此能募集专一蛋白复合物到它们的表面起作用。所以有人称这些能被专一识别的修饰信息为组蛋白密码,所有这些组蛋白密码组合变化非常多,因此,组蛋白共价修饰可能是更为精细的基因表达方式。

基因组复杂度

非编码DNA 复杂的真核生物基因组DNA是原核生物的1000多倍,但大部分不编码蛋白质,其编码区被内含子中断。 这些非编码DNA大部分由多重拷贝组成,这些拷贝可以是串联重复的(如卫星DNA)或是分散于基因组中(如分散的Alu元件)。

垃圾DNA中发现不编码蛋白质的新型基因 科学家用垃圾DNA来描述那些未加利用的人类基因组DNA片断,它们包括一些长的没有已知功能的DNA链。

人类基因组有3-4万个基因。基因组的很大部分为垃圾DNA,科学家正努力找出垃圾DNA大量存在的原因,并通过它们找到潜在的治疗疾病的方法。 新发现的基因名为SRG1,它能够利用转录获得的RNA屏蔽或者压制酵母基因组中临近基因的功能。温斯顿及其研究小组将这项发现发表于最新一期《自然》杂志。他们认为肯定有其它基因以同样的方式起作用,其它生物体的基因组中也应该存在这种基因,包括人类。

大的基因组含有更多的不同基因?或含有在小基因组中出现的小基因更多拷贝 大的基因组含有更多的不同基因?或含有在小基因组中出现的小基因更多拷贝?如果基因的多样性随着基因组大小而增加,我们可以认为基因组中不同DNA 序列会增加,但不会只增加相同基因拷贝数。

该问题可以直接用基因组序列来回答,但目前我们只了解少数种属(相对较小)的有关信息。 真核基因组的一般实质可以由变性DNA 的复性动力学方程(Kinetics of reassociation)获得。DNA 互补链的复性通过碱基配对发生,它与DNA 分离的变性过程相反。复性反应的动力学方程反映了存在多种序列,因此这个反应可用来定量基因和RNA 产物。

复性动力学 从细胞提取DNA,剪切成小片段,加热,使双螺旋分开成为单链,然后冷却到25℃,这时许多互补链将重新联结,或复性。

DNA复性速率(reassociation rate)可用光谱法(在260nm波段测量光密度的变化。因为随着单链的复性成为双链,紫外光的吸收逐渐减少。 )和羟基磷灰石层析法测量。

顺序单调、重复程度高的DNA区段,例如顺序为ATATAT的高度重复顺序(highly repetitive sequence),与顺序变化大、重复程度低的DNA片段、例如单拷贝的结构基因(structural gene)相比,前者的复性速率要明显地高于后者。 复性速率也受到反应液中DNA初始浓度的影响:浓度越高,互补链的碰撞机会越多,复性速率越快。 在一定时间内(t),DNA复性的比例由初始DNA浓度(C0)决定的。用剩余单链DNA的比例(f)对 C0 t作图,得到的曲线代表了DNA样品的复性动力学,即C0 t曲线,可以用来估计重复顺序和单拷贝顺序的相对比例。

上图比较了原核生物和真核生物的Cot复性曲线。从实验知道,E.coli DNA没有重复顺序。在反应的起始阶段全都是单链,到最后阶段都成为双链,所以E.coli的复性曲线可以看作为是一条理想曲线。但小牛DNA的复性曲线明显有异于E.coli:前面一段曲线表明,小牛DNA片段的顺序短,重复程度高,所以复性速率明显高于E.coli;后面一段曲线与单拷贝顺序有关,复性速率大大低于E.coli,因为小牛基因组中单一顺序远比E.coli复杂之故。

根据这类复性研究,知道重复顺序是真核生物DNA区别于原核生物DNA的一个重要特征。

重复序列(repetitive sequence) 真核生物细胞基因组中重复出现的核苷酸序列。大体可分成3大类。 (1)高度重复序列:重复几百万次,一般是少于10个核苷酸残基组成的短片段。如异染色质上的卫星DNA。它们是不翻译的片段。在小鼠中约占基因组的10%。 (2)中度重复序列:重复次数为几十次到几千次。在小鼠中约占20%。如rRNA基因、tRNA基因和某些蛋白质(如组蛋白、肌动蛋白、角蛋白等)的基因。 (3)单一序列:在整个基因组中只出现一次或少数几次的序列,在小鼠中约占基因组的70%。如珠蛋白基因、卵清蛋白基因、丝心蛋白基因等。

实验证明,所有真核生物染色体可能均含重复序列而原核生物一般只含单一序列。高度和中度重复序列的含量随真核生物物种的不同而变化。

单一序列DNA 在单倍体基因组中只有一个或几个拷贝的序列。 在E.coli基因组中,所有DNA都是单一序列,但由于DNA较短,其复性较快, C0 t值相对较小。

基因簇(Gene cluster) 一个基因产生多次拷贝,顺序几乎相同,成簇地排列在一条染色体上,形成一个基因簇。

串联基因簇 由串联重复的基因或基因簇构成中度重复DNA区段。如rRNA基因和组蛋白基因簇。 18S、5.8S 、28S rRNA基因及间隔区组成的单位在DNA链上串联重复约5000次,这些基因位于核仁区。

人类的rRNA基因位于13,14,15,21和22号染色体的核仁组织区,每个核仁组织区平均含有50个rRNA基因的重复单位。5SrRNA基因似乎全部位于1号染色体(1q42-43)上,每单倍体基因组约有1000个5SrRNA基因。

5个组蛋白基因同在一个基因簇,串联重复达数百次。 组蛋白基因在各种生物体内重复的次数不一样,但都在中度重复的范围内。

通常每种组蛋白的基因在同一种生物中拷贝数是相同的。鸡的基因组中组蛋白基因有10个拷贝,在哺乳动物中为20拷贝,非洲爪蟾为40拷贝,而海胆的每种组蛋白的基因达300-600拷贝。 不同生物中组蛋白基因在基因组中的排列不一样,组蛋白基因没有一定的排列方式,而在拷贝数高的基因组中(>100拷贝),大部份组蛋白基因串联重复形成基因簇。

基因组中存在大量重复序列用以编码组蛋白是有其重要意义的。DNA复制时,组蛋白也要成倍增加,而且往往在DNA合成一小段后,组蛋白马上就要与其相结合,这要求在较短的时间内合成大量的组蛋白,因而需要有大量的组蛋白基因存在。

分散重复DNA 与串联重复序列的组织形式不同的另一类重复序列是散在方式分布于基因组内的散在重复序列。这类DNA序列一般都是中度重复序列。

根据重复序列的长度可以分为: 短分散重复序列(short interspersed nuclear elements,或short interspersed repeated sequences,SINEs),长度在500 bp以下,在人基因组中的重复贝数达10万以上。 重复序列单元长度在1 000 bp以上的称为长散在重复序列(longinterspersed nuclear elements或long interspered repeated sequences,LINEs),在人基因组中有上万份拷贝。

如Alu 元件L1元件,它们几乎占了人类基因组的10% 。

Alu家族 Alu家族是哺乳动物包括人基因组中含量最丰富的一种中度重复顺序家族,在单倍体人基因组中重复达30万-50万次,约占人基因组的3-6%。 Alu家族每个成员的长度约300bp,由于每个单位长度中有一个限制性内切酶Alu的切点(AG↓CT)从而将其切成长130和170bp的两段,因而定名为Alu序列(或Alu家族)。

Alu序列分散在整个人体或其他哺乳动物基因组中,在间隔DNA,内含子中都发现有Alu序列,平均每5kbDNA就有一个Alu顺序。已建立的基因组中无例外地含有Alu顺序。

Alu顺序具有种的特异性,人的Alu顺序制备的探针只能用于检测人的基因组中的Alu序列。由于在大多数的含有人的DNA的克隆中都含有Alu顺序,因此,可以这样认为,用人的Alu序列制备的探针与要筛选的克隆杂交,阳性者即为含有人DNA克隆,阴性者不含有人DNA。

序列分析表明人类Alu顺序是由两个约130bp的正向重复构成的二聚体,而在第二个单体中有一个31bp的插入序列,该插入序列在Alu家族的不同成员之间核苷酸顺序相似但不相同。每个Alu顺序两侧为6-20bp的正向重复顺序,不同的Alu成员的侧翼重复顺序也各不相同。Alu序列的5‘端比较保守,但富含脱氧腺苷酸残基的3’端在不同的Alu成员中是有变化的。

在相近的生物体中Alu家族在结构上存在相似性,一般认为灵长类基因组中的Alu顺序多为由两个130bp的正向重复组成的二聚体,而啮类动物则为由一个130bp左右的DNA片段组成的单体。

Alu顺序广泛散布于整个基因组的原因可能是由于Alu顺序可由RNA聚合酶转录成RNA分子,再经反转录酶的作用形成cDNA,然后重新插入基因组所致。 也有人认为Alu序列两侧存在着短的重复顺序,使得Alu顺序很象转座子,因此推测Alu顺序可能也是能够移动的。这可能是它们在整个基因组中含量如此丰富,分布如此广泛的原因之一。

Alu家族的功能是多方面的,由于在许多核内不均一RNA(hnRNA)中含有大量的Alu顺序,而且,Alu顺序含有与某些真核基因内含子剪接接头相似的序列,因而,Alu顺序可能参与hnRNA的加工与成熟。 最近发现在人的组织细胞中存在自然发生的染色体外双链环状DAN,被称为人类质粒(human plasmid),而这些质粒又毫无例外地含有Alu顺序。 有研究表明,Alu顺序中的某些区段有形成Z-DNA的能力。 另外,Alu顺序可能具有转录调节作用。

卫星DNA (satellite DNA) 是指DNA在氯化铯(CsCl)密度梯度离心中,当重复序列的GC与AT的比例有差异,GC的含量少于AT时,可在DNA 主峰旁形成一个伴随峰,即卫星DNA。

卫星DNA 卫星DNA又分小卫星DNA(不确定数目串联重复,VNTR)和微卫星DNA(简单串联重复,STR),前者出现在染色体末端,后者则平均分布在染色体上。 鉴定亲缘关系的DNA指纹技术的基础就是小卫星DNA的重复排列。 小卫星 (6-25bp,串联重复) 微卫星(2-6bp, 串联重复)

卫星DNA作用 构成染色体的着丝粒、端粒、Y染色体长臂上的异染色质区; 高度重复序列不能转录,形成结构基因的间隔; 参与维持染色体的结构,与减数分裂联会有关。

基因多态性 基因或基因座上碱基变化能使该基因座产生多种形式。

单核苷酸多态性 SNP 单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。

简单序列长度多态性 导致基因多态性的事件,也可以导致数组重复序列在长度上的变化。重复的每一不同长度都是一种不同的形式,这就是简单序列长度多态性(SSLP)。

RFLP Restriction fragment length polymorphism (限制性片段长度多态性,RFLP):指限制性酶位点上的遗传差异(例如,靶位点上的碱基改变产生),这些差别引起相关限制性酶切割产生不同长度片段。

RFLP基本原理 特定生物类型的基因组DNA经某一种限制性内切酶完全酶解后,会产生分子量不同的片段。 点突变产生和去除酶切位点 插入和缺失造成酶切位点间的长度发生变化

RFLP

假如DNA 顺序中的某个碱基发生了突变,使突变所在部位的DNA 序列产生(或缺失)某种限制性内切酶的位点。这样,利用该限制性内切酶消化此DNA 时,便会产生与正常不同的限制性片段。这样,在同种生物的不同个体中会出现不同长度的限制性片段类型,即限制性片段多态性(Restriction Fragment Length Polymorphism ,RFLP )。

聚合酶链反应-单链构象多态性分析(Single Strand Conformation Polymorphism Analysis of Polymerase Chain Reaction Products, PCR-SSCP)是近年来发展起来的一种基因分析方法。 

PCR-SSCP分析的基本程序为:首先PCR扩增特定靶序列,然后将扩增产物变性为单链,进行非变性聚丙烯酰胺凝胶电泳。

在不含变性剂的中性聚丙烯酰胺凝胶中电泳时,DNA单链的迁移率除与DNA链的长短有关外,更主要的是取决于DNA单链所形成的构象。 PCR产物变性后,单链产物经中性聚丙烯酰胺凝胶电泳,靶DNA中含单碱基置换,或数个碱基插入或缺失等改变时,因迁移率变化会出现泳动变位,从而可将变异DNA与正常DNA区分开。

由此可见,PCR-SSCP分析技术是一种DNA单链凝胶电泳技术,它根据形成不同构象的等长DNA单链在中性聚丙烯酰胺凝胶中的电泳迁移率变化来检测基因变异。该技术已被广泛用于癌基因和抗癌基因变异的检测、遗传病的致病基因分析以及基因诊断、基因制图等领域。

遗传信息流

1958年克里克提出了中心法则,他认为遗传信息的自我复制是从DNA到DNA;遗传信息的传递是DNA到RNA,最终决定蛋白质的分子结构和功能。 后来人们发现,有些病毒的RNA能自我复制。另外还发现,有些RNA病毒侵染细胞后能产生逆转录酶,逆转录酶以RNA为模板合成双链DNA分子。这个双链DNA分子能整合到寄主细胞的DNA中,可随寄主细胞的DNA复制而复制,同时也可以转录出更多的病毒RNA。 考虑以上因素以及某些蛋白质能够调节DNA的复制、转录和翻译,中心法则可以完善为如图4所示。

中心法则

很多人认为如果进化论是生物中的牛顿定律,那么中心法则则是生物学中的相对论。这个类比是不准确的,但它却表示了中心法则在生物学中的重要地位。

原核基因表达

真核基因表达