第二章 基因 掌握基因概念及结构特点;中心法则;基因转录调控相关序列;多顺反子,单顺反子;真核基因与原核基因的结构特点。 熟悉基因突变的意义 了解基因命名法
一、基因概念的演化 1865年,孟德尔通过豌豆杂交实验结果,认为遗传性状是由成对的遗传因子决定的。(分离律、自由组合定律) 1903年Sutton和Boveri两人注意到遗传因子的行为与生殖细胞形成及受精过程中染色体的行为平行,从而提出遗传因子就在染色体上。 1909年Johansen首先将“遗传因子”改称“基因” 。并提出“基因型”和“表现型”的概念。但并不涉及特殊遗传理论。基因最初的含义中不包含特殊的物质基础,纯粹作为一个抽象的名词使用。
1911年,摩根通过对果蝇的研究,发现了有些基因的传代在不同性别的果蝇中有着不同方式,表现出与“性染色体”的传递方式一致;同时还发现了基因的连锁、交换和不分离现象,进一步创立了基因学说。摩根的观察证实了性染色体在性别中的作用,同时也证明了前面科学家提出的基因位于染色体的假说。但当时,人们对基因的化学本质并不清楚。当时普遍认为基因是由蛋白质组成。 30年后Beadle和Tatam在研究用X射线诱导真菌突变过程中,提出了“一个基因一种酶”的假说。后来修改为“一个基因一条多肽链”的概念。
1944年,Avery通过肺炎球菌转化实验证明DNA是遗传物质,从而勾勒出基因概念的轮廓——即染色体上的一段长度的DNA,它可以编码一条多肽链的信息。 目前对基因理解需要扩展:首先,不是所有的基因都编码酶(一些基因编码具有不同功能的肽链,有些基因编码功能性RNA分子),其次,在病毒中,基因可能是RNA而不是DNA。第三,基因中的信息可被选择性使用产生一种以上产物。孟德尔遗传中关于单个基因控制单个生物性状的概念也有所扩展,现在已认识到一个基因可能同时影响多个性状(多效性),而多个基因也可以相互合作控制同一性状。
基因是负责编码RNA或一条多肽链所必需的全部核酸序列(通常指DNA序列)。包括编码序列、两侧的侧翼序列及插入序列。 二、基因的分子生物学定义 基因是负责编码RNA或一条多肽链所必需的全部核酸序列(通常指DNA序列)。包括编码序列、两侧的侧翼序列及插入序列。
三、结构基因 概念 基因中编码RNA或蛋白质的DNA序列称为结构基因。 结构基因中DNA双链中的一条链可以作为合成RNA的模板链,称为反义链,另一条链称为编码链,又称有义链或信息链。 原核生物的结构基因是连续的,其转录后的RNA是不需要剪接加工的。真核生物的结构基因的显著特点是编码区内含有非编码的插入序列,因此被称为不连续基因或断裂基因。
真核生物结构基因的编码序列称为外显子,在基因转录后经剪接连在一起。非编码序列被称为内含子,又称为插入序列。在不同基因中内含子和外显子的数目和大小各不相同,根据人类基因组草图的分析推测,基因的编码序列仅占全基因组序列的3%。 内含子存在意义:有研究表明有些基因的内含子的存在可以保证或增强基因的稳定表达;还有些基因的内含子中包含有其他基因的编码序列(即基因内基因)。 GT-AG法则 在真核生物基因的外显子与内含子接头处都有一段高度保守的一致序列即:内含子5`端大多数以GT开始,3`端大多数以AG结束,称为GT-AG法则。此法则可用作真核基因中RNA剪接的识别信号。
四、基因中的与转录调控相关的序列 基因的DNA片段中包括了编码序列及其两侧的侧翼序列及插入序列。侧翼序列是一段不被转录和翻译的DNA片段,但其中含有该基因调控序列,包括前导序列和尾部序列。 原核生物的调控序列中包括启动子和终止子,有些基因中还有调节蛋白结合位点或操纵序列及其他调节序列。
原核生物 —— 操纵子(operon) 蛋白质因子 特异DNA序列 编码序列 启动序列 操纵序列 其他调节序列 (promoter) (operator) 蛋白质因子
真核生物基因中与表达调控相关的序列:启动子、上游启动子元件、增强子、加尾信号及一些反应元件等。 1、启动子 启动子是RNA聚合酶特异识别和结合的DNA序列。启动子具有方向性,位于结构基因的上游,本身不被转录。真核生物的每一个结构基因上游都有一个启动子,而且启动子具有高度同源性。同时真核生物的启动子本身并不足以被RNA聚合酶识别并结合,必须与转录因子TFⅡD结合后才能被RNA聚合酶识别并结合。
真核生物的启动子元件是位于转录起始点上游-25∽ -30碱基位置有一段高度保守序列,即TATA盒。它由7个碱基组成,即TATAAAA或TATATAT。真核生物启动子序列的完整与准确对其功能十分重要,当TATA盒一些碱基发生突变,会导致启动子失活。 2、上游启动子元件 上游启动子元件是TATA盒上游的一些特定DNA序列,反式作用因子可与这些元件结合后,通过调节TATA因子与TATA盒结合、RNA聚合酶与启动子结合及转录起始复合物形成,来调节基因转录效率。
上游启动子元件包括CAAT盒、CACA盒、及GC盒等, CAAT盒含有5`GGNCAATCT3`核心序列, GC盒含有5`CCGCC3`核心序列,二者位于-70∽-120bp之间, CACA盒位于上游-80 ∽-90bp处,核心序列为GCCACACC。通常大多数真核生物基因中具有CAAT盒,对一些组成型基因(即不受生物体发育调节而持续表达的基因)以具有GC盒为特征。 3、一些反应元件 一些信息分子的受体被细胞外信息分子激活后,能与特异的DNA序列结合,调控基因的表达。这种特异的DNA序列实际也是顺式元件,由于能介导基因对细胞外一些信号产生反应,故称为反应元件。(糖皮质激素反应元件)
增强子 糖皮质激素相关基因 启动子序列 糖皮质激素反应元件
4、增强子(调变子) 增强子是一段DNA序列,其中含有多个能被反式作用因子识别与结合的顺式作用元件。反式作用因子与增强子结合后能调控邻近基因的转录。增强子可以位于基因的任何位置。通常位于转录起始点上游-100∽-300bp处,也有增强子位于基因的内含子中。同时增强子的功能与其位置和方向无关。 1986年科学家在研究干扰素基因转录时,发现其增强子内含有负调控序列,称为负增强子,又称沉默子。
5、加尾信号 在结构基因的最后一个外显子中有一个保守的AATAAA序列。同时在此序列下游有一段GT丰富区,或T丰富区。此区与AATAAA序列共同构成的poly(A)加尾信号。mRNA转录到此后产生AAUAAA和随后的GU或U丰富区。RNA聚合酶可以认别此结构并结合,然后在AAUAAA下游10 ∽30bp处切断RNA,并加上poly(A)尾。
第二节遗传信息传递的中心法则 基因信息的传递中心法则 修正的中心法则: