DNA损伤 、修复与重组
诱 变 突变 指DNA碱基序列发生的永久的可遗传的改变。 点突变(point mutation):一个单一碱基的改变 诱 变 突变 指DNA碱基序列发生的永久的可遗传的改变。 转换(transition):Py与Py,Pu与Pu之间变换,多见 点突变(point mutation):一个单一碱基的改变 颠换(transversion mutation): Py与Pu之间变换,少见
群体中许多沉默突变及非致死性突变的积累会产生遗传多态性。 点突变: 如果发生在DNA的非编码区、非调节区或密码子的第3个碱基,它不会影响渗入蛋白质中的氨基酸——沉默突变(silent mutation); 如果发生氨基酸的改变——错义突变(missense mutation)。 形成新的终止密码的突变——无义突变(nonsense mutation),产生截短的蛋白质产物。 群体中许多沉默突变及非致死性突变的积累会产生遗传多态性。
点突变——替换 同义突变(沉默突变) 错义突变
错义突变的例子——镰状细胞贫血症 编码血红蛋白b肽链上一个决定谷氨酸的密码子GAA变成了GUA,使得b肽链上的谷氨酸变成了缬氨酸,引起了血红蛋白的结构和功能发生了根本的改变
点突变——插入或缺失 会造成翻译过程中其下游的三联密码子都被错读,产生完全错误的肽链或肽链合成提前终止。
移码突变(frame shift mutation):基因中增加或减少碱基(改变的碱基数不是3的倍数),该位点后面的序列发生移码。
基因突变的原因多种多样: DNA复制错误造成碱基的替换、插入或缺失等自发突变 外界因素如某些化学物质[诱变剂]、紫外线、电离辐射等也可能诱导基因突变的发生 基因突变改变了蛋白质(酶)的结构与功能,可能使生物体的形态、结构、代谢过程和生理功能等特征发生改变,严重的突变则影响生物体的生活力或导致生物个体的死亡。
复制忠实性 复制的精确性有3种机制: 1、互补碱基配对原则(模板链和进入核苷酸在DNA聚合酶的作用位点正确配对);
2、聚合酶的3’→5’外切酶活性有校对功能,它能从3’端切掉错配核苷酸,引物是DNA聚合酶发挥自我校正功能的必要条件;
3、逃脱校对的错误可被错配修复机制所纠正。
诱变剂 常见的物理诱变剂为紫外线,它引起相邻嘧啶核苷酸产生嘧啶二聚体。 当DNA受到最易被其吸收波长(~260nm)的紫外线照射时,主要是使同一条DNA链上相邻的嘧啶以共价键连成二聚体,相邻的两个T、或两个C、或C与T间都可以环丁基环(cyclobutane ring)连成二聚体,其中最容易形成的是TT二聚体
化学诱变剂种类很多,碱基类似物可改变 碱基配对特性,诱发直接突变(如5—溴尿嘧啶是胸腺嘧啶的类似物)。
Cytosine Uracil 脱 氨 亚 硝 酸 引起复制中G—C向A—T转化。
烷化剂能在DNA不同位置加上烷基,造成碱基脱落,经修复才能防止DNA损伤,细胞对损伤的处理有可能会由于间接诱变而导致突变。
若干诱变剂的作用机制及诱变功能 诱变因素 在DNA上的初级效应 遗传效应 碱基类似物 掺入作用 AT=GC双向转换 羟 胺 与胞嘧啶起反应 GC→AT的转换 亚硝酸 A、G、C的氧化脱氨作用 AT=GC双向转换 交 联 缺失 烷化剂 烷化碱基(主要是G) AT=GC双向转换 烷化磷酸基团 AT→TA的颠换 丧失烷化的嘌呤 GC→CG的颠换 糖-磷酸骨架的断裂 巨大损伤(缺失、重复、倒位、易位) 丫啶类 碱基之间的相互作用(双链变形) 码组移动(+或-) 紫外线 形成嘧啶的水合物 GC→AT转换 形成嘧啶的二聚体 码组移动(+或-) 交 联 电离辐射 碱基的羟基化核降解 AT=GC双向转换 DNA降解 码组移动(+或-) 丧失嘌呤 加热 C脱氨基 CG→TA转换 Mu噬菌体 结合到一个基因中间 码组移动
直接诱变和间接诱变 DNA中存在稳定的、配对特性发生改变的碱基而导致的突变为直接诱变。
这些反应及形成物均可在DNA复制中产生影响,主要是使碱基对发生转换。 亚硝酸可以使碱基发生氧化脱氨作用。 HNO2 胞嘧啶(C) 尿嘧啶(U) 腺嘌呤(A) 次黄嘌呤(H) 鸟嘌呤(G) 黄嘌呤(X) 这些反应及形成物均可在DNA复制中产生影响,主要是使碱基对发生转换。
亚硝酸引起的AT-GC转换细节
腺嘌呤的稀有互变异体与胞嘧啶(a),或胸腺嘧啶的稀有互变异构体与鸟嘌呤(b)的氢链形成导致下一世代中G-C配对取代A-T配对
在有些情况下,一些损伤DNA聚合酶(临时装置)为了保证染色体的完整性,进行转移损伤DNA合成,即在损伤对应的位点上插入错误的碱基,导致间接诱变;此时损伤被容忍。 突变发生在损伤的位点上为定点突变,发生在其它位点为非定点突变。
原核生物中转移损伤DNA合成属于对DNA损伤的SOS反应中的一部分,有时也叫“易错修复”。 SOS修复是指DNA受到严重损伤、细胞处于危急状态时所诱导的一种DNA修复方式,修复结果只是能维持基因组的完整性,提高细胞的生成率,但留下的错误较多,故又称为错误倾向修复(errorprone repair),使细胞有较高的突变率。
SOS反应的起始是通过损伤的处理,RecA的活化而引起。我们现在尚不知道损伤与RecA活性改变之间的关系。一般都关心RecA是怎样被激活的。这也是和其它修复途径的不同之处。其它修复途径的酶是已存在于细胞中的,而SOS修复的酶系统是经损伤诱导才产生的。
诱导的信号可能由DNA释放出的小分子组成的,或者是DNA本身某些结构变化。在体外RecA的激活需要单链DNA和ATP的存在。这样激活信号可能存在于损伤位点的单链区。无论信号是怎样产生的,它和RecA的相互作用是很快的,SOS反应在产生损伤的几分钟内就发生了。
RreA的激活导致LexA的基因产物的剪切。LexA是一种小分子蛋白(22KDa),在被处理的细胞中是相对稳定的,它的功能是很多操纵子的阻遏物。 此剪切反应是很特殊的;LexA有一种潜在的蛋白酶活性,它可被RecA激活,当RecA被激活后又可导致LexA自我催化它本身的裂解,这样LexA的阻遏功能失去了活性,并且同时诱导了它所结合的操纵子。
RecA蛋白识别损伤DNA,引发LexA蛋白的自身催化切割。LexA蛋白的失活,可以除去那些含有编码修复与防御蛋白基因(如recA 、uvrAB和 umuC)的操纵子上的阻遏蛋白。
大肠杆菌中LexA蛋白阻遏包括修复系统在内的多种基因表达,RecA 的激活导致了
RecA和LexA在SOS调节循环中互为靶位点和靶蛋白。RecA触发LexA的剪切,LexA又是RecA的阻遏物。
大肠杆菌SOS反应中的非定点突变的发生与dinB基因有关。 DinB蛋白的Pol活性(Pol Ⅳ),无3’→5’校读功能。高表达时,可导致非定点突变的明显升高达上千倍。于无损伤模板掺入错误率达10-3~10-4。
大肠杆菌的转移损伤DNA合成依赖于UmuD'2C复合体,其中介的途径通常是易误性的,它的突变引起诱发突变频率的抑制。 UmuD’2C复合体也具有Pol活性(称为Pol V)。它在损伤或未损伤DNA模板皆表现为高度易误性,能有效地跨越DNA上的无碱基部位(abasic site)并优先插入一个腺嘌呤。
酿酒酵母细胞复制后修复途径有三个独立旁路(一个易误,两个无误)。 基因REV1、REV3和REV7与易误性旁路有关。其中Rev3和Rev7蛋白构成Polζ;Rev1蛋白为一具有DNA模板指导的dCMP转移酶活性,因此也是一种Pol。
在芽生酵母中的两条无误复制后修复途径依赖RAD5和RAD30基因。RAD30基因与大肠杆菌的DinB和UmuC和酿酒酵母中的Rev1基因同源。它可在DNA合成时在嘧啶二聚体的对面正确掺入两个腺嘌呤。它是一个保真度很低的Pol,其掺入差错率高达10-2到10-3。
这些与突变形成密切相关的Pol在人细胞中都找到了相应的同源基因,与酵母中的REV3同源的hREV3编码的Polζ以及与Rev1同源的基因;与大肠杆菌中的DinB和酵母RAD30同源的hDinB基因编码Polθ;与大肠杆菌UmuC和酵母RAD30同源的hRAD30基因编码Polη、另一与酵母RAD30同源的hRAD30B编码的Polι。
已证明着色性干皮病变型(XPV)系Po1η的突变所致。 已经证明用反义核酸技术阻断Polζ表达的细胞系MNNG诱发的非定点突变的频率减低。
DNA损伤 DNA损伤是DNA正常的化学或物理结构的改变。
DNA的一些损伤是自发的。
①硷基的异构互变 DNA中的4种硷基各自的异构体间都可以自发地相互变化(例如烯醇式与酮式硷基间的互变),这种变化就会使硷基配对间的氢键改变,可使腺嘌呤能配上胞嘧啶、胸腺嘧啶能配上鸟嘌呤等,如果这些配对发生在DNA复制时,就会造成子代DNA序列与亲代DNA不同的错误性损伤。
②硷基的脱氨基作用 硷基的环外氨基有时会自发脱落,从而胞嘧啶会变成尿嘧啶、腺嘌呤会变成次黄嘌呤(H)、鸟嘌呤会变成黄嘌呤(X)等,遇到复制时,U与A配对、H和X都与C配对就会导致子代DNA序列的错误变化。胞嘧啶自发脱氨基的频率约为每个细胞每天190个。
③脱嘌呤与脱嘧啶 自发的水解可使嘌呤和嘧啶从DNA链的核糖磷酸骨架上脱落下来。一个哺乳类细胞在37℃条件下,20h内DNA链上自发脱落的嘌呤约1000个、嘧啶约500个;估计一个长寿命不复制繁殖的哺乳类细胞(如神经细胞)在整个生活期间自发脱嘌呤数约为108,这占细胞DNA中总嘌呤数约3%。“非编码损伤”。
④硷基修饰与链断裂 细胞呼吸的副产物O2-、H2O2等会造成DNA损伤,能产生胸腺嘧啶乙二醇、羟甲基尿嘧啶等硷基修饰物,还可能引起DNA单链断裂等损伤,每个哺乳类细胞每天DNA单链断裂发生的频率约为5万次。 此外,体内还可以发生DNA的甲基化,结构的其他变化等,这些损伤的积累可能导致老化。
氧化性损伤 由于活性氧的存在,DNA会在正常条件下发生氧化损伤。形成8-氧化鸟嘌呤、2-氧化腺嘌呤、5-羟甲基脲嘧啶尿等。
烷基化 烷化剂为亲电化学试剂,可将烷基加到核酸的各种位点,导致DNA损伤。 多数导致间接诱变损伤。
聚化加合物 紫外线使相邻嘧啶,尤其是胸腺嘧啶形成环丁烷嘧啶二聚体; 煤焦油中的苯并芘在肝脏产生的一种产物可与鸟嘌呤残基共价结合; 芳香族烷化剂、黄曲霉毒素B1均可与DNA共价结合。 破坏复制与转录
DNA修复 光复活 DNA中的嘧啶二聚体可通过可见光的光解作用而恢复为单体,催化此过程的酶是DNA光解酶(光复活酶)。E.coli的光解酶有两个发色团:蝶呤和FAD。这是一种无差错的“直接修复”。
烷基转移酶 该酶可直接从突变的O6—烷基鸟嘌呤上除去烷基,酶作用后即失活。它也属于无差错直接修复。
切除修复 为普遍的无差错的修复机制。有两种形式: 核苷酸切除修复(如E.coli中的UvrABC内切核酸酶识别并切除嘧啶二聚体和其他大块损伤,缺口可由DNA聚合酶和连接酶填补)。 碱基切除修复。如专一的DNA糖基化酶识别修饰碱基,切除修饰碱基与糖基间的N—糖苷键,留下一个脱嘌呤或脱嘧啶的AP位点,自发碱基丢失也可以产生AP位点。AP内切核酸酶在该位点切开DNA,缺口可由DNA聚合酶和连接酶填补。
切除修复
错配修复 是一种特殊的切除修复,它是按模板的遗传信息来修复错配碱基的,因此修复时首先要区别模板链和新合成的DNA链。它通过碱基的甲基化来实现的。大肠杆菌DNA的5/—GATC序列中A的N6都是甲基化的(Dam甲基化酶负责),复制后的一个短暂时间内,新合成链的GATC中的A 未被甲基化,故子代DNA暂时是半甲基化的,这是识别的基础。
错配的碱基被MutS和 MutL组合的复合体识别并与之结合,再与 MutH内切核酸酶结合,后者在子代链GATC附近的位点上产生缺刻,启动对损伤区的切除修复。 遗传性非息肉结肠癌就是一种错配修复酶突变丢失引起的。
遗传性修复缺陷 着色性干皮病(XP)患者缺乏对紫外线引起的大块DNA损伤的切除功能,对阳光极度敏感,易患皮肤癌 2006/4/13
重组 同源重组 也称一般重组,即两个双螺旋DNA分子间同源区域进行交换。双倍体真核生物经常发生在减数分裂过程,非姐妹染色单体交换相对应的区域,产生的单倍体配子会包含父母本两方的遗传信息。单倍体细菌也可重组,如发生在部分已复制DNA间或染色体DNA与外源DNA(质粒或噬菌体)间。 重组的过程和机制包括断裂—复合、异源双链、分支迁移、Holliday结构、拆分(见教材P98图)。
1964年,R. Holliday提出了重组的杂合DNA模型(hybrid DNA mode),并作修正。 A.同源的非姊妹染色体的DNA配对。 B-C.同源非姊妹染色单体DNA中两个方向相同的单链在DNA内切酶的作用下,在相同位置上同时切开。 D.切开单链交换重接, 形成交联桥结构(cross-bridged structure)。
F-H.绕交联桥旋转,形成Holliday结构的异构体。 E.交联桥的位置可以靠拉链式活动,沿着配对DNA分子“传播”—迁移(Bridge migration),其中互补碱基间形成的氢键从一条链改变另一条链。于是在两个亲本DNA分子间造成一段异源双链DNA。这种结构又称为Holliday structure。 F-H.绕交联桥旋转,形成Holliday结构的异构体。 I-J.通过两种方式切断DNA单链以消除交联桥,恢复两个线形DNA分子。
K.进行DNA修补合成。 I-K.如果是左右切断,出现中间包含杂合双链的两旁基因是非重组(AB.ab)的双链DNA分子;如果上下切断,将出现中间包含杂合双链并且两旁基因发生重组(Ab,aB)的双链DNA。 不管Holliday结构怎样产生,是否导致两侧遗传标记重组,它们都含有一个异源双链DNA区。
噬菌体DNA
首先两个环状DNA分子在任意两个同源区域之间配对、断裂、重接,形成8字形的中间物。8字形结构的切断也有不同方式:如在2和4对应链切断就产生两个亲本环状DNA分子,每个含有一段异源双链区;如在1和3对应链切断则形成一个由两个亲本DNA分子首尾共价连接而成大的单体环,单体环又可在任何同源区之间发生重组;如1和2或3和4切断,则产生滚环结构。
大肠杆菌的核酸酶和RecBCD结合在 chi序列上并产生切口形成单链末端,单链DNA被 RecA蛋白包裹,4条单链形成Holliday结构。
同源重组对DNA修复也很重要(复制后修复或重组修复)。 切除修复在切除损伤段落后是以原来正确的互补链为模板来合成新的段落而做到修复的。 但在某些情况下没有互补链可以直接利用,例如在DNA复制进行时发生DNA损伤,此时DNA两条链已经分开,其修复可用下图所示的DNA重组方式。
①受损伤的DNA链复制时,产生的子代DNA在损伤的对应部位出现缺口。 ②完整的另一条母链DNA与有缺口的子链DNA进行重组交换,将母链DNA上相应的片段填补子链缺口处,而母链DNA出现缺口。 ③以另一条子链DNA为模板,经DNA聚合酶催化合成一新DNA片段填补母链DNA的缺口,最后由DNA连接酶连接,完成修补。
重组修复不能完全去除损伤,损伤的DNA段落仍然保留在亲代DNA链上,只是重组修复后合成的DNA分子是不带有损伤的,但经多次复制后,损伤就被“冲淡”了,在子代细胞中只有一个细胞是带有损伤DNA的。
位点特异性重组
非同源DNA的特异片段间的交换,它是在结合序列部位由特异的酶来催化断裂重接。而同源重组则是由能与RecA蛋白结合的DNA序列随机断裂引发的。 λ噬菌体可将自身基因组插入大肠杆菌染色体的特定位点,噬菌体编码的整合酶与细菌编码的整合宿主因子(IHF)促成重组结果和λDNA进入宿主染色体。
λ噬菌体编码λ整合酶(integrase)。这个酶能指导噬菌体DNA插入E λ噬菌体编码λ整合酶(integrase)。这个酶能指导噬菌体DNA插入E.coli染色体中。这种插入作用是通过两个DNA分子的特异位点进行重组,将两个环状DNA分子变成一个大环。
在噬菌体感染的早期即有大量整合酶产生,故几乎所有被感染的细胞都发生整合作用。这种作用可用体外模型来进行实验。用四种成份混合起来组成反应系统:纯的整合酶;来自E.coli的一种辅助蛋白,称为整合作用宿主因子(IHF,integration host factor);镁离子;和含有噬菌体和细菌DNA发生重组交叉的特异位点(称为attP和attB,att源自attachment)的DNA片段。对于这个DNA片段,一个简单的制备方法就是人工构建含attP和attB两质粒。当整合反应发生时,即在attP和attB处发生交叉重组,产生两个较小的环状DNA。
整合反应由整合酶催化,其步骤是彼此偶联的:四条链同时被切断、交叉和重新连接起来,其间没有发现任何稳定的中间产物。这与前文提到的拓扑异构酶Ⅱ的反应很相似,即DNA双链同时被切断,然后磷酸二酯键又重新连接起来,并不需要ATP供应能量。故整合酶实际上能起拓扑异构酶的作用,可使带有att位点(或类似序列)的超螺旋松弛。并且和拓扑异构酶一样,整合酶也产生交错的断裂(staggeredcut):有七个核苷酸的单键尾端,形成所谓粘性末端。
整合酶和IHF在att上都有特定的结合位点,体外实验也证明这两种蛋白质结合在attDNA的特定位点上。每一次重组过程需要20-40个整合酶分子及约70个IHF分子。故可能这两种蛋白质不仅是作为酶(发挥催化作用),而且在每次重组中都要形成某种复合物结构。通过缺失实验,证明attP至少要约250bp长,太短将使其功能丧失,而attB则较短,包括核心(core)在内约23bp长即有功能。长250bp的整个attP可绕在整合酶分子的周围,类似核小体的结构,其中含有约8个整合酶的单体,每个的分子量约为40000。attB和attP中有相同的15bp的核心序列。整合酶与两个核心都相结合。如果两个核心中有一个的顺序有所改变,则重组的效率将大为降低。但是如果两个核心序列发生了相同的改变,则顺序交换仍能进行。可见整合酶不但要求特异的序列,而且要求两个核心序列有同源性。
然而,如果λ前病毒受到诱导(induction),则整合作用将被逆转。此过程称为切出(excision)。切出后,细菌和噬菌体DNA恢复至原来完整状态。前病毒受到诱导时即产生又一种蛋白质,称为切出酶(excisionase)。切出酶和整合酶一起催化前病毒DNA两端的杂种att位点之间的重组。这时,整合酶和切出酶一同紧密结合在细菌前病毒杂种att位点上,显然这样就能促使反应向反方向进行。
λ噬菌体的整合和切出过程。attB由称为BOB’的序列组成,而attP由POP'组成。O是核心序列,是attB和attP所共同的。而其两侧的序列是B,B’和P,P’,被称为臂。噬菌体DNA是环状的,重组时被整合入细菌染色体中,成为线性序列。前病毒的两侧是两个新的杂种att位点,左侧称为attL,由BOP’组成,而右侧为attR,由POB’组成。可见,整合和切出并不涉及相同的一对序列:整合需要识别attP和attB,而切出要求识别attL和attR。因此,重组位点的识别就决定了位点专一性重组的方向──整合或切出。
虽然位点专一重组是可逆的,但反应的方向取决于不同环境条件,这对决定噬菌体的生命力周期是非常重要的。 整合酶和IHF对整合和切出都是是必需的,而切出酶在控制反应方向上起重要作用──它对切出是必须的,但能抑制整合。
在切除的环化过程中如果发生错误,前噬菌体可能失去某些基因而代之以其相邻的细菌基因。因为整合位点处于细菌染色体的gal和bio基因之间,切除过程中噬菌体DNA偶而会带走gal基因,生成λgal(或称λdb)。λgal或λbio转导(感染)新的宿主时常常把gal或bio基因带到新的宿主中去,所以把λgal或λbio这些带有某些宿主基因的噬菌体称为转导噬菌体(transducing phage)。
抗体的多样性 免疫球 蛋白质的每条链由两部分组成:N-端的可变区(variable region,V)区和C-端的恒定区(constant region,C ),最初Putnam(1966)和Edelman(1969)等是通过比较不同免疫球蛋白链的氨基酸顺序而加以鉴别的。轻链由213~214个氨基酸组成,重链由446氨基酸组成。在重链的CH1和CH2之间有一鉸连区
V区是由轻链和重链的可变区联结而形成,此区负责识别抗原。V区的多变性反映了抗体的多样性。在可变区中又有3~4高变区(hypervariable region),其氨基酸顺序特别多变,是与抗原分子的结合部位。 在Ig分子中有3个C功能区(CH1,CH2和CH3),不同Ig的C 区显示了很高的同源性。CH1,CH2和CH3每一区段承担着不同的生物学功能,因此又称为效应区(effector functions)如CH2具有活化补体的作用,CH3具有使抗体分子粘连在单核细胞表面的功能等。
据推算哺乳动物能生成一百万种以上的抗体,而一种淋巴细胞又只能合成一种特异性的抗体,那么抗体的这种多样性是怎样产生的呢?难道有那么多的基因来编码Ig吗?
1976年Mozumi,N. 和利根川进(Tonegawa,S 1976年Mozumi,N.和利根川进(Tonegawa,S.)用实验证实了IgG基因中DNA的体细胞重排,从根本上解决了Ig多样性的问题,为此利根川进荣获了1987年诺贝尔奖。 他们用分子杂交的方法发现在胎鼠细胞中编码V区和C区的DNA顺序相隔较远。但在成熟的抗体细胞中(淋巴瘤细胞)这两个区域却紧密相连;表明在淋巴细胞分化过程中,免疫球蛋白基因曾发生过体细胞重组。
他们将免疫球蛋白DNA在细菌中克隆,在胎鼠细胞的一个DNA克隆中,测定λ轻链V基因顺序时,意外发现V基因只编码V区108个氨基酸中的95个,最后的39bp(13个密码子)消失了,那么余下的13氨基酸的编码顺序在什么地方呢?他们发现是在C基因附近,现在称为J(Joining)区附近(连接V和C基因的DNA序列)
1982年Hood 和利根川进等又在H链的编码区中发现了多样性基因(Diversity),简称为D基因,它的编码高变区的氨基酸。其位置是在V、J基因之间。 现在已经搞清楚有很多基因编码V区,而只有少数几个基因编码C区。 以上所说的“基因”是指编码免疫球蛋白多肽链(重链或长键)的不连续部分的DNA序列。V基因编码可变区 ,C基因编码稳定区,它们都作为一种独立表达的单位。
编码轻链和重链的方法是相似的:多个V基因中的任何一个都可以和少数C基因中的一个相连接。 体细胞重组是发生在B淋巴细胞中。大量的不同的V基因负责各种Ig差异的主要部分。然而不是所有的差异都是由基因组编码的。有的是在构成有效基因的过程中发生改变而产生的。
有功能的免疫球蛋白存在着一种改变,以对表型特点(抗原)作出反应。在刚出生时,生物并不具有产生特殊抗体有效基因,而具有大量的V基因和少量的C基因。随后由这些基因构建有活性的基因,从而能合成抗件及受体,以对抗原作出反应。 整个的过程都发生体细胞中,且不影响生殖细胞。因此对抗原的特殊反应并不遗传给后代。
不同的Ig家族的V.D.J.C基因数 家族 V D J C 人 小鼠 Lλ <300 2 76 4 >6 LK ~1000 5 1 H ~300 >1000 ~30 12 9 8
多肽链 基因片段数 V区基因重组方式 经重排的随机配对后* 推算的多样性数目 V J H链 1000 12 4 V-D-J 4.8×104 小鼠Ig多样性(举例) 多肽链 基因片段数 V区基因重组方式 经重排的随机配对后* 推算的多样性数目 V J H链 1000 12 4 V-D-J 4.8×104 4.8×107 κ链 250 - V-J 1.0×103 *多样性数目不包括VDJ连接多样性、N区插入和体细胞突变所增加的多样性数目
在真核生物中,免疫球蛋白有3个基因段编码重链和轻链的可变区:V、D和J。这些基因段间的重组产生大量的不同重链和轻链基因序列,导致抗体种类的多样化。
转座作用 又称非常重组,一些短的DNA片段(转座子或转座元件,transposon or transposable element)可转移进基因组的几乎任何位置。转座子均有两个结构特征。
插入序列(insertion sequence, IS元件) 是最小的转位因子,<2kb,不携带任何已知与插入功能无关的基因区域 最简单的转座子不含有任何宿主基因而常被称为插入序列(insertion sequence,IS),它们是细菌染色体或质粒DNA的正常组成部分。一个细菌细胞常带有少于10个IS序列。转座子常常被定位到特定的基因中,造成该基因突变。IS序列都是可以独立存在的单元,带有介导自身移动的蛋白。
转座子(transposon,Tn)是存在于染色体DNA上可自主复制和移位的基本单位。
转座子(transposon,Tn) >2kb,除携带与转位有关的基因外,还携带耐药性基因、抗金属基因、毒素基因及其他结构基因。 可能与细菌的多重耐药性有关。 IS Resistance Gene(s) Tn
复合式转座子(composite transposon)是一类带有某些抗药性基因(或其他宿主基因)的转座子,其两翼往往是两个相同或高度同源的IS序列,表明IS序列插入到某个功能基因两端时就可能产生复合转座子。一旦形成复合转座子,IS序列就不能再单独移动,因为它们的功能被修饰了,只能作为复合体移动。
转座子所具有的末端倒转重复能够在靶位点的两翼产生正向重复,图中,靶位点重复5bp。转座子末端的倒转重复为9bp。数字1-9 表示碱基序列。
两端有20-40bp的反向重复序列(invert repeat);具有编码转座酶的基因,该酶催化转座子插入新的位置。 缺口在DNA聚合酶I和DNA连接酶的作用下填平,产生目标位点的一个副本并形成一个新的同向重复序列(direct repeat)。
Tn转座子系列除了转座酶,还携带其它基因(如抗性基因),其中的β—内酰胺酶可使生物体抗青霉素。
转座子的特征 转座子 携带耐药或毒素基因 Tn1 Tn2 Tn3 AP(氨苄青霉素) Tn4 AP、SM(链霉素)、Su(磺胺) Tn5 Km(卡那霉素) Tn6 Km Tn7 TMP(甲氧苄氨嘧啶)、SM Tn9 Cm(氯霉素) Tn10 Tc(四环素) tn551 Em(红霉素) Tn971 Em Tn1681 大肠埃希菌(肠毒素基因)
酵母中的Ty元件编码的蛋白与反转录病毒的反转录酶和整合酶相似,Ty元件两侧为长末端重复序列,它先转录成RNA再反转录到DNA双螺旋中,然后插入到其它地方。
酵母Ty 组分类似逆转录病毒。 Ty 元件包括一个家族,这个家族有一系列在不同菌株不同位点发现的分散的DNA 序列组成。 Ty 是“Transposon yeast”的缩写。转座事件会产生一个特征印记:在插入的Ty 两端靶基因产生5bp 重复。Ty 的转座效率比细菌转座子要低,约为10-7-10-8。
Ty 组分的两端是短的正向重复序列。Ty 组分转录后产生两个具有重叠序列的转录本,每个都含有两个读码框,这两对(四个)读码框的序列与逆转录病毒的gag 和pol 基因有关。
它们有相同的结构如图16.11 所示。 每个元件长6.3kb,其末端的最后330bp 是同向重复序列,称为δ。每一个Ty 元件和这一类的原形序列有许多不同点。包括碱基对的替代、插入和缺失。 在一个典型的酵母基因组中有约30 个拷贝的Ty1 型和约6 个Ty917 型元件。另外还有约100 个独立的δ元件,称为单独δs。
Ty 序列有两个同向的开放阅读框,这两个阅读框有13 个氨基酸的重叠。TyA 序列编码一个DNA 结合蛋白质。TyB 含有与逆转录病毒的逆转录酶、蛋白质酶和整合酶基因同源的序列。
图16.12 一个人为构造的独特Ty 组分内含有一内含子,而在此Ty 组分的转座拷贝中内含子被删除了。这些转座拷贝具有相同的末端重复,它们来自于祖先Ty 组分的一个末端。
果蝇的copia转座子与酵母中的Ty元件相似,称为反转录转座子。
图16.14 果蝇中三种类型的转座成分具有不同的结构。 高等真核生物中的一些分散重复序列(如LINES和SINES)很可能是通过转座作用在基因组内传播的。
copia 是反座子研究最多的一个家族。copia 成为其它不相关类型元件的模型,但它们的作用方式似乎是相同的。
在每一种果蝇中copia 的位点都表现出很大的不同(并且还有重叠)。这些区别是通过漫长的进化而发展来的。 通过比较在超过40 年前分离的种系(实验室繁殖)发现几乎没有变化。我们无法估计其变异率,但通过在培养基上生长的细胞我们能模拟自然情况下的发生状况。每个基因组上copia 元件的数量在本质上在增加,达到2-3 倍。新增加的copia 元件是在新位点插入的。通过某种途径对培养基进行适应,使每个基因组上转座发生率达到10-3-10-4。
copia 元件长大约5000bp ,有相同的276bp 同向重复序列。每个同向重复都以相关的插入重复为末端。在插入位点会使靶基因产生5bp 同向重复。在copia 家族成员中的差异小于5%,其主要差别是一些小片段丢失。所有这些特征都存在于其它copia 类家族中,但不同成员表现出很大趋异性。
每个copia 元件的两个同向重复序列完全相同,说明它们协同互相作用的反应很有限,或者在转座过程中由一个始祖同向重复序列产生。 基因组中copia 元件总是完整的,未被发现过末端重复序列的单独拷贝存在(尽管我们希望能产生重组去除插入的序列)。copia 有时呈环形,类似逆转录病毒的DNA 环。长的形式有两个末端重复,短的形式只有一个末端重复。现在已经发现包装着copia RNA 的颗粒。
copia 序列含一个4227bp 的长读码框,其开放读框与逆转录病毒的gag 和pol 读码框具有同源性。但值得注意的是copia 基因不含与病毒衣壳蛋白有关的env 基因的同源序列,这意味着copia 不可能产生类似病毒的颗粒。 copia 基因的转录产物是一系列poly(A)+mRNA ,包括全长的和部分长度的转录产物。这些mRNA 有相同的5¢端,这是由从一个末端重复的中部起始转录造成的。转录物能翻译成几个蛋白质,必定涉及RNA 剪接和多蛋白质的剪切等过程。
尽管我们缺少copia 转座模式的直接证据,但它和逆转录病毒有如此多的相似之处,因此能得出结论copia 一定和逆转录病毒有关。很难说它包含有多少逆转录病毒的功能。当然我们知道它能转座(就像Ty 元件),但没有证据说明它们具有感染能力。