许晓风 南京师范大学生命科学学院 2011、8、in Xining 浅议遗传密码的起源与进化 许晓风 南京师范大学生命科学学院 2011、8、in Xining
Biology 的几个基本问题 What is life? What is the meaning or essence of life? When, where and how does life originate? How do genetic codes originate and evolve?
密 码 子 的 若 干 使 用 规 律 1 通用性、简并性、摆动性; 2 xyU与xyC总为同一氨基酸编码,xyA与xyG常为同一氨基酸编码; 3 xyU、xyC、xyA、xyG为同一种氨基酸编码的情况有8种; 4 除Leu、Ser、Arg外,所有氨基酸都用相同的一对起始碱基为自己编码; 5 第二位是U的所有密码子都与疏水性氨基酸相对应,荷电的氨基酸总是由第二位是嘌呤的密码子编码; 6 密码子前二位是CG组合的只编码一种氨基酸,是AU组合 的为两个氨基酸编码 ,其余组合的8组密码子要么为一种氨基酸编码,要么为两种氨基酸编码; 7 密码子是偏爱使用的。
遗 传 密 码 起 源 的 假 说 偶然冻结假说(Crick) 立体化学假说(Grafstein) 协进化假说(Tze-Fei Wong) 反密码子互作假说(Henri Grosjean) GNC—SNS假说(Ikehara, K et al) 双链分工假说(XU)
协 进 化 假 说 主要内容: 遗传密码系统是氨基酸前生物合成途径的印迹,这种前生物合成途径在氨基酸的生物合成中基本得以保持; 根据氨基酸相互之间在生物合成中的前体-产物关系可推断出遗传密码的进化脉络; 具有前体-产物关系的氨基酸对的密码子应是连续的,只有一个碱基的差异。
Arg Ile Thr Met Glu Asp Asn Ala Lys Gly Pro Gln Ser His Cys Ser Trp AUU AUC AUA Arg Ile CGU AGA CGC AGG CGA CGG Thr Met ACU ACA ACC ACG AUG Pro CCU CCA CCC CCG Glu Asp Asn CAA GAA CAG GAG GAU AAU GAC AAC CAA CAG AAU AAC Gln Ala Lys GCA GCU GCG GCC AAA AAG CAU CAC Ser Gly UCA UCU UCG UCC His GGA GGU GGG GGC Cys Ser UGU UGC UGG AGU AGC Trp UUU UUC UAU UAC Tyr Phe Val Leu GUU GUA GUC GUG CUU CUA UUA CUC CUG UUG
反 密 码 子 互 作 假 说 主要内容: 氨基酸与tRNA上反密码子的特异性直接相互作用导致了遗传密码的起源 主要依据: L型的Phe、Lys、Pro、Gly、Ala、Arg、Met、Tyr、Cys、Glu等氨基酸均与其相应的反密码子单体、二联体到多联体发生特异性的结合,且结合力随链长的增加而增加
GNC—SNS假说(Ikehara, K et al) 主要内容: 遗传密码的起源是渐进式的,不是一次性完成的; 蛋白质的起源也是渐进式的,组成原始蛋白质的氨基酸不仅数量有限,而且必须满足能形成具有催化活性的高级结构如:α 螺旋和β 折叠等条件; 综合考察20种氨基酸的特性,发现要形成具有催化活性的原始蛋白质,组成的氨基酸种类不得少于4种,这4种氨基酸分别是:Val、 Ala、Asp、Gly,它们正好是最容易前生物合成的4种小氨基酸,而编码这些氨基酸的密码子(GNC)就是最原始的密码子; 密码子起源与进化的线路是:GNC——SNS——其它
双 链 分 工 假 说 主要内容: 两条核酸链(dsRNA或dsDNA)的存在是遗传密码起源所必需的; 同时以三联体的形式发挥作用 ; 一条链上的三联体为互作密码子,负责与氨基酸直接作用建立特异对应关系;另一条链上的三联体为密码子,负责存储这种特异关系信息。
我 们 的 一 些 初 步 工 作 遗传密码的信息内涵; 氨基酸、密码子性质间的相关性; 密码子的使用规律及其偏爱使用规律; 遗传密码的起源
不 同 核 苷 酸 携 带 的 编 码 信 息
密码子与氨基酸的对应联系
氨基酸、密码子性质间的相关性1
氨基酸、密码子性质间的相关性2
密 码 子 的 使 用 规 律 U1 G1 A1 C1
密 码 子 的 偏 爱 使 用 规 律 (1)
密 码 子 的 偏 爱 使 用 规 律 (2)
The average usage correlation coefficients of both SNS codon pairs and WNW codon pairs in 300 organisms SNS密码子对 WNW密码子对 古细菌 0.514 0.472 真细菌 0.631 0.441 真核生物 0.685 0.544 平均 0.605 0.485
The average usage correlation coefficients of GNC, GNG, ANU and ANA codon pairs in 300 organisms GNC型 GNG型 ANU型 ANA型 古细菌 0.777 0.476 0.719 0.529 真细菌 0.752 0.582 0.746 0.515 真核生物 0.812 0.605 0.652 0.643 平均 0.783 0.554 0.705 0.562
上述结果暗示: 遗传密码起源的可能次序为: GNC GNG ANU ANA NNN
密码子偏爱使用规律的可能应用(1) Pig Sus scrofa 2953 CDS's (1168059 codons) UUU 15.5( 18160) UCU 12.2( 14246) UAU 10.9( 12717) UGU 9.3( 10902) UUC 23.9( 27973) UCC 18.5( 21586) UAC 18.9( 22023) UGC 14.4( 16776) UUA 5.5( 6442) UCA 8.9( 10448) UAA 0.8( 883) UGA 1.5( 1739) UUG 11.6( 13518) UCG 4.8( 5607) UAG 0.5( 628) UGG 14.9( 17440) CUU 11.2( 13109) CCU 15.9( 18561) CAU 8.5( 9900) CGU 4.1( 4792) CUC 23.2( 27053) CCC 22.1( 25796) CAC 15.6( 18267) CGC 12.1( 14145) CUA 5.7( 6653) CCA 14.3( 16692) CAA 9.9( 11567) CGA 5.6( 6519) CUG 46.1( 53901) CCG 8.4( 9860) CAG 35.0( 40912) CGG 11.9( 13943) AUU 13.4( 15660) ACU 11.2( 13038) AAU 14.2( 16598) AGU 9.5( 11082) AUC 24.6( 28754) ACC 22.6( 26456) AAC 21.9( 25606) AGC 20.0( 23327) AUA 6.2( 7191) ACA 12.3( 14403) AAA 20.3( 23681) AGA 10.3( 12052) AUG 21.9( 25610) ACG 7.7( 9022) AAG 33.1( 38617) AGG 11.4( 13258) GUU 9.2( 10755) GCU 16.8( 19642) GAU 19.1( 22309) GGU 10.0( 11651) GUC 17.3( 20245) GCC 31.7( 36983) GAC 28.5( 33278) GGC 25.7( 29987) GUA 5.5( 6447) GCA 13.0( 15141) GAA 23.4( 27310) GGA 16.0( 18686) GUG 33.0( 38572) GCG 8.9( 10339) GAG 41.1( 48046) GGG 18.5( 21555)
密码子偏爱使用规律的可能应用(2) Pig Sus scrofa adducin 1 (alpha) (ADD1) Phe UUU 0.67 Ser UCU 1.16 Tyr UAU 0.67 Cys UGU 1.14 UUC 1.33 UCC 1.65 UAC 1.33 UGC 0.86 Leu UUA 0.29 UCA 0.39 TER UAA 0.00 TER UGA 3.00 UUG 1.05 UCG 0.19 UAG 0.00 Trp UGG 1.00 CUU 0.76 Pro CCU 1.03 His CAU 0.27 Arg CGU 0.16 CUC 1.24 CCC 1.64 CAC 1.73 CGC 0.95 CUA 0.38 CCA 0.48 Gln CAA 0.33 CGA 0.95 CUG 2.29 CCG 0.85 CAG 1.67 CGG 1.26 Ile AUU 1.65 Thr ACU 1.11 Asn AAU 0.81 Ser AGU 0.97 AUC 1.05 ACC 1.22 AAC 1.19 AGC 1.65 AUA 0.30 ACA 0.56 Lys AAA 0.64 Arg AGA 1.11 Met AUG 1.00 ACG 1.11 AAG 1.36 AGG 1.58 Val GUU 0.80 Ala GCU 0.91 Asp GAU 0.79 Gly GGU 0.46 GUC 1.04 GCC 1.64 GAC 1.21 GGC 1.15 GUA 0.16 GCA 0.42 Glu GAA 0.46 GGA 0.92 GUG 2.00 GCG 1.03 GAG 1.54 GGG 1.46
密码子偏爱使用规律的可能应用(3) Pig Sus scrofa H4 like gene UUU 8.2( 1) UCU 8.2( 1) UAU 0.0( 0) UGU 0.0( 0) UUC 24.6( 3) UCC 16.4( 2) UAC 32.8( 4) UGC 8.2( 1) UUA 0.0( 0) UCA 0.0( 0) UAA 0.0( 0) UGA 8.2( 1) UUG 0.0( 0) UCG 0.0( 0) UAG 0.0( 0) UGG 0.0( 0) CUU 8.2( 1) CCU 0.0( 0) CAU 0.0( 0) CGU 0.0( 0) CUC 41.0( 5) CCC 16.4( 2) CAC 16.4( 2) CGC 82.0( 10) CUA 8.2( 1) CCA 0.0( 0) CAA 0.0( 0) CGA 0.0( 0) CUG 41.0( 5) CCG 0.0( 0) CAG 16.4( 2) CGG 32.8( 4) AUU 0.0( 0) ACU 0.0( 0) AAU 0.0( 0) AGU 0.0( 0) AUC 49.2( 6) ACC 57.4( 7) AAC 16.4( 2) AGC 0.0( 0) AUA 0.0( 0) ACA 16.4( 2) AAA 16.4( 2) AGA 0.0( 0) AUG 16.4( 2) ACG 0.0( 0) AAG 82.0( 10) AGG 8.2( 1) GUU 0.0( 0) GCU 0.0( 0) GAU 0.0( 0) GGU 8.2( 1) GUC 41.0( 5) GCC 65.6( 8) GAC 24.6( 3) GGC 98.4( 12) GUA 0.0( 0) GCA 0.0( 0) GAA 0.0( 0) GGA 8.2( 1) GUG 49.2( 6) GCG 16.4( 2) GAG 32.8( 4) GGG 24.6( 3)
密码子偏爱使用规律的可能应用(4) 基因的保守程度与基因密码子的使用之间存在某种内在联系,这种联系可用某个或某类基因密码子偏爱使用频率与全基因组密码子使用频率的相关系数进行初步度量。如:Sus scrofa H4基因、ADD1基因与全基因组密码子使用频率的存在如下关系: ADD1与总 ADD1与H4 H4与总 混合 0.544 0.385 0.599 氢键对称 0.463 0.309 0.525 氢键不对称 0.662 0.159 0.717 强对称 0.319 0.176 0.474 弱对称 0.64 0.452 0.608 2.628 1.481 2.923
The End Thank you for your attention