第二章 基因及人类基因组计划
基 因(gene) 基因研究发展的过程 基因的现代概念 基因的特点
一段可以编码具有某种生物学功能物质的核苷酸序列。 基 因(gene) 一段可以编码具有某种生物学功能物质的核苷酸序列。
A brief history of genetics.
1866年,孟德尔(G.J.Mendel)提出了遗传因子(hereditary factor)的概念。他将控制豌豆性状的遗传因素称之为遗传因子形成了基因的雏形。
1909年,丹麦的遗传学家W. Johanssen根据希腊语“给予生命”之义,创造了“gene”一词。但它只是一个抽象的单位,并不代表物质实体。
“遗传因子/基因”的设想一经提出,便推动人们去寻找,去探索 基因在哪里? 基因是什么?
显微镜技术与染色技术的发展,使人们注意到,细胞分裂时,尤其是减数分裂中,染色体的行为和孟德尔提出的等位基因的分离规律相当一致,所以,确定基因在细胞核中,在染色体上。
1910年,美国遗传学家摩尔根 (T.H.M.organ)以果蝇为研究材料,发现了连锁交换定律并提出遗传粒子学说,第一次将代表某一特定性状的基因与某一特定的染色体联系起来,即基因位于染色体上。
控制不同性状的等位基因 在2#染色体上的位置 野生果蝇没有现成的成对性状 摩根在长期饲养中找到各个性状的突变株。 触须 长/短 身体 灰/黑 眼睛 红/紫 翅 长/短 野生果蝇没有现成的成对性状 摩根在长期饲养中找到各个性状的突变株。
1944年,美国微生物学家O.T.Avery首次证实遗传物质的基础是DNA,基因位于DNA上。
1953年,J.Watson和F.Crike创立DNA双螺旋模型,证实基因是具有一定遗传效应的DNA片段。
按照双螺旋模型,在细胞分裂时,DNA 的合成应是“半保留复制”的模式。 DNA 双螺旋模型说明 DNA 分子能够充当遗传的物质基础。 按照双螺旋模型,在细胞分裂时,DNA 的合成应是“半保留复制”的模式。
半保留复制
同时证实了基因不是最小单位。它仍然是可分的;并非所有的DNA序列都是基因,只有其中某一特定的核苷酸区段才是基因的编码区。 1955年,Benzer在T4噬菌体的顺反互补实验中,正式使用 “顺反子(cristron)”这个术语,并将顺反子与基因在意义上和功能上统一起来。 同时证实了基因不是最小单位。它仍然是可分的;并非所有的DNA序列都是基因,只有其中某一特定的核苷酸区段才是基因的编码区。
1960年,F.Jacob和J.Monmd提出了操纵元(操纵子)的概念,揭示了原核生物基因表达调控的重要规律。
重叠基因(overlapping genes) 或嵌套基因(nested genes) 基因的现代概念 移动基因(movable gene) 断裂基因(split gene) 假基因(pseudogene) 重复基因(repeated genes) 重叠基因(overlapping genes) 或嵌套基因(nested genes)
移动基因(movable gene) 又称为转位因子(transposable elements),由于它可以从染色体基因组上的一个位置转移到另一个位置,甚至在不同的染色体之间跃迁,因此又叫做跳跃基因(jumping genes),最早在玉米中发现。它又分为插入序列、转位子、逆转座子。
断裂基因(split gene) 是指编码序列不连续的间断基因,最初在腺病毒(adenovirus)中发现。
应用S1核酸酶作图法测定断裂基因中的间隔子
假基因:类似于基因但不表达的DNA序列。 假基因又分为两种: 重复的假基因(repeated pseudogene ): 许多假基因都是同亲本基因(parental gene)连锁的,而且同其编码区及侧翼序列的DNA具有很高的同源性。 加工的假基因(processed pseudogene) 这类假基因没有与“亲本基因”连锁,而且其结构是同转录本而非“亲本基因”类似。 加工的假基因与转录本都没有启动子和内含子,3’端都有poly(A)尾巴。
重复基因(repeated genes) 不重复的唯一序列(只有一个拷贝) 低度重复序列(<10个拷贝) 包括大多数编码蛋白质的结构基因和基因间间隔序列 低度重复序列(<10个拷贝)
高度重复序列(几百个拷贝到几百万个拷贝) 中度重复序列(10到几百个拷贝) 特点: 重复单位序列相似,但不完全一样 散在分布于基因组中 序列的长度和拷贝数非常不均一 中度重复序列一般具有种属特异性,可作为DNA标记 高度重复序列(几百个拷贝到几百万个拷贝)
重叠基因(overlapping genes) 或嵌套基因(nested genes) 类型: 一个基因的核苷酸序列完全包含在另一个核苷酸序列中。由于它们的读码结构互不相同,因此编码着不同的蛋白质。 2个基因的核苷酸序列之末端密码子相互重叠。
基因的特点 : 不同基因具有相同的物质基础 在原则上,所有生物的DNA都是可以重组互换的,因为地球上的一切生物,无论是高等还是低等,他们的基因都是一个具有遗传功能的特定核苷酸序列的DNA片断,而所有生物的DNA结构都是一样的。 有些病毒的基因定位在RNA上,但这些病毒RNA可以通过反转录产生CDNA,并不影响不同基因的重组互换。
基因是可以切割的 基因在染色体上的存在形式是直线排列。大多数基因彼此之间存在这间隔,少数基因是重叠排列的。
基因是可以转移的 生物体内有的基因是可以在染色体上移动的,甚至可以在不同的染色体上跳跃,插入到靶DNA分子中。基因在转移的过程中就完成了基因间的重组。(转座子、反转座子)
多肽与基因之间存在对应关系 现在普遍认为,一种多肽就有一种相对应的基因。因此,基因的转移或重组可以根据其表达产物多肽的性质来检查。
遗传密码是通用的 一系列的三联密码子同氨基酸之间的对应关系,在所有生物中都是相同的。
基因可以通过复制把遗传信息传递给下一代 经重组的基因一般来说是能传代的,可以获得相对稳定的转基因生物。
人类基因组计划 Human Genome Project, HGP
人类科学史上的三大工程 曼哈顿原子计划 人类基因组计划 阿波罗登月计划
1、缘起: (1)美国“肿瘤计划”的搁浅 (2)科学家的胆略 诺贝尔奖获得者 Renato Dulbecco(杜伯克)1986 年发表于《 Science(科学)》杂志 的短文《 肿瘤研究的转折点:人类基因组测序 》中指出: “如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组 。…… 从哪个物种着手努力 ?如果我们想理解人类肿瘤,那就应从人类开始 … … 。 人类肿瘤研究将因对 DNA 的详细知识而得到巨大推动。”
人类基因组计划 于1990年10月正式启动!
2、目标: 完成人类基因组全部DNA序列测定。 人类单倍体基因组 含30亿碱基对(bp)的DNA序列,包括约3-4万个基因,分布于22条常染色体和X、Y性染色体。
遗传图谱 转录图谱 0.7 cM 或 kb 序列图谱 物理图谱 100 kb STS map 四张图: 物理图 转录图 遗传图 序列图
人类基因组计划大事记 1986 年 3 月诺贝尔奖获得者雷纳托·杜贝科在《科学》杂志上撰文,呼吁早日实施人类基因组(HGP)测序计划 1987 年 10 月科学家公布首个有 403 个位点的遗传图 1990 年 4 月美国宣布基因组测序的 5 年计划 1990 年 8 月美国国立健康研究院开始在大肠杆菌等 4 种模式生物体上实施大规模的测序工作 1990 年 10 月美国确定把当年的 10 月 1 日作为官方实施 HGP 的起始日期,被誉为生命科学“阿波罗登月计划”的国际人类基因组计划启动 1991 年 10 月日本宣布实施水稻基因组测序计划 1992 年 6 月克里格·文特创建私人的基因组研究机构 1992 年 10 月美国和法国研究小组分别完成首个 Y 染色体和第二代 20 号染色体的物理图
1992 年 12 月美法两国科学家完成了小鼠和人的遗传图 1993 年 10 月美国公布了 1993-1998 年的 5 年测序计划,并预计到 2005 年能够完成人类基因组的测序工作 1995 年 12 月美、法两国科学家公布了有 15000 个标记的人类基因组的物理图 1996 年 2 月百慕大会议召开,国际人类基因组计划的参与者一致同意人类基因组的测序数据在 24 小时内向公众公开 1996 年 4 月 DNA 芯片进入商业化应用 1996 年 10 月酵母菌的完整序列被测出 1998 年 2 月日本、美国、欧洲、中国等科学家商定联合开展水稻基因组的测序工作 1998 年 10 月人类基因组计划的公立阵营宣布提前于 2001 年完成人类基因组的工作草图,整个终图的完成期将从 2005 提前到2003 年 1998 年 12 月英国的桑格中心和华盛顿大学的科学家宣布破译美丽线虫的基因组序列
1999 年 9 月公立阵营宣布将在未来三年内花费 1.3 亿美元破译老鼠的基因组序列 1999 年 12 月英、日、美三国科学家联合完成首条人类染色体(22 号染色体)的测序任务 2000 年 3 月塞莱拉公司宣布完成果蝇基因组的测序工作,这是已被破译的基因数量最大的一个基因组 2000 年 5 月德国和日本的科学家公布了人类 21 号染色体的全部序列 2000 年 6 月美国白宫召开会议,宣布人类基因组“工作框架图”完成 2000 年 10 月科学家宣布将在 2001 年 3 月前完成河豚鱼基因的测序工作 2000 年 12 月美、英等国科学家宣布绘出拟南芥基因组的完整图谱,这是人类首次全部破译出一种植物的基因序列 2001 年 2 月人类基因组计划公立阵营在 15 日出版的《自然》杂志、塞莱拉公司在 16 日出版的《科学》杂志上公布各自的人类基因组测序草图
1999 年 12 月用“逐个克隆法”获得第一条人类染色体 —22号染色体完成序列
2000 年3 月用“全基因组鸟枪法”获得果蝇全基因组序列。
2000年6月公共领域测序计划工作框架图
2000 年 12 月美、英等国科学家宣布绘出拟南芥基因组的完整图谱,这是人类首次全部破译出一种植物的基因序列。
六国科学家公布人类基因组细节研究成果 一、基因数量少得惊人。一些研究人员曾经预测人类约有14万个基因,但塞莱拉公司将人类基因总数定在2.6383万—3.9114万个之间。如果最终确定出的基因数在这个范围内,比如3万个左右,那么,人类只比果蝇多大约1.3万个基因。塞莱拉公司的科学家测出的序列准确地覆盖了基因组的95%,并已经确定了所有基因的2/3,平均测序精度为99.96%。 二、人类基因组中存在“热点”和大片“荒漠”。人类基因组序列中所谓的“荒漠”就是包含极少或根本不包含基因的部分,基因组上大约1/4的区域是长长的、没有基因的片段。基因密度在第17、第19和第22号染色体上最高,在X染色体、第4、第18号和Y染色体上相对贫瘠。 三、35.3%的基因组包含重复的序列。这意味着所有这些重复序列,即原来被认为的“垃圾DNA”应该被进一步研究。事实上,第19号染色体57%是重复的。除了重复片段,科学家还鉴定了210万个人与人之间不同的基因序列,这些序列被称为“单核苷酸多态性”,它们通常是无害的。 四、地球上人与人之间99.99%的基因密码是相同的。研究发现,来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中,人与人之间的变异仅为万分之一。
人类基因组研究国内研究进展: 1999年7月,中国科学院遗传所人类基因组中心在国际人类基因组HGSI注册,承担了其中1%,即3号染色体上3000万个碱基的测序任务,使我国成为继美、英、德、日、法之后第六个参与该计划的国家,也是唯一的发展中国家。 2001年8月经过来自中国科学院基因组信息学中心、国家人类基因组南方中心以及国家人类基因组北方中心的科学家和工作人员的共同努力,国际人类基因组计划中国部分"完成图"提前两年绘就。
基因组工业的前景: 1、以功能基因开发为基础的“基因产业”正在形成 2、基因组研究带动了生物信息和生物芯片等新型学科 和产业的发展 3、人类基因组研究成为生物医药技术产业创新的重要 源头
噢噢! GAME IS OVER.