第十七章 基因组学与医学 GENOMICS AND MEDICINE 刘新文 北京大学医学部生化与分子生物学系
第一节 基因组学概念及研究范畴(The Concept and Research Categories of Genomics) 人类基因组计划
一、基因组学概念 基因组(genome):泛指一个细胞或一个生物体的全部遗传信息。在真核生物,基因组是指一套(单倍体)染色体DNA。 基因组学(genomics):从基因组水平(分子整体水平)研究遗传的学科。主要是发展和应用DNA制图、测序新技术及计算机程序,分析生命体全部基因组的结构及功能。
人类基因组计划(human genome project, HGP):一项多国合作的国际研究计划,旨在阐明人类基因组DNA 3×109bp的序列,发掘所有人类基因,确定其在染色体上的位置,从而破译人类的全部遗传信息。HGP还对包括大肠杆菌、酵母、线虫、果蝇、拟南芥和小鼠等在内的一系列模式生物体基因组的测序。
二、基因组学的主要研究内容 结构基因组学(structural genomics):通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。 功能基因组学(functional genomics):利用结构基因组学提供的信息,进行基因和非基因序列功能的研究。 比较基因组学(comparative genomics):比较不同生物间基因和基因组结构的差异,以增进对基因功能的了解、阐明物种进化关系。
三、基因组学主要研究技术 生物信息学(bioinformatics) 生物芯片(DNA芯片、蛋白质或肽芯片等 用数理和信息科学的观点、理论和方法研究生命现象,组织和分析现今呈指数增长的生物学数据的一门科学。该技术主要由数据库、计算机网络和应用软件组成。 生物芯片(DNA芯片、蛋白质或肽芯片等 二维蛋白质凝胶电泳( 2-DGE) 飞行质谱
第二节 结构基因组学(Structural Genomics) 物理制图 遗传制图 基因组DNA序列测定 创建计算机分析管理系统
一、人类基因组作图 1、遗传图(genetic mapping)/连锁图(linkage map) 通过计算连锁的遗传标志之间的重组频率,确定连锁标志在染色体上的线性排列顺序及其相对遗传距离 距离单位:厘摩(cM),1cM表示每次减数分裂的重组频率为1%
第三代DNA标志:单核苷酸多态性(SNP) 第一代DNA多态性标志: 限制性片段长度多态性(RFLPs)、随机引物扩增多态性 (RAPD) 、扩增片段长度多态性(AFLP) 第二代DNA标志: 可变数目串联重复序列(VNTRs;又称小卫星)、短串联重复序列(STRs;又称微卫星, MS) 第三代DNA标志:单核苷酸多态性(SNP)
2、物理作图(physical mapping): 确定遗传标志间的物理距离,一般用bp/kb/Mb表示。 1cM的遗传距离大致上相当于1Mb的物理距离。 (1)荧光原位杂交图(FISH map) (2)限制性酶切图(restriction map) : 选用合适的限制性核酸内切酶对基因组DNA或部分基因组DNA进行酶切,获得以酶切位点为标记的物理图。 (3)辐射杂交细胞图(RH map) (4)连续克隆系(clone contig)图:是最重要的一种。 序列标签位点(sequence tagged sites, STSs): 在染色体上定位明确,而且可用PCR扩增的单拷贝序列,通常为200-500bp。
三、DNA序列的生物信息学分析(Bioinformatics Analysis of DNA Sequences) 二、大规模测定基因组DNA序列 (Large Scale DNA Sequencing) 1. 基于BAC连续克隆系的测序 2. 全基因组的“鸟枪法”(shotgun)测序 3. cDNA测序 三、DNA序列的生物信息学分析(Bioinformatics Analysis of DNA Sequences)
第二节 功能基因组学(Functional Genomics) 鉴定(注释)基因 分析基因功能 鉴定基因变异 描述基因表达模式 生物信息学
一、概念及特点 1. 概念:利用结构基因组学提供的信息,以高通量,大规模实验方法及统计与计算机分析为特征,全面系统地分析全部基因及其编码蛋白的功能。包括:生物学功能、细胞学功能、发育学功能等。 二、研究内容 1、鉴定DNA序列中的基因。 2、确定基因功能。 (1)利用同源搜索分析基因功能。 (2)实验分析基因功能。
3、描述基因表达模式:基因表达的时空性 4、基因产物的结构与功能预测 5、人类基因组序列变异性 6、生物信息学 转录组(transcriptome):指一个细胞内的一套mRNA转录物,包含了在某一环境条件、某一生命阶段、某一生理或病理(功能)状态下,生命体的细胞或组织所表达的基因种类和水平。 蛋白质组(proteome):指一个细胞内的全套蛋白质,反映了特殊阶段、环境、状态下细胞或组织在翻译水平的蛋白质表达谱。 4、基因产物的结构与功能预测 5、人类基因组序列变异性 6、生物信息学
第三节 比较基因组学(Comparative Genomics) 比较基因组学涉及比较不同物种的整个基因组,以便深入理解每个基因组的功能和进化关系。
第四节 基因组学与医学(Genomics and Medicine) 筛选疾病相关基因 基因检测 药物设计 基因治疗
一、“基因病” ( Gene Disease)的概念 1、单基因病:是指某种疾病的发生主要由一对等位基因的一个或两个基因位点存在缺陷而引起,其遗传方式遵循孟德尔遗传规律。 2、多基因病:这类疾病发病的基因机制理十分复杂,涉及一个以上的等位基因以及基因与环境因素的相互作用,又称为多因子疾病。 3、获得性基因病:这类疾病由病原微生物感染引起,不符合孟德尔遗传规律。
二、疾病相关基因的鉴定 1、SNPs筛选 2、染色体制图定位及疾病相关基因克隆 3、疾病相关基因表达谱筛选及疾病相关基因网络的确定
三、基因检测(Gene Testing) 基因检测:适应分子医学发展需要产生的一种新型的个体基因异常检测手段,直接检测DNA。 1、法医鉴定 2、遗传病诊断:携带者;疾病风险预测;产前诊断和新生儿筛查 3、感染病诊断 4、基因治疗
四、药物靶标和药物设计 常见的药物靶标是细胞特定信号传导通路中的功能生物分子,如G蛋白偶联受体家族分子、蛋白酶、蛋白激酶、磷酸酶等。 分泌型激素、生长因子、化学激酶、可溶性受体和诱饵既可作为药物,又可作为药物靶标。 根据基因的特性为某个群体或个人设计药物。 五、环境与疾病
人体细胞的核型(Spectral Karyotype) 第一节 概 述 一、基因组及其组织结构 “基因组(genome)”一词是1920年Winkles从GENes和chromosOMEs组成的。泛指一个细胞或一个生物体的全部遗传信息。在真核生物,基因组是指一套(单倍体)染色体DNA。 人体细胞的核型(Spectral Karyotype)
人类基因组 人类基因组是指人的24条染色体(22条常染色体+2条性染色体)内的全部DNA和线粒体DNA,其中蕴藏的信息决定了人类个体发育、生殖、生长、疾病、衰老、死亡等所有生命现象。
真核生物基因组的特点 1. 基因组含有更大的DNA分子,以染色体形式储存于细胞核内,体细胞内的基因是双份的。 2. 基因组结构复杂,有多个复制原点,但每个复制子的长度较小。 3. 基因是不连续的。 4. 转录单位一般是单顺反子。即一个基因一种mRNA一种蛋白质,但蛋白质的最终产物可因剪接方式的不同而有差异(如Bcl-x: Bcl-x1;Bcl-xs ) 5. 存在重复序列
高度重复序列(>105次) (1)卫星DNA(satellite): (2)倒位(反向)重复序列 (3)较复杂的重复单位组成的重复顺序 小卫星DNA(可变数目串联重复序列,VNTRs) :重复长度5-50bp,重复次数可变,有高度特异性。 微卫星DNA(MS;又称简单串联重复序列,STRs):重复长度1-4bp,主要为二核苷酸重复序列如(CA)n,存在个体间的高度变化,是DNA指纹的形成基础。 (2)倒位(反向)重复序列 (3)较复杂的重复单位组成的重复顺序
重复片段长100-几千bp,编码细胞需要量大的分子 中度重复序列(<105次) 重复片段长100-几千bp,编码细胞需要量大的分子 rRNA基因:重复数百次,可用作遗传标志。 tRNA基因 组蛋白基因 Alu家族:有3万个成员,平均每6kb就有一个,长度约300bp,因在170bp处有一AluⅠ位点(AG/CT)而得名。具有种的特异性。 KpnⅠ家族:人和灵长类DNA经KpnⅠ酶解后,产生4个片段(1.2, 1.5, 1.8, 1.9kb),被命名为KpnⅠ家族。人类基因组中KpnⅠ序列约在3-6%,散在分布。
单拷贝,在基因组中占50-80%,人基因组中约有60-65%的单一序列。
6. 基因类型多样 (1)断裂基因/不连续基因 (2)非剪接基因/连续基因 (3)基因家族 多基因家族(multigene family):亦称基因家族,是指一组具有类似功能,核苷酸序列又有同源性的基因。 超基因家族(supergene family):由多基因家族及单基因组成的更大的基因家族。成员间有不同程度的同源,但功能并不相似。如Ig超家族。
(4)假基因:在多基因家族中,不产生有功能产物的基因。即序列与有功能的基因相似,但或者不能转录,或者转录后生成无功能的基因产物。用Ψ表示。假基因往往缺少正常基因的内含子,两侧有顺向重复序列。 (5)基因重叠
8. DNA序列组织的可变性(基因组不稳定性) 7、自私DNA(selfish DNA):指非编码序列,包括分散的高度、中度重复序列,内含子和间隔序列等。有些自私DNA通过转录mRNA,生成cDNA,再转位插入到基因组,有人称之为寄生DNA(parasite DNA)。 但自私DNA并非毫无功能,可参与基因表达调控等。 8. DNA序列组织的可变性(基因组不稳定性) (1) 基因重排 (2) 跳动(跃)基因(转座子):可在DNA分子间进行转移的DNA片段。通常只是把一个新合成的复本插入到另外的位置上,转移后仍保留原来位置上的DNA序列。
1、人类基因组计划(HGP)及基因组学概念的提出 二、基因组学 1、人类基因组计划(HGP)及基因组学概念的提出 人类基因组计划是由美国科学家于1985年率先提出、于1990年正式启动的。旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息 。 美国、英国、法国、德国、日本和中国科学家共同参与了这一价值达30亿美元的研究计划。
20世纪科学史上三个里程碑:曼哈顿原子弹计划、人类登月计划、人类基因组计划(HGP) 1990年NIH和能源部(DOE) 制定了第一个五年计划 (1991~1995) 1993年修改制定了1994~1998年的目标策略. 1998年底,出台了1998~2003年第二个五年计划。 20世纪科学史上三个里程碑:曼哈顿原子弹计划、人类登月计划、人类基因组计划(HGP)
3、基因组学(genomics)概念及分类 基因组学:以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。 1.根据研究的重点分类:结构基因组学、功能基因组学、比较基因组学。 2.根据研究对象分类:肿瘤基因组学、植物基因组学、药物基因组学、环境基因组学等。
4、基因组学研究的常用方法 (1) 脉冲场凝胶电泳(PFGE) (2) 毛细管电泳 (3) 基因芯片技术 (4) 全基因组测序 (5) 生物信息学 (6) 双向电泳 (7) 质谱
第二节 结构基因组学(structural genomics) 一、概念和目的 以全基因组测序为目标的基因结构研究,弄清基因组中全部基因的位置和结构,为基因功能的研究奠定基础。其目的是建立高分辨的遗传图谱、物理图谱和序列图谱。
二、基因组作图 遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。 根据使用的标志和手段不同,有4种作图类型:遗传图谱、物理图谱、序列图谱、基因图谱。
敲碎基因组,分析目的片段所处的染色体位置
1、遗传图谱(genetic map) /连锁图谱(linkage map) 指基因或DNA标志在染色体上的相对位置与遗传距离。它以具有多态性的遗传标记为“路标”,以重组频率为图距的基因组图。 遗传图谱的建立为基因识别和完成基因定位创造了条件。 遗传多态性:在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1% 遗传标记:等位基因、RFLP、MS、SNP等 遗传距离:在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1“厘摩(centi-Morgan,cM) ”
限制性片段长度多态性(restriction fragment length polymorphisms, RFLPs):用一种或几种限制性内切酶切割基因组DNA,用探针杂交并放射自显影。由于DNA酶切位点的变异所造成的“能切”与“不能切”两种状况,可产生不同长度的片段(等位片段),可用凝胶电泳显示多态性。
数量可变串联重复(VNTR) /小卫星 短串联重复(STR)/微卫星(MS):使遗传图的精度提高;可作为物理图谱的标志,促进了遗传图谱与物理图谱的整合。
单核苷酸多态性(Single Nucleotide Polymorphisms, SNPs) 不同个体间在基因水平上的单核苷酸变异。平均每500~1000bp出现一个碱基差异,如果一个碱基位置发生的变异在1%以上的人群中存在,这个位点就被定义为SNP位点。位于编码区的SNP称为cSNP。2个无关个体间有300万SNPs.
单核苷酸多态标记(SNP)
2、物理图谱 指DNA序列上各遗传标志间的实际距离,是把遗传图谱中克隆群上的DNA片段按实际的物理位置进行排序所构建的图谱。距离单位为bp/kb/Mb。 物理图谱反映的是DNA序列上两点之间的实际距离,而遗传图谱则反映这两点之间的连锁关系。 在DNA交换频繁的区域,两个物理位置相距很近的基因或DNA片段可能具有较大的遗传距离,反之亦然。
细胞遗传学图:用于对以104kb为长度量级的区域制图 染色体显带技术: 通过各种染色法,以染色体上显示的深浅不同的带型确定DNA序列分布和位置,可区分107bp范围。 细胞遗传学图:用于对以104kb为长度量级的区域制图
FISH(荧光原位杂交)技术 荧光原位杂交图(fluorescent in situ hybridization map,FISH map) :用不同波长荧光标记的各种DNA序列(探针),与染色体上的互补序列杂交而不破坏染色体的整体形态,显微镜下观察、辨认荧光标记在染色体上的定位并绘制图谱。
限制性图谱(restriction map): 用于对小区域,如kb量级做精细结构制图 限制性酶切图:选用合适的限制性核酸内切酶对基因组DNA或部分基因组DNA进行酶切,获得以酶切位点为标记的物理图。
辐射杂交图: 对片段DNA的断点作图。 辐射杂交细胞图(radiation hybrid map,RH):利用X射线照射人细胞,使染色体随机断裂,然后与啮齿动物细胞杂交克隆,人的染色体片段便被整合到啮齿动物染色体上。两个相邻基因或DNA标志的距离越近,越可能出现在同一片段,进入同一杂交细胞。通过识别、定位技术和统计学分析,可计算人DNA标志的连锁关系及其在染色体上的排列。
Huds on TJ等构建的相隔 199kb含有15086个STS图谱标志着人类基因组计划的物理图谱已初步完成。 序列标签位点(sequence tagged sites, STSs): 在染色体上定位明确,而且可用PCR扩增的单拷贝序列,通常为200-500bp。
3、序列图谱 以某一染色体上所含的全部碱基顺序绘制的图谱。既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。
连续克隆系逐个克隆法 (公共领域测序计划) (1)建立插入人类基因组片段的酵母人工染色体(YAC)克隆群。 (2)利用高频分布、易于检索的DNA标志或者DNA指纹图谱建立克隆之间的联系,组成有序排列的连续克隆系,最常使用的DNA标志有STS和表达的序列标签(expressed sequence tag,EST)。 (3)将克隆群定位于染色体的不同区域,构成完全基因组物理图谱。 (4)进行次级克隆,序列分析。
全基因组鸟枪法(美国Celera公司) ①用机械方法打断DNA,建立插入片段约2kb的高度随机基因组文库。 ②高效、大规模的两末端测序。 直接将基因组分解成小片段随机测序,利用超级计算机进行组装 ①用机械方法打断DNA,建立插入片段约2kb的高度随机基因组文库。 ②高效、大规模的两末端测序。 ③用有关软件对测序克隆片段进行序列集合。 ④用适当方法填补缺口。
4、基因图谱 基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。 Genes:Annotation of the genome sequence has identified over 30,000 genes, plus many other features such as repeat sequences and CpG islands.
Expressed Sequence Tags (EST) mRNA 3 ESTs 5 ESTs EST lengths vary due to varying polymerase activity 对基因转录表达产物mRNA互补的cDNA(其片段称为表达序列标签,EST)进行大规模测序是序列标签位点的主要来源,并以此构建人类基因组转录图(基因图)。
2000年是基因组之年。2000年6月26日由美国总统克林顿与英国首相布莱尔联合宣布提前完成了人类基因组的工作框架图,这一天也因此成为人类历史上“值得载入史册的一天”。
人类基因组草图初步结论 全部人类基因组约有2.91Gbp 基因数量约3-4万(26383- 39114)。目前已定位了2.6万多个基因,但其中尚有42%的功能不明。 人类基因组中存在“热点”和大片“荒漠”。编码序列约占3%,非编码序列约占97%。 35.3%的基因组包含重复的序列。 人与人之间99.99%的基因密码是相同的。 仅1%-1.5%的人类基因带有制造蛋白质的指令 大约有223个基因可能是人类的脊椎动物祖先生存时由细菌插入的顺序。 男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。
第三节 功能基因组学(functional genomics) 一. 概念:利用结构基因组学提供的信息,以高通量,大规模实验方法及统计与计算机分析为特征,全面系统地分析全部基因及其编码蛋白的功能。包括:生物学功能、细胞学功能、发育学功能等。 前基因组时代的“钓鱼”和后基因组时代的“捞鱼” 研究内容: 基因组表达及其调控 基因组序列变异性 模式生物研究 生物信息学
计算机科学家 遗传学家 生物化学家 人类功能基因组 生理学家 细胞生物学家 结构生物学家 临床和病理学家 从基因组信息与外界环境相互作用的高度,阐明基因组的功能。 计算机科学家 遗传学家 生物化学家 人类功能基因组 生理学家 细胞生物学家 结构生物学家 临床和病理学家
高通量解析蛋白质的高级结构,是连接基因组功能研究和新药开发的桥梁。 二、研究内容: (一)基因的表达及其调控 人类基因信息的识别和鉴定。 基因功能的识别和鉴定。 在全细胞的水平,识别所有基因组表达产物: mRNA: cDNA 阵列 蛋白质:二维电泳+质谱 研究生物大分子相互作用: 阐明基因组表达的时、空的整体调控网络。 功能蛋白质组学: 高通量解析蛋白质的高级结构,是连接基因组功能研究和新药开发的桥梁。
1、鉴定DNA序列中的基因 计算机全基因组扫描,寻找ORF,确定多肽链序列。 可译框(开放阅读框open reading frames, ORF):人类基因组序列中所有可能编码蛋白质的基因。含有翻译的起始密码子、外显子及内含子剪接信号、翻译终止信号和3'poly(A)加尾信号。 孤儿基因 :ORF中尚不完全了解的基因框架.
2、基因功能的识别与鉴定 同源搜索:将ORFs预测的基因序列与数据库中基因序列资料进行比较,鉴定预测基因与已知(其他生物)基因序列的匹配程度,推测预测基因的某些功能。 根据该基因预测编码蛋白质的氨基酸序列,分析其功能结构域及可能的空间结构,再结合染色体定位,研究与同样定位在该染色体区带上的遗传性状或疾病的联系,确定其功能。 在实验动物中寻找它的同源基因,进行基因“敲除”,观察实验动物的生物学改变,以了解该基因的功能。 设计实验阻断基因表达,观察细胞和整体所发生的表型变化。
(1)基因转导技术 (2)反义核酸技术 (3) RNA干扰技术(RNAi): 将一段dsRNA导入机体或细胞后,与它有同源序列的基因的表达被干扰或抑制。 (4)转基因动物技术 (5)基因敲出和基因敲入技术
(6)反向遗传学:在已知基因序列的基础上研究基因的生物学规律。通过功能丧失突变体研究其表型效应。 传统遗传学(正向遗传学)主要研究自发或诱发突变体中某一性状的遗传行为,如控制突变性状的基因数目及其在染色体上的位置、突变性状在后代中的传递规律等。 反向遗传学筛选到的突变体有时无突变表型效应:突变表型效应需在特定环境中才表现;基因家族中其他基因功能的代偿。
3、描述基因表达模式 基因表达模式(gene expression patterns)/基因表达谱(gene expression profiles):在细胞水平上全面评价基因的表达情况。 (1)转录组(transcriptome)与转录图谱 转录图谱:细胞在某一环境条件、生命阶段、生理或病理(功能)状态下的所有mRNA转录物,代表了特定时空生命体细胞或组织所表达的基因种类和水平。 技术:用已定位的YAC或BAC DNA为探针,与所有可能相关的各组织cDNA文库杂交,寻找其同源克隆并做进一步分析。
基因芯片示意
(2)蛋白质组(proteome)与蛋白质图谱 蛋白质组学(Proteomics): 研究细胞或组织基因表达的全部蛋白质(表达蛋白质组学,Expression proteomics) 通过细胞内蛋白质复合物研究蛋白质与蛋白质的相互作用(细胞作图蛋白质组学,Cell-map proteomics)
主要蛋白质分离和鉴定技术: 双向聚丙烯酰胺凝胶电泳(2D-PAGE)。 激光解吸质谱、电喷雾质谱:高效、精确地测量生物大分子的质量并进行部分测序。 “肽质指纹图谱与肽序列标签” 技术:利用质谱快速、准确、自动化、大规模地鉴定蛋白质。
蛋白质2D电泳分析
蛋白质2D电泳分析
4、基因产物结构与功能预测 高通量的蛋白质三维结构分析,为蛋白质的功能研究和药物设计提供基础
(二)人类基因组序列变异性及人类基因组多样性计划 现代人群的不均一性 传统人群和民族的划分 体质学特征 语言 文化历史背景 其他特征 问题:现代人群的起源?人群间的相互关系?人群间差别的生物医学意义和遗传学基础?
人类基因组多样性计划 人类基因组多样性计划主要研究人类分子多态性和表型多样性的变化规律及不同群体和个体之间疾病易感性和抗性的差异原因。从分子水平探索生物起源、进化的规律性。 FRLP、微卫星、SNP等分子多态是人类基因组多样性的遗传基础并与人类进化有密切联系。线粒体DNA(mtDNA)在不同地区人群中具有一定的差异,人类的进化和亲缘关系与mtDNA密切相关,其研究结果支持人类起源于非洲祖先的结论。
DNA多态性 序列多态性(SNPs – 单碱基多态性) 同源染色体 5-GGTTTACACCTAA- 同源染色体 5-GTTTTAAACCGAA- 长度多态性(VNTR - 可变的串联重复顺序 ) 同源染色体 5-AATCAATCAATC- 同源染色体 5-AATCAATCAATCAATCAATC-- 1985年Jeffreys 应用RFLP进行亲子鉴定,创建DNA指纹分析方法
人类遗传多态性的意义 与性状相关; 与疾病相关,可用于预测发病风险; 个体医学发展的基础; 可作为遗传标志,用于疾病连锁诊断; 作为个人身份识别标识用于法医学。
(三)生物信息学(Bioinformatics) 摩尔定律
对人类基因组计划的生物信息量必须借助生物信息学才能进行采集、管理、保存 、检索、处理、利用、服务、应用、开发。 三大数据库:EMBL(欧洲分子生物学实验室)、GenBank(美国国家生物情报中心,NCBI)、DDBJ(日本核酸数据库)。 大大提高了实验数据的处理速度并将改变传统实验科学的运作方式,使人类基因组计划和后基因组计划的进程大大加快。
第四节 比较基因组学(comparative genomics) 对模式生物和病原生物等进行全基因组序列分析。迄今至少已有5种真核生物,38种微生物完成全基因组序列分析 大肠杆菌 通过对进化不同阶段的生物体基因组 序列的比较,发现基因组结构组成和功能调节的规律 线虫 酵母 利用酵母、线虫、果蝇、斑马鱼、 小鼠等模式生物体进行基因的剔除 或转基因的研究,从而在整体 水平认识基因的功能。 果蝇 小鼠
第五节 基因组学对医学的影响 发现新的致病基因 发展一些复杂疾病的早期基因诊断方法 第五节 基因组学对医学的影响 发现新的致病基因 发展一些复杂疾病的早期基因诊断方法 疾病易感基因的识别及对风险人群进行生活方式、环境因子的干预 人类基因组多样性与个体化医学 遗传多态性在身份识别方面的应用 通过基因治疗解决传统方法无法解决的疑难杂症
基因工程药物 诊断和研究试剂产业:基因和抗体试剂盒、生物芯片、疾病和筛药模型 筛选新药和药物的靶点,分析药理过程 进行药物设计,对基因蛋白产物的高级结构分析、预测、模拟药物作用“口袋” 个体化药物治疗:药物基因组学 胚胎和成年期干细胞、克隆技术、器官再造
内在因素(主要是遗传因素) 外在因素(环境因素) 外在因素+内在因素 人类的疾病原因 内在因素(主要是遗传因素) 外在因素(环境因素) 外在因素+内在因素 囊性纤维病变 糖尿病 AIDS 遗传决定 环境决定 疾病 基因 环境
我爸爸给你爸爸开过同样的药! 这就是遗传!
一、“基因病” ( Gene Disease) “基因病”概念: 基因相关论:所有疾病都与人类基因有关 基因修饰论:所有药物都是通过修饰基因本身结构、改变基因的表达调控、影响基因产物的功能而起作用的 基因的多态性 除外伤外,所有的疾病,都可以说是基因病
单基因遗传病和复杂疾病
1、单基因病:是指某种疾病的发生主要由一对等位基因的一个或两个基因位点存在缺陷而引起,其遗传方式遵循孟德尔遗传规律。 我国有丰富的疾病资源,特别是一些我国特有的单基因遗传病家系,可提供良好的基础发现新的致病基因.
2、多基因病:这类疾病发病的基因机制理十分复杂,涉及一个以上的等位基因以及基因与环境因素的相互作用,又称为多因子疾病。 多基因疾病:主效基因+微效基因+环境 心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病,是目前疾病基因研究的重点。 由于基因的变异,环境和生活习惯等因素的共同影响,使得每个人对不同的疾病的易感性不同。 "肿瘤基因组解剖计划" “环境基因组学计划"
3、获得性基因病:这类疾病由病原微生物感染引起,不符合孟德尔遗传规律。 细菌病. 病毒病 寄生虫病 螺旋体 支原体 衣原体
二、疾病相关基因的鉴定 1、定位克隆:染色体制图克隆致病基因 2、候选克隆:差异基因表达谱等筛选候选致病基因,确定疾病相关基因网络 3、定位候选克隆:电脑分析定位中的候选基因 4、分子表型克隆:SNPs等筛选致病基因 功能克隆:分析功能蛋白
1. 定位克隆及定位候选克隆 “定位克隆”和“定位候选克隆“发现亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因
通过定位克隆技术寻找疾病基因的过程
定位候选克隆
三、基因检测(Gene Testing) 基因检测:适应分子医学发展需要产生的一种新型的个体基因异常检测手段,直接检测DNA。 1、法医鉴定 2、遗传病早期检测:携带者;风险预测 3、感染疾病检测 4、肿瘤的诊断和预测 5、产前诊断和新生儿筛查
细胞核 DNA 基 因 诊 断 转录 mRNA 翻译 蛋白质 生化学诊断 血清学诊断 临床学诊断 临 床 表 现
在遗传性疾病和产前诊断中的应用 血红蛋白病 杜氏肌营养不良症 苯丙酮尿症 脆性X综合症
Sequence variation and disease 序列测定检测基因病 Sequence variation and disease Substitution of a C by a T in this gene sequence (the SH2D1A gene on the X chromosome) causes uncontrolled proliferation of immune B and T cells in response to an Epstein-Barr virus infection. Variations in genes can also cause individuals to respond differently to the environment, medicines, allergens, chemicals and toxins.
在感染性疾病诊断中的应用 病毒 细菌 螺旋体 支原体 衣原体 寄生虫
在肿瘤学及肿瘤诊断中的应用 肿瘤染色体易位及融合基因的检测 癌基因与抗癌基因的检测 肿瘤相关病毒的检测 肿瘤细胞多药耐药基因的检测 微卫星不稳定性的检测 端粒酶活性的检测
基因芯片检测 脑肿瘤 乳癌 白血病 淋巴瘤 前列腺癌 肝癌
在法医中的应用 DNA指纹用于亲子鉴定 DNA指纹用于罪犯识别
四、药物靶标和药物设计 疾病诊断 药物1 药物2 药物3 目前的疾病治疗 疾病诊断 药物1 药物2 药物3 药物敏感性测定 将来的疾病治疗
1.药物基因组学研究与个体化治疗 临床上对同种疾病使用同一种药物,不同个体对药物的敏感性和毒性反应有很大区别,这种区别主要由基因决定的,特别是药物靶点基因、药物代谢基因等的单核苷酸多态性,影响了药物作用的强弱和药物代谢的不同。 常见药物靶标:信号传导通路中的功能分子,如G蛋白偶联受体、蛋白酶、蛋白激酶、磷酸酶等。 分泌型激素、生长因子、激酶、可溶性受体既可作为药物,又可作为药物靶标。 根据基因特性为某个群体或个人设计药物。
影响CYP3A 表达的SNP对 药物代谢产生 不同作用
利用反向生物学原理及人类基因序列数据,经生物信息学分析、高通量基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物。 2.基于基因组的新型药物(Genome-based drug) 利用反向生物学原理及人类基因序列数据,经生物信息学分析、高通量基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物。 人类基因组为药物开发提供了新源泉: 已开发成功的药物约2000种。已应用的人类药物靶标约500种。 估计人类基因组中3-4万个基因中,约5000个基因产物可成为潜在的药物靶标
国际新药开发的三个浪潮 基因组学 药物靶标发现、反义治疗、基因治疗 蛋白质组学 药物靶标评价、药物筛选、抗体治疗、重组蛋白质治疗 分子设计 蛋白质结构确定、蛋白质工程、以结构为基础的小分子药物设计
基因组药物开发流程 生物信息学 蛋白质 序列 人类基因序列 重组蛋白质 表达 药物靶标 研究 功能研究 高通量生物 活性筛选 先导化合物 基因工程 药物开发 基因治疗 化学新药
基因组药物的种类 (1)基因工程重组蛋白质药物 (2)以人类基因编码蛋白为靶标的化学药物 (3)以人类基因编码蛋白为靶标的人源化抗体 (4)反义核酸类和RNA类药物 (5)基因治疗药物
五.基因治疗 将人类基因导入人体,纠正缺陷基因或辅助机体抵抗疾病。具有良好开发前景,但近期离产业化尚有距离。 1990年9月Blaese和Andson对一名腺苷脱氨酶(ADA)缺陷患者实施基因治疗 有关肿瘤、艾滋病、囊性纤维化病变、杜氏肌营养不良、遗传性神经疾病、血友病等疾病的基因治疗的研究得越来越深入。
重症联合免疫缺陷的基因治疗 腺苷脱氨酶基因治疗(1990) Ashanti de Silva, Now 13, was the first patient to be treated with gene therapy.
重要内容: 1、重要名词:genome;genomics;human genome project(HGP);bioinformatics;genetic/linkage mapping;physical mapping; sequence tagged sites(STSs); transcriptome;proteome 2、人类基因组计划的主要内容(简述) 3、功能基因组学的主要内容(简述) 4、遗传标记及其利用(简述) 5、基因组学在医学中的应用(简述) 6、研究基因组学的常用方法(5例)