STRATEGIES FOR ANALYZING GENE EXPRESSION AND FUNCTION

Slides:



Advertisements
Similar presentations
第四节 RNA 的空间结构与功能. RNA 的种类和功能 核糖体 RNA ( rRNA ):核蛋白体组成成分 转移 RNA ( tRNA ):转运氨基酸 信使 RNA ( mRNA ):蛋白质合成模板 不均一核 RNA ( hnRNA ):成熟 mRNA 的前体 小核 RNA ( snRNA ):
Advertisements

植物生理 植物细胞生理基础 同工酶. 学习目标 Click to add title in here Click to add title n here  掌握同工酶的概念。  了解同工酶的意义。
分子生物学部分开发实验 植物遗传亲缘关系研究.
龙星课程—肿瘤生物信息学上机课程 曹莎
第二十二章 基因诊断与基因治疗.
证券投资技术分析.
蛋白质工程的崛起.
第六章 遗传和变异 1.植物叶肉细胞内遗传物质的载体不包括( ) A.染色体 B.质体 C.线粒体 D.核糖体
生命的物质基础.
第十二章 淋巴细胞的抗原受体与辅助分子.
PCR检测HBV DNA 滁州市第二人民医院 谢瑞玉.
细胞核是遗传信息库.
基因的表达 凌通课件.
糖尿病流行病学.
1、环境中直接影响生物生活的各种因素叫做 。它可以分为 和 两类 。
第二十章 胚胎学绪论.
组织学与胚胎学.
模块九 植物遗传转化技术.
第 十 五 章 常用分子生物学技术 原理及应用 The Principle and Application of Common Used Techniques in Molecular Biology 授课教师:方王楷 生物化学与分子生物学教研室.
The regular mechanism of eukaryotic DNA replication
第六章 常用分子生物学技术.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
内科护理学实验 1 血糖的监测与护理 实验学时:4学时 实验类型:综合性.
The Basic Technologies for DNA Manipulations
                                                                                                                                                                
骨质疏松症的遗传学研究(part 2) Hong-Wen Deng, Ph.D. Osteoporosis Research Center
基因打靶技术 叶亚新.
The CAN bus 李强.
生物芯片原理初探 黄思宇 生物芯片原理初探 HSY.
基 因 工 程 (一轮复习) 佛山市第一中学 黄广慧.
流式细胞术 在微生物学中的应用 彭公峰
高通量测序 高通量测序的应用 朱伟珊 高通量测序 朱伟珊 东盛生物.
普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第六章:蛋白质组学.
第二节 分子杂交及相关技术 。 分子杂交包括:DNA-DNA杂交,DNA-RNA杂交及蛋白杂交等。
分子生物学基本研究法(下)—基因功能研究技术
第十章 方差分析.
数据挖掘工具性能比较.
胚胎原位杂交检测基因的时空表达模式.
第七章 基因功能分析的基本策略 基因功能是在细胞组成的多层次的复杂生命体中实现的,因此对基因功能的研究将极大程度上依赖于对模式生物的研究。
Metabolic biomarker signature to differentiate pancreatic ductal adenocarcinoma from chronic pancreatitis Gut, 2017, Jan (IF=14.921) 汇报人:王宁 IMI CONFIDENTIAL.
C语言程序设计 主讲教师:陆幼利.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
胚胎干细胞生物学特性和研究进展.
第二节 DNA分子的结构.
医学实验技术绪论 上海交通大学医学院 樊绮诗 教授.
超越自然还是带来毁灭 “人造生命”令全世界不安
第三节 特殊用途的载体.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
代谢组学技术及应用新策略简介 代谢组学平台 刘慧颖.
iSIGHT 基本培训 使用 Excel的栅栏问题
AD相关LncRNA调控及分析方法研究 项目成员:魏晓冉 李铁志 指导教师:张莹 2018年理学院大学生创新创业训练计划项目作品成果展示
H基因库(重链基因连锁群): --- 第14号染色体 κ基因库(κ链基因连锁群): --- 第2号染色体 λ基因库(λ链基因连锁群):
魏新宇 MATLAB/Simulink 与控制系统仿真 魏新宇
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
利用DSC进行比热容的测定 比 热 容 测 量 案 例 2010.02 TA No.036 热分析・粘弹性测量定 ・何为比热容
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
基于列存储的RDF数据管理 朱敏
基因信息的传递.
BAFF在活动性SLE患者T细胞中的表达:
XX大学XX学院 多色复古论文答辩PPT模板 X124-2 蓝梦 学号.
基因组学及相关组学 基因组学 后基因组学 蛋白质组学 组学 ---- 研究细胞、组织或整个生物体内某种分子(核酸、
第三节 转录后修饰.
细胞分裂 有丝分裂.
第十七讲 密码执行(1).
第十二讲 密码执行(上).
使用Fragment 本讲大纲: 1、创建Fragment 2、在Activity中添加Fragment
入侵检测技术 大连理工大学软件学院 毕玲.
五.有丝分裂分离和重组 (一) 有丝分裂重组(mitotic recombination) 1936 Curt Stern 发现
病理生理学教研室 细胞信号通路检测(一) 总蛋白提取.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

STRATEGIES FOR ANALYZING GENE EXPRESSION AND FUNCTION 第二十六章 基因表达及功能分析的 基本策略 STRATEGIES FOR ANALYZING GENE EXPRESSION AND FUNCTION

Strategies for Analyzing Gene Expression 第一节 基因表达的分析策略 Strategies for Analyzing Gene Expression

一、通过检测mRNA 揭示基因转录水平的表达特征 根据分析方法的原理和功能特性,可将基因表达分析分为: 封闭性系统研究方法:例如DNA微阵列、Northern印迹、实时RT-PCR等方法,其应用范围仅限于已测序的物种,只能研究已知的基因。 开放性系统研究方法: 如差异显示PCR、双向基因表达指纹图谱、分子索引法、随机引物PCR指纹分析等,可以发现和分析未知的基因。 这里主要针对已知基因的常用表达分析方法做一介绍。

(一)基于杂交原理的方法可检测mRNA表达水平 1.Northern印迹(Northern blot) 既可分析mRNA表达又可验证cDNA新序列 是一种基于RNA-DNA杂交原理建立的一种RNA分析技术

Northern印迹分析原理示意图

2.核糖核酸酶保护实验 (ribonuclease protection assay,RPA) 可用于mRNA定量和RNA剪接分析 是一种基于杂交原理分析mRNA的方法,既可对mRNA进行定量分析又可研究其结构特征,灵敏度和特异性都很高。

核糖核酸酶保护实验原理示意图

3.原位杂交(in situ hybridization,ISH) 可对mRNA进行区域定位 是利用杂交原理建立的组织原位mRNA检测技术,可对细胞或组织中原位表达的mRNA进行区域定位。同时也可作为定量分析的补充。 通过设计与目标mRNA碱基序列互补的寡核苷酸序列,标记后作为探针;该探针能够特异性地与目标靶序列杂交,检测标记信号来确定基因在组织和细胞内表达的区位信息。 虽然原位杂交在功能性方面提供的信息较少,但是该技术还是被广泛用于组织中的基因表达分析,这是因为其较高的稳定性、较广泛的靶点和组织适用性。

(二)两种变换的聚合酶链式反应是常用的mRNA检测方法 1.反转录PCR 可用于mRNA的半定量分析 反转录PCR(reverse transcription-PCR,RT-PCR) 是一种简单、快捷地对RNA进行定性、定量分析的方法。它是以mRNA为模板,体外扩增cDNA,再以cDNA为模板进行特定基因转录产物的PCR扩增。RT-PCR技术一般用于RNA的定性分析;如果设置阳性参照,则可对待测RNA样品进行半定量分析。 该方法适合对待测样品进行初步筛选,目前已广泛被实时定量PCR替代。

2.实时定量PCR 常用于mRNA的定量分析 实时定量PCR (Real-time Quantitative Polymerase chain Reaction,RQ-PCR)是定量分析mRNA的最通用、最快速、最简便的方法,该方法是对PCR反应进行实时监测,具有很高的灵敏度和特异性。

目前有5种技术用于实时定量PCR: 其中最经济、简便的技术是利用荧光染料(如SYBR Green )与双链DNA分子结合发光的特性,指示扩增产物的增加; 其他4种方法都是以荧光染料标记的寡核苷酸为探针与正确的扩增子杂交,包括5’核酸酶法(即人们熟知的TaqManTM)、分子信标、ScropionsTM和探针杂交法,它们拥有更强的特异性,可以避免对PCR后溶解曲线的需求,以及后续的Southern杂交或对扩增子的测序鉴定,但是成本较高。

SYBR Green实时定量PCR分析原理示意图

二、通过蛋白质检测揭示基因 翻译水平的表达特征 (一)采用特异抗体经Western印迹可直接 测定基因编码多肽 Western印迹(Western blot)是一种免疫印迹技术,其基本原理与核酸分子杂交相似,只是以偶联标记物的抗体分子作为探针,检测转移到固相支持物上的蛋白质/多肽分子。当在蛋白质水平上检测特定基因的表达活性时,最常用的方法就是利用Western印迹对细胞或组织的总蛋白质中的特异蛋白质进行定性和半定量分析。

Western blot基本程序 蛋白质样品的制备 SDS-PAGE分离 蛋白质转膜 特异抗体(即第一抗体)与膜上的蛋白质(抗原)印迹杂交 再经偶联了可检测标记信号的第二抗体(即抗抗体,商品试剂盒中多采用偶联辣根过氧化物酶的Ig) 最后经与酶的底物反应而显影、成像,经扫描后获取免疫印迹信息

(二)酶联免疫吸附分析与Western印迹原理 相似但形式不同 酶联免疫吸附分析(Enzyme-linked immunosorbent assay,ELISA)也是一种建立在抗原-抗体反应基础上的蛋白质分析基本方法。 该方法不需经电泳分离待检样品蛋白质,而是预先将样品包被在支持体上,以后反应过程与Western印迹大致相同——顺序结合(即“吸附”)特异抗体(一抗)及与酶连接的第二抗体(也可预先包被抗体,“吸附”抗原),再进行酶-底物反应。反应后通过专门的酶标仪测定、记录数据。

酶联免疫吸附分析 特点: 具有特异性; 灵敏度很高; 稳定、操作简便,标本用量少,适于大规模筛查,尤其适用于检测体液中微量的特异性抗体或抗原; 既可以做定性试验也可以做定量分析。 被广泛应用于微生物学、寄生虫学、肿瘤学和免疫学等领域。

(三)免疫组化实验可对组织/细胞 表达的蛋白质进行原位检测 免疫组织化学(immunohistochemistry)与免疫细胞化学(immunocytochemistry)原理相同,都是利用标记的特异性抗体通过抗原-抗体反应和显色反应,在组织或细胞原位检测特定抗原(即目标蛋白质)的方法,简称为免疫组化实验。近年来由于荧光标记抗体的广泛应用,这两种方法又被统称为免疫荧光法。

(immunofluorescence),可应用荧光(倒置)显微镜或激光共聚焦显微镜(confocal microscopy)对靶分子进行定性、定量和定位分析,激光共聚焦显微镜还可进行断层成像,是在蛋白质水平分析基因表达的直观方法。 其中抗体对于蛋白质靶点的特异性、种间交叉反应、检测系统的灵敏性以及细胞或组织的固定类型是该方法的关键因素。 运用双重着色或多重着色程序同时对多个感兴趣的靶分子进行检测,是一种揭示更多有关细胞群的功能和它们之间相互作用信息的有效方法。 免疫组化主要是作为定性、定位的技术,若结合密度计量系统、图像分析系统等测量工具也可以得到定量的数据。

(四)流式细胞术用于分析 表达特异蛋白质的阳性细胞 流式细胞术(flow cytometry)在细胞水平分析特定蛋白质的基本原理也是抗原-抗体反应,它利用荧光标记抗体与抗原的特异性结合,经过流式细胞仪分析荧光信号,从而根据细胞表达特定蛋白质的水平对某种蛋白质阳性细胞(即特异基因表达的细胞)作出判断。

流式细胞术可以检测活细胞,也可以检测用甲醛固定的细胞。 广泛应用于细胞表面和细胞内分子表达水平的定量分析,并能够根据各种蛋白质的表达模式区分细胞亚群。 此外,流式细胞术可以使用多个荧光标记的抗体同时对多个基因产物进行标记和监测,是对细胞进行快速分析、分选、特征鉴定的一种有效方法。

三、高通量检测技术成为基因表达研究的有力工具 高通量筛选(High throughput screening,HTS)技术是在大量核酸、多肽信息累计(即资料库)基础上,采用微板作为分子载体,制作集成“芯片”,以自动化操作系统进行分子杂交的试验过程。 因为快捷、灵敏、信息量大,适合大规模操作,故称“高通量”。 高通量检测技术适合“组学”(omics)研究,更适合生命活动过程相关的基因表达谱分析。

(一)基因芯片和高通量测序技术可在基因水平高通量地分析基因表达 基因芯片已成为基因表达谱分析的常用方法 基因芯片(gene chip)又称DNA微阵列(DNA microarray)、DNA芯片(DNA chip), 是将大量已知序列的核酸片段(包括寡核苷酸、cDNA、基因组DNA、microRNA等) 集成在同一基片上,组成密集分子排列,通过与标记样品进行杂交,检测、获取细胞或组织的基因信息。 其中基因表达谱(expression prifile)分析是目前基因芯片应用最多的一个方面,主要采用cDNA芯片,基因表达谱芯片便于对不同状态(如生理和病理条件)下的基因表达谱进行比较,揭示转录组(transcriptome)差异表达的规律,对探索发病机制、评价治疗效果、筛选药物靶标具有重要意义。

2. 高通量测序技术是新一代基因表达谱分析方法 高通量测序技术可以一次对几十万到几百万个DNA分子片段进行序列测定,从而快速获得转录组或基因组的全貌, 又被称为深度测序(deep sequencing)。

1)目前,高通量测序技术不仅仅在DNA测序中起到重要的作用,并且已经应用于基因组分析的各个方面: 在RNA水平上,可以对RNA片段进行扫描、定量与鉴定,对全基因组进行广谱表达研究。 2)高通量测序另一个被广泛应用的领域是小分子RNA或非编码RNA(ncRNA)研究。测序方法能轻易地解决芯片技术在检测小分子时遇到的技术难题(短序列, 高度同源), 而且小分子RNA的短序列正好配合了高通量测序的长度,同时测序方法还能在实验中发现新的小分子RNA。

基因芯片的缺点: 在于它是一个“封闭系统”, 它只能检测人们已知序列的特征(或有限的变异)。 高通量测序的优势: 在于它是一个“开放系统”, 它的发现能力和寻找新信息的能力从本质上高于芯片技术。

(二)蛋白质芯片和双向电泳可在蛋白质水平高通量地分析基因表达 1.蛋白质芯片有多种形式和用途 蛋白质芯片(protein chip)是一种对蛋白质的表达和功能进行高通量分析的技术。 是将具有高度亲和特异性的探针分子(如单克隆抗体)固定在基片上,用以识别复杂生物样品溶液中的目标多肽;蛋白质功能芯片可用来研究蛋白质修饰、蛋白质-蛋白质/DNA-蛋白质/RNA-蛋白质,以及蛋白质与脂质、蛋白质与药物、酶与底物、小分子-蛋白质等的相互作用。

根据蛋白质芯片制作方法和用途不同,可将其分为 1. 蛋白质检测芯片 2. 蛋白质功能芯片两大类 蛋白质检测芯片包括: 抗体芯片 抗原芯片 配体芯片 碳水化合物芯片等

2.双向电泳结合质谱普遍用于蛋白质表达谱的分析和鉴定 目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术又称二维电泳(two-dimensional electrophoresis, 简称2-D电泳)。 原理: 根据蛋白质分子的两个属性——等电点和分子质量——将蛋白质混合物进行分离。电泳结果经染色后,即可对不同样品中蛋白质的表达谱进行比较;还可从凝胶中将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片段,利用质谱(mass spectrum)技术进行定性分析,对差异表达的蛋白质进行鉴定。 可同时分离数成百上千的蛋白质。

Bioinformatics Application in Predicting Gene Function 第二节 生物信息学在预测基因 功能中的应用 Bioinformatics Application in Predicting Gene Function

一、利用生物信息学方法进行基因功能注释 (一)通过序列比对预测基因功能 序列比对是生物信息学最基本的分析技术之一,最常用的方法是将目的DNA或蛋白质序列与已知的DNA和蛋白质序列数据库进行比对,搜索到与目的序列高度同源的功能已知的基因或蛋白质,用这些基因和蛋白质预测目的基因和蛋白质的功能。局部比对搜索工具BLAST是进行序列比对的基本工具,它允许用户选择一条查询序列与一个数据库进行比对,找到数据库中与输入的查询序列相匹配的项。BLAST是一个序列数据库搜索程序家族,其中包括许多有特定用途的程序。

BLAST序列数据库搜索程序家族 程序 查询序列类型 数据库类型 注 BLASTN DNA BLASTP 蛋白质 BLASTX 将待搜索的核酸序列按6个阅读框翻译成蛋白质序列,然后与数据库中的蛋白质序列比对 TBLASTN 将数据库中的核酸序列按6个阅读框翻译成蛋白质序列,然后与待搜索的蛋白质序列比对 TBLASTX 无论是待搜索的核酸序列还是数据库中的核酸序列都按6个阅读框翻译成蛋白质序列,然后比对

(二)利用生物信息学方法分析基因芯片数据 最常用的方法有: 差异表达分析(又称基因表达差异分析) 聚类分析 差异表达分析的目的: 识别两个条件下表达差异显著的基因,即一个基因在两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义

差异表达分析常用的分析方法有3类: 倍数分析:计算每个基因在两个条件下的表达比值; 统计分析中的t检验和方差分析:通过计算表达差异的置信度来分析差异是否具有统计学意义; 建模的方法:通过确定两个条件下的模型参数是否相同来判断表达差异的显著性。

聚类分析所依据的基本假设: 若组内基因具有相似的表达模式,则它们可能具有相似的功能,例如受共同的转录因子调控的基因,或者产物构成同一个蛋白复合体的基因,或者参与相同调控路径的基因。 在具体应用中可按照相似的表达谱对基因进行聚类,从而预测组内未知基因的功能。 目前已经有很多种聚类的方法应用到基因芯片的研究当中,如层次聚类(Hierarchical clustering)、K 均值聚类(K-means clustering)、自组织映射(self organizing map)、PCA (principlecomponet analysis)等。

(三)通过生物信息学方法分析蛋白质 结构来预测蛋白质功能 在氨基酸序列整体同源性不明显的情况下,对蛋白质的功能域进行分析将对预测基因功能提供极其有价值的信息。目前已通过多序列比对将蛋白质的同源序列收集在一起,确定了大量蕴藏于蛋白质结构中的保守区域或序列,如结构域(domain)和模体(motif),这些共享结构域和保守模体通常与特定的生物学活性相关,反映了蛋白质分子的一些重要功能。

运用蛋白质序列模体搜索工具预测蛋白质功能的方法是: 首先收集现有的蛋白质家族,构造模体数据库; 而后通过搜索该数据库确定查询序列是否具有可能的序 列模体,判断该序列是否属于一个已知的蛋白质家族; 然后根据该蛋白质家族的已知功能预测未知蛋白质的功能。 常用的模体数据库有INTERPROSCAN、PROSITE、 SMART等。

基因组功能注释常用数据库 数据库 网址 描述 AAT http : / / genome. cs. mtu. edu / aat 基因组分析和注释工具 COG http : / / www. ncbi. nlm. nih. gov / COG/ 直系同源体簇分析数据库 EcoCyc http : / / ecocyc. pangeasystems. com/ ecocyc/ ecocyc. html 大肠杆菌的基因与代谢 OMIM http : / / www. ncbi. nlm. nih. gov / Omim/ 在线人类孟德尔遗传资料 PEDENT http : / / pedant . mips. biochem. mpg. de/ frishman/ pedant . html 完整基因组的生物信息学分析 SAS http : / / www. biochem. ucl. ac. uk/ cgi2bin/ sas/ query. cgi 结构为基础的基因组序列分析 WIT http : / / www. cme. msu. edu/ WIT/ 基因组代谢途径重构

二、利用生物网络全面系统地了解 基因的功能 现在人们已经越来越清楚地认识到,生物功能大多不是只由一个或几个基因控制的,而是通过生物体内众多的分子(如DNA、RNA、蛋白质和其他小分子物质)共同构成的复杂生物网络实现的。当前生物学面临的巨大挑战之一就是,了解生物体内复杂的相互作用网络以及它们的动态特征。要想全面系统地解析这些复杂的生物网络需要大量相关数据的积累,现代基因芯片、蛋白质芯片等大规模数据采集技术大大加快了这一进程。目前人们已经利用生物技术和信息技术建立了各种生物网络数据库和网站,可为研究者提供基因调控、信号转导、代谢途径、蛋白质相互作用等方面的信息。

(一)利用生物网络研究基因调控 生物体任何细胞的遗传信息、基因都是相同的,但同一个基因在不同组织、不同细胞中的表达却不相同。一个基因的表达既影响其他的基因,又受其他基因的影响,基因之间相互促进、相互抑制,构成一个复杂的基因调控网络。 基因调控网络研究就是:利用生物芯片等高通量技术所产生的大量基因表达谱数据,以及蛋白质-DNA间的相互作用等信息,结合实验室研究结果,用生物信息学方法构建基因调控模型,对某一物种或组织的基因表达关系进行整体性研究,从而推断基因之间的调控关系,揭示支配基因表达和功能的基本规律。

常用基因转录调控数据库 数据库 网址 描述 EPD 真核生物启动子数据库 包含已被实验证明的转录起始位点和组织特异性等启动子的一般信息 http://www.epd.idb-sib.ch 包含已被实验证明的转录起始位点和组织特异性等启动子的一般信息 TFD 转录因子数据库 http://www.ifti.org/ 是转录因子及其特性的专门数据库,收集有关多肽相互作用信息 TRANSFAC数据库 http://www.gene-regulation. com/pub/database.html# transcompel 提供转录因子结构、功能、序列、DNA结合谱以及分类,还包括基因的转录因子结合位点的信息 TRRD 转录调控区数据库 http://www.bionet.nsc.ru/ trrd/celcyc/ 收集了关于真核基因整个调控区分级结构和基因表达模式的信息

(二)利用生物网络研究信号转导 信号转导是生物系统的重要生命活动过程,机体通过信号转导通路中分子之间的相互识别、联络和相互作用, 实现整体功能上的协调统一。由于细胞内各种信号通路之间存在着紧密的联系和交叉调控, 形成了非常复杂的信号转导网络。信号转导网络研究的目的是期望通过建立细胞信号传导过程的模型,找出参与此过程的各个蛋白质间的相互作用关系,阐明其在基因调控、疾病发生中的作用。 生物信息学方法利用已知数据和生物学知识进行通路推断, 可以帮助阐释信号分子作用机制, 辅助实验设计, 节省大量的人力物力。有关信号转导通路的网上数据库资源较多 。

常用信号通路数据库 数据库 网址 描述 Biocarta http://www. biocarta. com 信号通路图片及注释数据库 Reactome http://www. reactome. org 生物核心通路及反应的挖掘知识库 PID http://pid. nci. nih. gov 从其他数据库导入及文献挖掘的人信号通路数据库 STKE http://stke. sciencemag. org 参与信号转导的分子及其相互作用关系的信息 AfCS http://www. signaling-gateway. org 参与信号通路的蛋白质相互作用和信号通路图 DOQCS http://doqcs. ncbs. res. in 细胞信号通路的量化数据库, 提供反应参数及注释信息 SigPath http://sigpath. org 提供细胞信号通路的量化信息

(三)利用生物网络研究代谢途径 代谢网络处于生物体的功能执行阶段,其结构组成方式反映了生物体的功能构成。代谢网络把细胞内所有生化反应表示为网络形式,反映了代谢活动中所有化合物及酶之间的相互作用。 通过基因组注释信息可以识别出编码催化生物体内生化反应的酶的基因,结合相关的酶反应数据库就可以预测物种特异的酶基因、酶以及酶催化反应,由此产生了许多优秀的代谢数据库,可以方便地检索某一生物代谢网络中的代谢反应。

常用代谢网络数据库 数据库 网址 描述 KEGG http://www.genome.ad.jp/kegg/ 包括了700个以上物种的代谢、信号转导、基因调控、细胞过程的通路 BioCyc http://www.biocyc.org/ 包括了260个物种的代谢通路及基因组数据 PUMA2 http://compbio.mcs.anl.gov/puma2/ 存放了预先计算的超过200个物种的代谢通路信息 BioSilico http://biosilico.kaist.ac.kr:8017/biochemdb/index.jsp 整合信息的数据库,提供对多个代谢数据库的访问

(四)利用生物网络研究蛋白质相互作用 从某种程度上可以说,细胞进行的生命活动,是蛋白质在一定条件下相互作用的结果,若蛋白质相互作用网络被破坏或稳定性丢失,会引起细胞的功能性障碍。阐明蛋白质相互作用的完整网络结构,有助于从系统的角度加深对细胞结构和功能的认识。 近年来各种预测蛋白质相互作用的计算方法被不断提出,将这些方法与实验方法结合,挖掘出了蛋白质相互作用网络中更多的相互作用节点,目前已有多个蛋白质相互作用的数据库应运而生,可用来研究蛋白质相互作用的生物学过程 。

常用蛋白质互作网络数据库 数据库 网址 描述 BIND http://www. bind. ca 提供参与通路的分子的序列和相互作用信息 DIP http://dip.doe-mbi.ucla.edu 专门存放实验确定的蛋白质之间相互作用的数据,既包括经典实验手段也包括高通量实验手段确定的蛋白质相互作用数据 STRING http://string.embl.de 存储实验确定的和预测得到的蛋白质相互作用数据,并对各种预测方法得到的结果的准确性给出了相应的权重 MIPS http://mips.gsf.de 包括酵母和哺乳动物的PPI,可靠性很高,被作为准金标准使用 Yeast Interactome http://structure.bu.edu/rakesh/myindex.html 综合多种来源的由酵母双杂交技术确定的酵母PPI数据集, 利用基因表达信息、蛋白亚细胞定位信息以及已知的各种知识对其进行验证形成高可信度的相互作用数据

三、复杂疾病的生物信息学研究策略 包括信息提取、分析和建模 癌症、糖尿病、高血压等复杂疾病对人类健康影响巨大,这类疾病的发病机制一般与多种遗传或非遗传因素,以及它们之间的相互作用有关,不能通过单基因、单通路、单层次的变化解释。 以系统的观点解释复杂疾病中遗传与环境的关系、描述复杂疾病中基因的特征、分析疾病基因型与表现型之间的关系,已成为生物信息学研究复杂疾病的基本观点,针对复杂疾病的研究模式,也开始从传统的“序列→结构→功能”向“相互作用→网络→功能”转变。

复杂疾病的基本研究策略—— ①疾病的基因组合及相互作用信息的提取:即对复杂疾病相关靶基因的识别,以及利用SNPs、基因、蛋白质等不同类型的信息,构建疾病驱使相关基因网络。 ②生物信息分析及多层次信息的融合:即从不同层次对疾病的遗传复杂性进行分析,对不同遗传网络间的映射算法进行研究,进而将SNPs、基因、蛋白质等不同水平的信息进行融合。 ③分子调控网络建模:即综合生理病理相关的基因、SNPs、基因表达状况,蛋白质功能状态以及临床治疗等信息,以系统的方法将不同的测量数据、各种因素的辨识、各个层次上的相互作用关系进行整合,建立数学模型,深入了解疾病过程、揭示复杂疾病的发病机制。

Methods for Identifying Biological Functions of Genes 第三节 基因的生物学功能鉴定技术 Methods for Identifying Biological Functions of Genes

目前在已知的2.5万~3万个人类基因中,大约70%的基因我们还不清楚它们的功能,有90%的基因我们不知道它们在体内的确切生理作用,因此,利用各种技术手段研究基因组中功能未知基因的作用,将是“后基因组时代”功能基因组学研究的主要内容。 生物信息学利用已知数据和生物学知识进行合理推断, 可以节省大量的人力物力,但基因功能的鉴定最终仍需要通过实验来验证。 通常采用基因功能获得和/或基因功能缺失的策略,观察基因在细胞或生物个体中的,细胞生物学行为或个体表型遗传性状的变化,来鉴定基因的功能。此外,基于正向遗传学的随机突变筛选技术也成为揭示基因功能的重要手段。由于基因的功能必须在完整的生物个体及其生命过程中才能得到完整的体现,因此从整体水平研究基因的功能是必然的选择。

一、采用功能获得策略鉴定基因的功能   基因功能获得策略即通过将目的基因直接导入某一细胞或个体中,使其获得新的或更高水平的表达,通过细胞或个体生物性状的变化来研究基因的功能。常用的方法有转基因和基因敲入技术等。

(一)用转基因技术获得基因功能 转基因技术(transgenic technology)是指将外源基因导入受精卵或胚胎干细胞中,通过随机重组使外源基因插入细胞染色体DNA,再将受精卵或胚胎干细胞植入受体动物的子宫,使得外源基因能够随细胞分裂遗传给后代。

1. 转基因动物可在整体水平研究基因的功能 转基因动物(transgenic animal)是指应用转基因技术培育出的携带外源基因,并能稳定遗传的动物。 其基本制作过程包括:转基因表达载体的构建,外源基因的导入,转基因动物的获得和鉴定,转基因动物品系的建立以及外源基因表达的鉴定。

转基因动物制作原理示意图

优点: 利用转基因动物模型研究外源基因,能够接近真实地再现基因表达所导致的结果,及其在整体水平的调控规律,把复杂的系统简单化,具有系统性和独立性,是目前层次最高的实验体系。 利用转基因技术建立的疾病动物模型具有遗传背景清楚、遗传物质改变简单、更自然更接近疾病的真实症状等优点。

但转基因动物模型仍存在一些亟待解决的问题: 外源基因插入宿主基因组是随机的,可能产生插入突变,破坏宿主基因组功能; 外源基因在宿主染色体上整合的拷贝数不等; 整合的外源基因遗传丢失而导致转基因动物症状的不稳定遗传等。 虽然转基因技术本身仍存在一些问题,但其在医学研究中的重要地位是毋庸置疑的,随着转基因技术的不断完善,其在医学及生物学领域必将有更加广泛的应用。

2. 转基因技术在不断完善 目前,科学家已经采取了多种方法使转基因技术更加完善: 为了更为精确地调控转基因的表达,使其获得时空特异性的调控,在构建转基因表达载体时,选择只在特定的细胞类型或特定的生命时期才启动基因表达的启动子,即可使外源基因获得时空特异性的表达。 可调控的基因表达系统也是一种常用的方法: 例如四环素调控系统,该表达系统可使转基因动物体内外源基因的表达受诱导剂(四环素)的调控,通过加入或去除诱导剂,就可以实现对外源基因表达时间及水平的控制。

当前转基因动物所涉及的转基因片段长度大多在几十个kb以下,但是,随着科学研究需要进行大片段DNA、多基因或基因簇的转基因。 克隆大片段DNA常应用酵母人工染色体(YAC)、细菌人工染色体(BAC)等,可获得200kb以上的大DNA片段,能携带包含完整的基因或多个基因,以及基因的所有外显子,和附近的染色体调控区,为目的基因提供与其在正常染色体上一致的环境,保证了转基因在正常细胞中的时空表达。

(二)基因敲入可以实现基因的定向插入 基因敲入( gene knock-in)是通过同源重组的方法,用某一基因替换另一基因, 或将一个设计好的基因片段插入到基因组的特定位点,使之表达并发挥作用。通过基因敲入,可以研究特定基因在体内的功能;也可以与之前基因的功能进行比较;或将正常基因引入基因组中置换突变基因以达到靶向基因治疗的目的。

基因敲入是基因打靶技术的一种,基因打靶技术是20世纪80年代后半期发展起来的,一种按预期方式准确改造生物遗传信息的实验手段。 该技术的巧妙之处在于把胚胎干细胞技术和DNA同源重组技术“结合”起来,实现对染色体上某一基因的定向修饰和改造,从而深入地了解基因的功能。 除基因敲入外,基因打靶还包括基因敲除、点突变、缺失突变、染色体组大片段删除等。

基因打靶的原理和基本步骤 首先, 从小鼠囊胚分离出未分化的胚胎干细胞, 然后利用细胞内的染色体DNA可以与导入细胞的外源DNA,在相同序列的区域内发生同源重组的原理,用含有正-负筛选标记的打靶载体,对胚胎干细胞中的特定基因实施“打靶”; 之后将“中靶”的胚胎干细胞移植回小鼠囊胚( 受精卵分裂至8个细胞左右即为囊胚, 此时受精卵只分裂不分化) , 移植进去的中靶胚胎干细胞钻入囊胚胚层, 与囊胚一起分化发育成相应的组织和器官; 最后诞生出具有基因功能缺陷的“嵌合鼠”。由于中靶的胚胎干细胞保持分化的全能性, 因此它可以发育成为嵌合鼠的生殖细胞, 使得经过定向改造的遗传信息可以代代相传。

基因打靶的原理示意图

二、采用功能失活策略鉴定基因的功能 基因功能研究的功能失活策略是通过观察,细胞或个体的某一基因功能被部分或全部失活后,细胞生物学行为或个体遗传性状表型的变化,来鉴定基因的功能。 常用的方法主要有 基因敲除 基因沉默

(一)基因敲除可以使基因的功能完全缺失 基因敲除(gene knock-out)属于基因打靶技术的一种,其操作步骤和原理与基因打靶技术相同。基因敲除技术是利用细胞染色体DNA可以与导入的外源DNA在相同序列的区域发生同源重组的现象,在ES细胞中定点破坏内源基因,然后利用ES细胞发育的全能性,获得带有预定基因缺陷的杂合子,通过遗传育种最终获得目的基因缺陷的纯和个体。 1987年,Thompsson首次建立了完整的ES细胞基因敲除的小鼠模型,此后基因敲除技术得到进一步的发展和完善,目前该技术已经成为研究基因功能最直接、最有效的方法之一。

基因被完全敲除之后使得表型分析受到很多限制: 有些重要的靶基因被敲除后会引起胚胎早期死亡,使得无法分析该基因在胚胎发育晚期和成年期的功能;某些基因在不同的细胞类型中执行不同的功能,完全敲除会导致突变小鼠出现复杂的表型,使研究者很难判断异常的表型是由一种细胞引起的,还是由几种细胞共同引起的。 近年来,条件性基因打靶(conditional gene targeting)系统的建立,使得对基因靶位时间和空间上的操作更加明确,效果更加精确可靠,已达到对任何基因在不同发育阶段和不同器官、组织的选择性敲除。

Cre/loxP系统作用原理示意图

条件性基因打靶的优势: 克服了重要基因被敲除所导致的早期致死 并能客观、系统地研究基因在组织器官发生、发育以及疾病发生、治疗过程中的作用和机制 这一技术亦存在一些缺点: 费用太高 周期较长 许多基因在剔除后并未产生明显的表型改变,可能是这些基因的功能为其他基因代偿所致

(二)基因沉默可以使基因的功能部分缺失 基因沉默(gene silencing)是指由外源基因导入引起的生物体内的特定基因不表达或表达受抑制的现象。 该现象最早发现在转基因植物中,后来这种现象在线虫、真菌、果蝇、斑马鱼、小鼠早期胚胎中也有发现。 目前最常用的基因沉默技术包括: RNA干涉(RNA interference,RNAi) 反义寡核苷酸(antisense oligonucleotide,ASON)

1. RNA干涉技术可用来研究基因的功能 RNAi是指双链RNA介导同源序列的mRNA特异性降解,导致的转录后基因沉默。

RNAi的作用机制: 外源dsRNA可直接被导入细胞,或者通过转基因、病毒感染等方式进入细胞,并整合到基因组中获得表达;各种来源的dsRNA被核酸酶RNaseⅢ家族中,特异识别dsRNA的Dicer酶,以一种ATP依赖的方式逐步切割成长约21~23nt的双链小干扰RNA(small interference RNA,siRNA);siRNA识别mRNA链上的同源区域之后,结合一个核酶复合物形成RNA诱导的沉默复合体(RNA-induce silencing complex,RISC);RISC定位到靶mRNA转录本上,并在距离siRNA 3’端12个碱基的位置切割mRNA。

RNAi的作用机制示意图

目前有5种方法可用于制备siRNA: 化学合成法 体外转录法 长链dsRNA的RNaseⅢ体外消化法 siRNA表达载体法 siRNA表达框架法 前3种方法是在体外制备然后导入到细胞中;后两种则是基于具有合适启动子的载体或转录元件,在哺乳动物或细胞中转录生成。 目前多采用RNA聚合酶Ⅲ启动子构建siRNA的表达载体或表达框架,常用的RNA聚合酶Ⅲ的启动子有人、鼠U6启动子、人H1启动子。

研究者既可以将siRNA导入特定细胞,在细胞水平上研究基因的功能; 也可以通过转基因的方法,在动物体内实现特异、稳定、长期地抑制靶基因的表达,从而在整体水平上研究基因的功能。 若将RNAi技术与Cre/loxP重组系统以及基因表达调控系统相结合,建立转基因动物模型,则不仅具有稳定、可遗传、可诱导等特点,而且无需使用胚胎干细胞技术和基因打靶技术,与基因敲除相比具有简单、易操作、周期短等优势。 已被作为一种简便和有效的工具广泛用于基因功能的研究。

缺点: 该技术可能对靶基因的相似序列发生作用,导致脱靶(off-targeting)效应。 还可能诱导干扰素和其他细胞因子的表达。

2. 反义寡核苷酸也可引发基因沉默 反义寡核苷酸是指能与mRNA互补配对的RNA分子,长度一般为20nt左右。 反义寡核苷酸引发基因沉默的机制: (1)可能是通过与靶mRNA互补结合后以位阻效应抑制靶基因的翻译; (2)也可能通过与双链DNA结合形成三股螺旋而抑制转录; (3)也不能排除通过激活细胞内的Dicer酶进入RNA干涉途径而降解靶mRNA。 由于反义寡核苷酸技术简便易行,已成为研究基因功能的方法之一。

三、随机突变筛选策略 利用转基因、基因敲除等技术从特定基因的改造到整体动物表型分析的“反向遗传学”研究大大推动了功能基因组学的进展,但是也存在明显的局限性: 首先,由于生物体的代偿机制,使得基因敲除动物常常观察不到异常表型; 其次,由于“反向遗传学”只能对已知的基因进行研究,而人类基因组中尚有90%以上的非编码序列处于未知状态; 第三,由于“功能缺失”和“功能获得”小鼠常出现胚胎期死亡,而目前可用于条件性基因改造的启动子还很少,从而阻碍了特定基因在成体动物中的功能分析; 第四,由于一个蛋白有多个不同的功能域,特定基因在不同位点上的突变可能产生不同的表型,应用单一的“功能缺失”方法,显然不可能发现这些不同的异常表型。

因此,单单应用“反向遗传学”不足以完成功能基因组学的任务,而基于“正向遗传学”的,从异常表型到特定基因突变的随机突变筛选策略逐渐受到青睐。 随机突变筛选策略的第一步是通过物理诱变、化学诱变或生物技术产生大量的基因组DNA突变。

ENU诱变是近年来发展起来的研究基因功能的新手段。ENU是一种化学诱变剂, 它通过对基因组DNA碱基的烷基化修饰, 诱导DNA在复制时发生错配而产生突变。

基因捕获(gene trapping)技术也是一种产生大规模随机插入突变的便利手段,对于揭示基因序列所对应的基因功能具有重要的应用价值。 基因捕获技术的基本过程是:将一含报告基因的DNA载体随机插入基因组,产生内源基因失活突变,通过报告基因的表达,提示插入突变的存在,以及内源基因的表达特点。利用基因捕获可以建立一个携带随机插入突变的ES细胞库, 每一种ES细胞克隆中含有不同的突变基因,ES细胞克隆经囊胚注射发育为基因突变动物模型,通过对动物模型的表型分析鉴定突变基因的功能。

基因捕获技术可节省大量构建特异打靶载体,以及筛选染色体组文库的工作及费用,成为可同时对基因的序列、基因的表达以及基因的功能进行研究的高效技术。 随机突变筛选策略能够获得功能基因研究的新材料及人类遗传性疾病的新模型, 这种“表型驱动”的研究方式有可能成为功能基因组研究最有前景的手段和捷径。

小 结 分析基因表达可以从RNA和蛋白质水平上进行。 有许多技术可用来分析基因的表达,如何根据实验目的和条件选择最佳的实验方法是关键。 小 结 分析基因表达可以从RNA和蛋白质水平上进行。 有许多技术可用来分析基因的表达,如何根据实验目的和条件选择最佳的实验方法是关键。 生物信息学具有方便快捷和经济的优点,如何应用生物信息学技术充分利用已知数据和生物学知识,得到与目的基因功能有关的重要信息,预测基因的功能,进而制定实验室研究方案,是现代生物医学研究人员必备的技能。 基因功能的鉴定最终仍需要通过实验来验证,尤其是在生物体内从整体水平对基因功能进行研究,是鉴定基因功能的最终解决方案。采用不同技术建立的模式生物是研究基因功能必不可少的工具,各种方法都具有各自的特点和局限性。结合基因功能获得和失活技术,从正反两方面对基因。

Thank You!