第十一章 药物生物信息学基础.

Slides:



Advertisements
Similar presentations
第四章 核苷酸和蛋白质序列为 基础的数据库检索 (I) 生物信息学. 检索数据库的方法  用关键词或词组进行数据库检索 (Text-based database searching)  用核苷酸或蛋白质序列进行数据库检索 (Sequence-based database searching) Gene.
Advertisements

蛋白质的一级结构与功能的关系 蛋白质的空间结构与功能的关系 1. 蛋白质的一级结构与其构象及功能的关系 2. 蛋白质空间橡象与功能活性的关系.
第一章 生命的物质基础 生物体中的有机化合物 上南中学 张正国. 胰岛素 C 3032 H 4816 O 872 N 780 S 8 F e 4 血红蛋白 C 1642 H 2652 O 492 N 420 S 12 牛 奶 乳蛋白 C 6 H.
第四节 RNA 的空间结构与功能. RNA 的种类和功能 核糖体 RNA ( rRNA ):核蛋白体组成成分 转移 RNA ( tRNA ):转运氨基酸 信使 RNA ( mRNA ):蛋白质合成模板 不均一核 RNA ( hnRNA ):成熟 mRNA 的前体 小核 RNA ( snRNA ):
分子生物学部分开发实验 植物遗传亲缘关系研究.
一次数据库的查寻.
计算机科学与生命科学(13)生物信息学基础 2013年秋季学期通选课程 上课时间:周一 18:30点 上课地点:软件园4区502d
计算机网络课程总结 一、计算机网络基础 计算机网络定义和功能、基本组成 OSI/RM参考模型(各层的功能,相关概念, 模型中数据传输 等)
龙星课程—肿瘤生物信息学上机课程 曹莎
第七 章 生物信息学数据库 Bioinformatics database
药物分析 pharmaceutical analysis
第2章 基因和染色体的关系 第1节 减数分裂和受精作用.
2 蛋白质的结构与功能.
The Molecular Structure of Protein
第十一章 蛋白质化学 第一节 蛋白质的生物学意义及其组成 第二节 氨基酸化学 第三节 氨基酸的理化性质 第四节 氨基酸的分离和鉴定
Structure and Function of Biomacromolecule
蛋白质结构的层次 二级结构:α螺旋,β折叠等 超二级结构 结构域(domain) 三级结构:所有原子空间位置 四级结构:多亚基蛋白
生物大分子的计算机模拟.
蛋白质工程的崛起.
生物信息学数据库.
第四节 地域文化与人口 有儿无女不称心,有女无儿就伤心; 一儿一女不放心,多子多女才舒心。 有权的顶着生,有钱的买着生;
第七章 现代教育技术的应用 第一节 现代教育技术与生物学教育 第二节 计算机及其相关技术在生物学 第三节 互联网在生物学教学中的应用
人工智能技术导论 廉师友编著 西安电子科技大学出版社.
多序列比对.
生命的物质基础.
细胞核是遗传信息库.
基因的表达 凌通课件.
1、环境中直接影响生物生活的各种因素叫做 。它可以分为 和 两类 。
(四)蛋白质的二级结构   蛋白质的二级结构(secondary structure)指肽链主链不同区段通过自身的相互作用,形成氢键,沿某一主轴盘旋折叠而形成的局部空间结构,是蛋白质结构的构象单元.主要有以下类型: (1) α-螺旋(α-helix) (2) β-折叠(β-pleated sheet)
第二节 生物信息学及其发展历史.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
生物信息学 Bioinformatics 丁乃峥 山东师范大学生命科学学院
Geophysical Laboratory
ACD/ChemSketch软件在有机化学教学中的简单应用
普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第五章:真核生物基因组的注释.
蛋白质结构分析及三维可视化 以镰刀型红细胞贫血症为例
生物信息学 与 信息技术 张 勤
园林专业本科阶段课程拓扑图:平台期课程 通识 12 数学 14 物理 4 化学 11 英语 6 政治 14
数据挖掘工具性能比较.
生物信息学 第六章 基因预测和基因结构分析 (II).
第8章 遗传密码 8.1 遗传密码的基本特性.
第十一章 动物基因组学 (Animal Genomics).
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
Metabolic biomarker signature to differentiate pancreatic ductal adenocarcinoma from chronic pancreatitis Gut, 2017, Jan (IF=14.921) 汇报人:王宁 IMI CONFIDENTIAL.
C语言程序设计 主讲教师:陆幼利.
人类后基因组时代 (Post-genome era)
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
中国国家标准文献 共享服务平台检索 信息检索与利用 2019/4/29 王婧怡 图书馆615室 科技信息研究所
第二节 DNA分子的结构.
超越自然还是带来毁灭 “人造生命”令全世界不安
名以清修 利以义制 绩以勤勉 汇通天下 新晋商理念 李安平
第一节 土地利用对生态系统的干扰与生态重建.
用计算器开方.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
代谢组学技术及应用新策略简介 代谢组学平台 刘慧颖.
北师大版五年级数学下册 分数乘法(一).
AD相关LncRNA调控及分析方法研究 项目成员:魏晓冉 李铁志 指导教师:张莹 2018年理学院大学生创新创业训练计划项目作品成果展示
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
生物数据库.
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
Ecological Society of America(ESA)
基于列存储的RDF数据管理 朱敏
C++语言程序设计 C++语言程序设计 第一章 C++语言概述 第十一组 C++语言程序设计.
基因信息的传递.
第三节 转录后修饰.
第十七讲 密码执行(1).
第十二讲 密码执行(上).
学习数据结构的意义 (C语言版) 《数据结构》在线开放课程 主讲人:李刚
入侵检测技术 大连理工大学软件学院 毕玲.
Presentation transcript:

第十一章 药物生物信息学基础

第一节 生物信息学概述

生物信息学:生物信息学是一门交叉学科。它包 含了生物信息的获取、管理、分析、解释和应用 在内的所有方面。它综合运用生物学、计算机科 学和数学等多方面知识与方法,来阐明和理解大 量生物数据所包含的生物学意义,并应用于解决 生命科学研究和生物技术相关产业中的各种问 题。

主要任务 生物数据库的设计、建立和优化 从数据库中提取有效信息的算法 为用户设计查询信息的界面 开发数据可视化的有效方法 与多种资源和信息库建立有效连接 开发数据分析的新方法 发展预测的算法

研究内容 核酸及基因组信息 蛋白质及蛋白组信息 分子相互作用及代谢调控网络 生物进化

一级数据库 来源于实验获得的原始数据,只经过简单的归类 整理和注释,如核酸和蛋白质序列数据库、生物 大分子三维结构数据库等。

二级数据库(知识库、专用数据库 ) 是在一级数据库、实验数据和理论分析的基础上针 对特定目标衍生而来,是对生物学知识和信息的进 一步加工、提取、综合形成的知识库。

分子生物信息数据库 基因组与功能基因组 : GDB, ACeDB, SGD, TDB 核酸序列: GenBank, EMBL, DDBJ 基因组与功能基因组 : GDB, ACeDB, SGD, TDB 蛋白质序列 : PIR, TrEMBL, SWISS-PROT 蛋白质结构 : PDB, MMDB, SCOP, CATH 蛋白质组 疾病数据库 代谢组数据库 与药物相关的分子设计数据库 集成数据库检索系统

核酸序列数据库

Genbank 由美国国立生物技术信息中心(NCBI)建立 和维护的。包含了所有已知的核酸序列和蛋白 质序列,以及与它们相关的文献著作和生物学 注释。 NCBI的网址是:http://www.ncbi.nlm.nih.gov。

EMBL 由欧洲生物信息学研究所(EBI)维护的核酸 序列数据构成,查询检索可以通过因特网上的 序列提取系统(SRS)服务完成。 数据库网址是:http://www.ebi.ac.uk/embl/。 SRS的网址是:http://srs.ebi.ac.uk/。

DDBJ 日本DNA数据仓库(DDBJ)也是一个全面的 核酸序列数据库,与Genbank和EMBL核酸库合 作交换数据。使用其主页上提供的SRS工具进 行数据检索和序列分析。 DDBJ的网址是:http://www.ddbj.nig.ac.jp/。

三大核心数据库核酸序列增长

GenBank 使用 GenBank Search (基因序列及其注释资料的提取) BLAST 序列比对

PEDF 基因相关序列及其注释资料的提取举例

基因组与功能基因组数据库 基因组数据库是存储生物整个基因组序列的数据 库,包括模式生物基因组、染色体、基因突变、 遗传疾病、放射杂交、比较基因组、基因调控和 表达、基因图谱等。 基因组数据库多是二级数据库,即从一级数据库 中选出的有关同一物种的核酸信息。

举例:GDB数据库:人类基因组数据库 ACeDB:线虫基因组数据库 SGD:啤酒酵母基因组数据库 TDB:微生物信息库,也包含人、植物、 微生物等的分类信息。

蛋白质序列数据库 PIR是国际上最大的公共蛋白质序列数据库。 PIR提供序列检索标准的序列相似性搜索和蛋白 质家族信息的高级搜索。 http://pir.georgetown.edu/。

SWISS-PROT 由欧洲生物信息学研究所(EBI)维护。数据库 包含蛋白质序列、分类学信息、功能、位点、 结构、相似性、残缺与疾病的关系等信息。 SWISS-PROT的网址是: http://www.ebi.ac.uk/swissprot/。 TrEMBL数据库 网址是:http://www.ebi.ac.uk/uniprot。

序列分析 序列比对和相似性搜索 核酸序列分析 蛋白质序列分析

BLAST Basic Local Alignment Search Tool 基于局部的比对搜索工具 原理:待检片段 已知片段 高分值片段 比对结果 两端延伸 计算匹配程度 高分值片段 阈值 动态规划法

序列比对和相似性搜索 两两序列比对 双序列比对 多序列比对

核酸序列分析 启动子的识别和分析 开放阅读框的识别和分析 内含子 / 外显子的识别和分析 限制性酶切位点的识别和分析 对CpG岛的识别和分析 对重复序列的识别和分析

蛋白质序列分析 蛋白质基本性质分析: 蛋白质的分子量和等电点 蛋白质的疏水性分析 蛋白质酶切位点的分析 蛋白质辨识 组成的蛋白质辨识 蛋白质的质谱分析 2D-PAGE

跨膜蛋白的跨膜区分析 信号肽的分析 卷曲螺旋结构区的分析

第二节 生物信息学在药学中的应用

蛋白类结构预测和模拟 蛋白质结构预测的一般流程: 序列比对 二级结构预测 三级结构预测 蛋白质结构建模 蛋白质结构预测的检验

蛋白质结构预测的方法 理论分析法或从头算法(Ab initio) 统计分析法

理论分析法或从头算法(Ab initio) 计算分子力学,分子动力学等的理论参数 假设折叠后蛋白质取能量最低 无同源蛋白质时方用

统计分析法 统计分析已知结构的蛋白质 建立映射模型 蛋白质结构预测 氨基酸序列

蛋白质二级结构的预测 二级结构:肽链的局部主链骨架原子的空间结构 形式:α-螺旋 β-折叠 β-转角 无规卷曲

α-螺旋 右手螺旋 肽链内氢键维持稳定 侧链伸向外侧

β-折叠 呈折线状 肽链平行排列 肽链间氢键维持稳定

β-转角 肽链180度回折 以远距离力维持

蛋白质二级结构的预测 基础:每一段相邻的氨基酸残基具有形成一定 二级结构的倾向 核心问题:模式的识别与分类 目标:二级态的判断

蛋白质二级结构的预测 统计-经验法 基于单个氨基酸的统计分析:Chou-Fasman法 基于氨基酸片段的统计分析:基于信息论的GOR 方法或最邻近法 物理-化学方法 机器学习方法 致力于前两种方法的优点的结合,如人工神经网 络法

蛋白质二级结构的预测 人工神经网络法 输入层:接受蛋白质序列数据 隐含层:信息处理 输出层:输出蛋白质二级结构

蛋白质二级结构的预测 人工神经网络法 PHDsec 同源序列的多重比对排列 进行从序列到结构的映射 进行从结构到结构的映射 二级结构预测结果

蛋白质二级结构的预测 人工神经网络法 PHDsec 有自我学习能力 结合其他方法预测的准确度可达到80% 进化信息、长程作用信息和全局信息的 利用还不完全

蛋白质三级结构的预测 三级结构:整条肽链所有原子的三维空间排布 位置 维持力:次级键 结构域:三级结构中折叠较为紧密具有功能的 区域

肌红蛋白三级结构

蛋白质三级结构的预测方法 同源模建 折叠模式识别 从头预测

同源建模 数据库搜索及模板的选择 序列比对 确定结构保守区 构建目标蛋白质的主链 构建目标蛋白质的侧链 优化模型

目标蛋白与模板同源性 >60%:预测结果可以 完全准确 20%~25%:预测结果 准确性很低 < 20%:无法作出预测

折叠模式识别 找到同一家族的远程同源蛋白质:预测结果 比较好 找到非同一家族的远程同源蛋白质:预测结 果难以保证 找到同一家族的远程同源蛋白质的可能性只 有40%左右

从头预测 基于蛋白质天然结构是能量最小的构象原 理,将蛋白质的残基作为最基本单元,进行蒙 特卡罗模拟、模拟退火或遗传算法优化,计算 出蛋白质肽链所有可能构象的能量,从中取出 能量最小的构象就是蛋白质的天然构象。

药物靶标的发现 药物发现的主要方式是进行药物设计和筛选,特 别是围绕药物作用的靶点进行 药物作用靶点:指具有重要生理或病理功能,能 够与药物相结合并产生药理作用的生物大分子及 其特定的结构位点。 生物大分子主要是蛋白质,也有一些是核苷酸及 其他物质 全世界治疗药物的作用生物靶标分子约有500个, 而预测的可能靶点为5 000~10 000种

计算机辅助药物设计 直接药物设计方法 数据库搜寻方法 全新药物设计 间接药物设计 定量构效关系 药效基团模型