第七章 -2 蛋白质结构预测 主讲人:孙 啸 制作人: 刘志华 东南大学 吴健雄实验室. 结构预测流程 Protein sequence Database similarity search Does sequence align with protein of known 3D structure?

Slides:



Advertisements
Similar presentations
營養午餐 嘉大附小四年二班. 形容詞豐富 鍋燒烏龍麵裡有很多料,有細細長長的麵、翠 綠的青菜、像雨傘的香菇、紅紅的蘿蔔和像圓 月的丸子。每次去盛鍋燒烏龍麵時,我都會聞 到香噴噴的味道,讓我好餓,似乎可以吃下一 頭牛。吃下第一口時,有彈牙的麵、鮮甜的青 菜、 QQ 的香菇、軟軟的丸子,還有脆脆的紅 蘿蔔。每當我吃完第一碗,就還想吃第二碗,
Advertisements

项目四 网店推广与营销 4.1 店内推广与营销. 教学目的: 通过本节内容的学习,帮助学生了解消费者保障服务分类,理解店内活动是运 营店铺时不可缺少的一些营销活动。 知识要求: 1. 了解申请加入消费者保障服务项目的条件 2. 了解店内活动如满就送、限时打折、搭配套餐、优惠券的设置 技能目标: 1.
广西 2014 年 “ 区培计划 ” 学前教育远程培 训 总结简报 南宁马山县幼教 1 班 莫毅.
中职教师省级网络培训 使用说明 南京中华中等专业学校教研处 平台登陆 登录 (江苏教师教育) 在页面右侧找到登录框,填写用户名、密码进入系统.
教师成绩录入步骤 1. 登录教务系统 2. 进入教师成绩管理界面 3. 选择相应的教学班,点击 “ 课程成绩录 入 ” 进入成绩录入界面 4. 点击 “ 设置 ” 按钮设置 “ 成绩分项 ” 5. 录入成绩, “ 保存成绩 ” 按钮可以保存成 绩但不提交(提交后不能再修改成绩) 6. “ 提交成绩 ”
“ 税融通 ” 业务简要介绍. + 一、什么是 “ 税融通 ” ? + “ 税融通 ” 是指银行金融机构根据中小微企业 纳税情况,向依法诚信的中小微企业提供 一定数额的信用贷款或担保贷款的金融产 品。
7.2 图示化记忆 记忆的概述 图示化记忆 联想记忆法 奇特联想记忆法 用手记忆.
学年 江西省教师全员远程培训指南. 培训学习及考核时间安排 学习时间: 2013 年 10 月 年 1 月 15 日 考核时间: 2014 年 3 月 1 日 年 3 月 30 日.
-- 八 (19) 班第二学期期中家长会 、关于期中考试 2 、关于班级常规活动 3 、关于会考、体育 4 、关于自主招生 5 、给家长的一些建议.
手动换页 域外风情系列 儿子去美国留学,毕业后定居美国。还给我找了 个洋媳妇苏珊。如今,小孙子托比已经 3 岁了。 今年夏天,儿子为我申请了探亲签证。在美国待 了三个月,洋媳妇苏珊教育孩子的方法,令我这 个中国婆婆大开眼界。
山东理工大学成人高等教育 新生入学指南. 如何获悉学院的通知公告等? 1. 网站。所有的通知公告等都通过远程与继 续教育学院网站 发布, 同学们应每周登录 “ 学生工作室 ” 或 “ 函授教育 ” 关注是否有新的通知公告。
此时此刻,我还是爱你?还是不爱? 我想,我不爱你了! 因为我累了, 我爱得累了 …………. 你的好对于我来说 像是一种无形的压力 每次你对我好 我都觉得好难承受 你越是对我好 我就越怕你 总是想逃避。
财务处目前共有 50 人,其中事业编 32 人,非事业编 18 人。分为 6 个科室,分别是会计核算科、资金结算中心、综合管理科、预算管理科、 基建财务科和一卡通中心。 会计核算科主要业务为收入入账、费用报销审核等。 资金结算中心主要业务为资金收付、开具发票、学费管理。 综合管理科主要业务是工资及住房公积金管理、税务管理、收费项目.
心理咨询师的个人品牌建设 徐钧 南嘉心理咨询师部落(俱乐部) 申请 QQ 酒香还怕巷子深 你需要一个 “ 个人品牌 ” 以让别人知道你 你是谁? 你的目标是什么? 你要成为什么样的人? 你能做什么? 你会怎样做? 怎么与你有效沟通?
房地产法 主讲教师:龙慧峰 QQ: 电话: 法律实质上既是物质的又是意识形态的这一 事实是与以下事实相联系的:法律既是从 整个社会的结构和习惯自上而下发展而来, 又是从社会中的统治阶级们的政策和价值 中自上而下移动。 —— 【美】伯尔曼《法律与革命》
某中学一青少年因迷上网络游戏,视力由1. 2下降到0
99學年度第1學期導師輔導工作座談會 全校性共同必修服務學習課程 報告單位:學務處領導知能與服務學習中心.
加强工作室资源建设 提升网络辐射影响力 林月周工作室
和合共美,同修共进 ——工作室三年感言 何伟俊
凉山州2011级一诊考试情况分析 暨后期复习建议 四川省凉山州教育科学研究所 谌业锋.
发挥学科优势 打造“互联网+”党建工作模式
《凉山州中长期教育改革和发展规划纲要》( 年)解读 (讲座幻灯课件请在网上下载,让我们一起思考!)
坚持群众路线 做到“三严三实” 内蒙古直属机关工委党校 裴聚斌 电话:
新所得税申报表如何填写 注册税务师 注册会计师 高级会计师 注册资产评估师 注册土地估价师 注册房地产估价师 主讲人:林溪发
校园法治网 ◎传播校园法制文明 ◎营造校园法治环境
人类行为的起源 康复医学系 王海成 医学教授 精神科主任医师 QQ: 手机:
我的未来,我做主之 坚持不懈,直到成功。 电话: QQ: 时间:2013年5月27日 肖亚平.
(讲座幻灯课件请在网上下载,让我们一起思考!)
自读高晓声的小说 《陈奂生上城》 写一篇800以上的感悟文章.
高考成功心理 平凉一中 刘雅娟.
2012江西(九江吉安)事业单位 公共基础知识 备考指导 主讲:罗红军 qq: 新浪微博:罗红军的微博
运筹帷幄 决胜高考 应怎样去做? 湖北黄冈中学 余利平 QQ:
幼儿园环境创设 成智客服QQ:
小学科学中的化学 武威十九中 刘玉香.
工作中的九型人格 主讲嘉宾:梁旭 ---九型人格应用系列课程 介绍自己 有多少听过九型 课程纪律 课程时间 工作中的九型人格
客 家 仙 草 台北縣中和市秀山國民小學 五 年 十 班 王 靖 婷.
神州五号、六号的发射和回收都取得了成功 ,圆了几代中国人的航天梦,让全中国人为之骄傲和自豪 神州五号、六号的发射和回收都取得了成功 ,圆了几代中国人的航天梦,让全中国人为之骄傲和自豪!但是你们知道我们的科学家是怎样迅速地找到返回舱着陆的位置的吗? 这全依赖于GPS——卫星全球定位系统”。大家一定觉得很神奇吧!学习了今天的内容,你就会明白其中的奥妙。
上海培训班交流材料 顶岗实习考核评价体系研究 辽宁建筑职业技术学院  孙玉红 2010年6月.
计算机基础知识 陈嘉明 玉溪农业职业技术学院.
凝心聚力 弘扬宣传思想工作正能量 ——2015年工委宣传部上半年工作总结.
(讲座幻灯课件请在网上下载,让我们一起思考!)
第四章 账户及复式记账的应用 教学目的与要求:本章内容属于会计实务部分。通过本章的教学,使学生掌握制造企业经济业务的核算内容及账务处理,进一步加深对复式记账原理的理解,熟练掌握借贷记账法在制造企业的实际应用。 教学重点:运用借贷记账法对制造企业的经济业务进行账务处理。 教学难点:利润的核算;期末各账户之间的相互结转。
北京中医药大学东直门医院 把握“癌”的命脉 祁烁 血液肿瘤科.
让爱住紫荆 教师师德培训.
交易早餐-金融品 2017年3月11日 徽商期货研究所.
2007年房地产建筑安装企业 税收自查方略 河北省地方税务局稽查局 杨文国.
(讲座幻灯课件请在网上下载,让我们一起思考!)
凉山州2012级一诊考试情况分析会.
系統分析與設計 系級:資管三B 姓名:朱秋儒 學號:
(讲座幻灯课件请在网上下载,让我们一起思考!)
毕业留念册.
(讲座幻灯课件请在网上下载,让我们一起思考!)
凉山州2008级高考情况分析 暨2009届高三复习建议 ——兼谈高考学生的心理指导.
(讲座幻灯课件请在网上下载,让我们一起思考!)
教师:李永亮 QQ: Virtools虚拟交互设计 教师:李永亮 QQ:
一言之辩强于九鼎之宝 三寸之舌胜于百万雄师
(讲座幻灯课件请在网上下载,让我们一起思考!)
人类传播的活动 和历史.
腾讯企业QQ 能为客户解决问题. 腾讯企业QQ 能为客户解决问题 企业QQ可以 获知访客来源 可以细致的知道网站访客第几次到来,通过什么途径到来,正在浏览哪些网页等相关信息为企业日后做推广,提供一个真实可靠的数据。
——郑州市九年级语文期中考试圈题(8)——语句衔接
破茧成蝶 ——如皋14班研修总结篇 主编:冒碧云 审稿:郝 霞.
给学生一个心灵的支点 高慧明 ——高慧明班级高效管理艺术 北京市第十二中学高中部 电话: QQ:
(讲座幻灯课件请在网上下载,让我们一起思考!)
(讲座幻灯课件请在网上下载,让我们一起思考!)
规范教学,提升质量,迎接评估 ——学校教学管理制度解读
選擇勞退新制,終身免煩惱 勞工退休金新制 說明會.
設計者:台中市重慶國小 張祐榕.楊晟汶.張儷齡
2.1 试验: 探究小车速度随时间变化的规律.
績優教師分享 美容保健科 林品瑄 教師.
Presentation transcript:

第七章 -2 蛋白质结构预测 主讲人:孙 啸 制作人: 刘志华 东南大学 吴健雄实验室

结构预测流程 Protein sequence Database similarity search Does sequence align with protein of known 3D structure? Protein family, domain, cluster analysis Relation- ship to known structure? Structural analysis 3D comparative modeling Predicted three dimensional structure Is there a predicted structure? 3D analysis in laboratory yes no

第四节 蛋白质三维结构预测 1 、同源模型化方法  主要思想: 对于一个未知结构的蛋白质,找到一个已知结构的同源 蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白 质建立结构模型。  依据: 任何一对蛋白质,如果两者的序列等同部分超过 30% , 则它们具有相似的三维结构,即两个蛋白质的基本折叠 相同,只是在非螺旋和非折叠区域的一些细节部分有所 不同。

 假设待预测三维结构的目标蛋白质为 U ( Unknown ),利用同源模型化方法建立结 构模型的过程包括下述 6 个步骤: ( 1 )搜索结构模型的模板 (T) ( 2 )序列比对 ( 3 )建立骨架 ( 4 )构建目标蛋白质的侧链 ( 5 )构建目标蛋白质的环区 ( 6 )优化模型 U  T

构建目标蛋白质的侧链

预测结果准确率:  对于具有 60% 等同的序列,用上述方法所建 立的三维模型非常准确。若序列的等同部分 超过 60% ,则预测结果将接近于实验得到的 测试结果。  一般如果序列的等同部分大于 30% ,则可以 期望得到比较好的预测结果。

2 、线索化方法(折叠识别方法)  有很多蛋白质具有相似的空间结构,但它们 的序列等同部分小于 25% ,即远程同源。  对于这类蛋白质,很难通过序列比对找出它 们之间的关系,必须设计新的分析方法。

 对于一个未知结构的蛋白质( U ), 如果找到一个已知结构的远程同源蛋白质 ( T ), 那么可以根据 T 的结构模板通过远程同源模型 化方法建立 U 的三维结构模型。 U  T (远程同源)

一个远程同源模型化方法要解决三个问题: ( 1 )检测远程同源蛋白质( T ); ( 2 ) U 和 T 的序列必须被正确地对比排列; ( 3 )修改一般的同源模型化过程,以应用于相似度 非常低的情况,即处理更多的环区,建立合理的三 维结构模型。 如何解决第一个和第二个问题?  基本思想是建立一个从 U 到已知结构 T 的线索,并通 过一些基于环境或基于知识的势,评价序列与结构 的适应性。 至于最后建立三维结构模型则是非常困难的 序列 → 结构比对

 线索化的主要思想: 利用氨基酸的结构倾向(如形成二级结构 的倾向、疏水性、极性等),评价一个序 列所对应的结构是否能够适配到一个给定 的结构环境中。

 建立序列到结构的线索的过程称为线索化, 线索技术又称折叠识别技术。  线索化或者折叠识别的目标是为目标蛋白质 U 寻找合适的蛋白质模板,这些模板蛋白质 与 U 没有显著的序列相似性,但却是远程同 源的。

 线索化方法一般有 5 个基本组成部分: ( 1 )已知三维折叠结构的数据库; ( 2 )一种适合于进行序列 - 结构比对的三维折 叠信息的表示方法; ( 3 )一个序列 - 结构匹配函数,该函数对匹配 程度进行打分; ( 4 )建立最优线索的策略,或者是进行序列 - 结构比对的策略; ( 5 )一种评价序列 - 结构比对显著性的方法。

假设存在有限数目的核心折叠( core folds )  核心折叠实际上是构成蛋白质空间形状的基 本模式。  建立核心折叠数据库  预测 ---- 建立线索 U 序列 与数据库核 心折叠比对 取最佳核 心折叠 U 结构模型

 一种基于序列与结构比对的最优线索化算法 令 : s 1, s 2,…, s n 为蛋白质序列 S 的 n 个元素 C 1, C 2,…, C m 为数据库中核心折叠 C 的 m 个核心区域 C ij 为第 i 个核心区域第 j 个氨基酸位置 每一个核心区域由若干个氨基酸残基构成

 设 t 是一个从序列到核心折叠的线索,那么 t 说明了序列 S 的哪些元素 s i,s j,s k,… 代表核心 区域 C 1, C 2, C 3,… 的起始位置。 这实际上是一种从序列 S 到核心折叠 C 的比对  令 代表核心折叠 C 中的环到序列 S 中空位的 映射,显然 是通过线索化而确定的。

令 f(t) 是进行比对的得分函数,其定义如下: f(t) = g 1 (v,t) + g 2 (u,v,t) + g 3 (,t)  g 1 (v,t) 评价氨基酸残基 v 所处的位置  g 2 (u,v,t) 评价残基 u 和 v 的相对位置,如果 u 和 v 键合,则得 分高;  g 3 (,t) 评价环区,根据环区的大小进行打分。 线索化问题: 对于给定的序列 S 和核心折叠 C ,选择一个线索 t ,使得 f(t) 的 值最小,即寻找一个从 S 到 C 的最佳映射。

3 、从头预测方法  在既没有已知结构的同源蛋白质、也没有已 知结构的远程同源蛋白质的情况下,上述两 种蛋白质结构预测的方法都不能用,这时只 能采用从头预测方法,即(直接)仅仅根据 序列本身来预测其结构。

 从头预测方法一般由下列 3 个部分组成: ( 1 )一种蛋白质几何的表示方法 由于表示和处理所有原子和溶剂环境的计算开销非 常大,因此需要对蛋白质和溶剂的表示形式作近似 处理。 ( 2 )一种势函数及其参数 通过对已知结构的蛋白质进行统计分析确定势函数 中的各个参数 ( 3 )一种构象空间搜索技术 构象空间搜索和势函数的建立是从头预测方法的关 键

N 端的氨基酸位于坐标系统的原点 第二个氨基酸位于坐标的( 1,0 )或( 1 , 0 , 0 )处。 H-P 模型 -[ 疏水 (hydrophobic)- 极性 (polar)]

基于疏水残基之间的接触进行打分 每一个 H 和 H 的接触(非相邻残基)对能量的贡献都为- 1 最优的构象就是所有可能的构象中具有最多 H 和 H 接触的那个构象 图中的二维和三维构象的得分都是- 3

绝对方向表示法 : 每一个位置上可选择的方向 : 上、右、左和下( U 、 R 、 L 、 D ); 而对于三维模型 : 上、右、左、下、后和前( U 、 R 、 L 、 D 、 B 、 F )。 构象空间搜索 (R,R,D,L,D,L,U,L,U,U,R) (R,B,U,F,L,U,R,B,L,L,F)(R,R,D,L,D,L,U,L,U,U,R) (R,B,U,F,L,U,R,B,L,L,F)

相对方向表示法: 利用每个氨基酸残基主链的转动方向来表示 每个位置上的残基的方向二维网格模型: 每个残基位置上可选择的方向有三个 左、右和前( L 、 R 和 F ) 三维网格模型: 左、右、前、上和下 ( L 、 R 、 F 、 U 、 D )

能量函数和优化 需要考虑的相互作用 疏水作用 氢键 二硫桥 静电作用 范德华力 溶剂作用

 分子力学方法 —— 假设正确的蛋白质折叠对应于最低能量的构象 分子力学势能是原子坐标的函数 势能函数由多项组成 成键作用: 化学键的伸缩能(键长) 弯曲能(键角) 扭转能(二面角) 非成键作用: 范德华力 静电力 氢键 分子力学中的势能参数的来源 从头算( ab initio )和半经验计算结果 氨基酸和小分子的实验观察结果

 能量优化方法 : 梯度下降法 最陡下降法 共轭梯度法 牛顿 - 拉普森方法

 分子动力学  蒙特卡罗方法  模拟退火方法  遗传算法

 基于势函数或者力场的结构预测方法在实际 应用中存在许多问题,主要原因 : 我们还没有完全了解究竟是哪些力决定了蛋白质 的折叠过程,同时这些力之间又是如何相互作用 的 力场参数不精确,没有对溶剂处理的好方法 构象搜索过程容易陷入局部能量极小点 自然折叠的蛋白质结构与一般蛋白质构象之间的 能量差比较小 研究蛋白质折叠的计算量非常大

4 、预测方法评价  对各种方法所得到的蛋白质结构预测结果需要进行验证, 以确定预测方法是否可行,确定其适应面。  验证的一种方法是取已知结构的蛋白质,对这些蛋白质进 行模拟结构预测,并将预测结构与真实结构进行比较,分 析两者之间的差距。  权威的评判机构,建立公共认可的蛋白质结构测试数据集。 设立在马里兰生物技术研究中心的 CASP 就是这样一个系统 ( )

第五节 蛋白质空间结构比较  结构域  对蛋白质进行序列比较,可以发现同源序列的保守区域。 但是对于结构域,通过序列比较,我们只能得到一部分 信息。  如果在结构这个层次上进行比较,可以发现更多的信息。  蛋白质的结构比序列更加保守,通过比较蛋白质的空间结 构,可以发现属于同一家族蛋白质的保守结构,可以发现 特定的空间结构模式。  这些模式由多个不相邻的序列片段组成,经过蛋白质折叠 以后,这些一维不相邻的元素在三维空间中结合到一起, 形成特定的功能位点,如酶的活性部位,蛋白质结合部位 等。

 蛋白质结构比较有两个主要的任务: 检测蛋白质的结构特征 在已知两个蛋白质对应结构特征的条件下,寻 找将两个蛋白质空间结构重叠的几何变换,进 行三维结构的比对( alignment )。

 如果用数学语言来描述,就是给定两个三维点集 P={p i } 和 Q={q i } ( i=1,2,…,n ),寻找一个空间变换矩阵 T ,使得 最小,即:  这个问题可以用最小二乘法解决

空间点三元组几何变换 目标: 寻找两个蛋白质空间点三元组重叠最多的几何变换。

解决这个问题的直接算法是如下: ( 1 )对于每一对空间点三元组(分别来自 不同的蛋白质),计算能使这两个对象重叠 的几何变换; ( 2 )统计在各种变换中,能够同时重叠、 或者基本重叠的空间点三元组个数,并作为 对应变换的得分; ( 3 )选择得分比较高的变换,改进这些变 换,使其得分进一步提高。

 基于几何哈希( geometric hashing )技术的三维 结构比对方法

 将目标分子与数据库中模型分子匹配  数据库中的模型分子是预先建立的。对于每个模型 分子,按照下述步骤进行预处理: ( 1 )挑选参考框架,即挑选模型分子中非共线的三 个点; ( 2 )计算参考框架的三维正交基及其形状特征(例 如,三角形边的长度); ( 3 )计算参考框架一定范围内所有其它点的坐标; ( 4 )以每个坐标作为哈希查找表的地址,在哈希表 相应的位置存贮蛋白质的有关信息,如蛋白质的标 识符,参考文献、形状特征等; ( 5 )对于每个参考框架(模型分子中非共线的三个 点)重复上述过程。

识别阶段 利用前面预处理所得到的哈希表进行识别,过程如下:  对于每个目标分子的参考框架,计算参考框架的三 维正交基及其形状特征,计算参考框架内其它点的 坐标,将每个坐标作为哈希查找表的地址,在哈希 表相应的位置取出有关的信息,找出形状特征匹配 的记录,然后针对那些匹配好的记录计算相应的空 间变换,保存匹配的点。  计算不同空间变换下匹配点对的个数,形成匹配表。 选择匹配点对多的匹配表作为进一步匹配的出发点, 这样的匹配表中所包含的匹配又称为 “ 种子匹配 ” 。 其基本思路与序列快速比较算法 BLAST 相似。