牛全基因组预测转录因子 数据库构建及分析 导 师: 张勤教授 研究生: 王志鹏 August, 2008.

Slides:



Advertisements
Similar presentations
1/67 美和科技大學 美和科技大學 社會工作系 社會工作系. 2/67 社工系基礎學程規劃 ( 四技 ) 一上一下二上二下三上 校訂必修校訂必修 英文 I 中文閱讀與寫作 I 計算機概論 I 體育 服務與學習教育 I 英文 II 中文閱讀與寫作 II 計算機概論 II 體育 服務與學習教育 II.
Advertisements

§ 3 格林公式 · 曲线积分 与路线的无关性 在计算定积分时, 牛顿 - 莱布尼茨公式反映 了区间上的定积分与其端点上的原函数值之 间的联系 ; 本节中的格林公式则反映了平面 区域上的二重积分与其边界上的第二型曲线 积分之间的联系. 一、格林公式 二、曲线积分与路线的无关性.
公司為社團法人 股東之人數 林宜慧 陳冠蓉. 公司之意義  根據公司法第一條規定 : 「本法所 稱公司,謂以營利為目的,依照 本法組織、登記、成立之社團法 人。」
專業科目必修 管理學概論、化 妝品行銷與管理、 專題討論、藥妝 品學、流行設計、 專題講座、時尚 創意造型與實務 專業科目必修 化妝品法規、生 理學、化妝品原 料學、化妝品有 效性評估、時尚 化妝品調製與實 務、藝術指甲、 生物化學概論、 美容經絡學、校 外實習 專業科目必修 應用色彩學、化 妝品概論、時尚.
截肢的作业治疗 Amputation 李福胜 主讲. 第一节 概 述 一、定义: 是将没有生命、丧失功能或因 局部疾病严重威胁生命的肢体截 除的手术。 分类: 截骨:将肢体截除 关节离断:从关节分离.
聖若翰天主教小學 聖若翰天主教小學歡迎各位家長蒞臨 自行分配中一學位家長會 自行分配中一學位家長會.
認識食品標示 東吳大學衛生保健組製作.
第二十三章 皮肤附属器疾病 主讲 朱姗姗.
地方自治團體之意義與組織 范文清 SS 2011.
高中思想政治课程标准的追求 江苏省教研室 鞠文灿.
手术切口的分级与抗菌药物的应用 贵阳医学院附属白云医院感染管理科 沈 锋
颞下颌关节常见病.
「健康飲食在校園」運動 2008小學校長高峰會 講題:健康飲食政策個案分享 講者:啟基學校-莫鳳儀校長 日期:二零零八年五月六日(星期二)
授課教師:國立臺灣大學 法律學系 許宗力 教授
清代章回小說----儒林外史 製作群:侑桂、品希、萱容、怡靜、佩涓、凸凸.
致理科技大學保險金融管理系 實習月開幕暨頒獎典禮
☆ 104學年度第1學期 活動藏寶圖 ☆ II III IV V 找到心方向-談壓力調適 陳佩雯諮商心理師
脊柱损伤固定搬运术 无锡市急救中心 林长春.
行政訴訟法 李仁淼 教授.
第一节 工业的区位选择 一、工业的主要区位因素 1、工业区位选择应注意的问题 2、影响工业布局的主要区位因素 3、不同工业部门的区位选择
門神 在傳統觀念中,門是居住環境中與外界相通的出入口,具有重要的屏障作用。門神顧名思義就是護宅守門的神仙,每逢過年,上至天子百官下至普通百姓,家家戶戶必在門上張貼門神,以保一家平安。 門神種類主要有宅第大門上將軍武門神、內室門戶上祈福文門神,還有童子門神、仙子門神等,形象豐富多樣,皇家貴戚還往往在畫上瀝粉貼金,十分吉祥喜慶。
XXX分析室组长竞聘 演讲人: XXX
結腸直腸腫瘤的認知.
經歷復活的愛 約翰福音廿一1-23.
幼兒社會發展與活動設計.
大学英语教学在学分制教学的比重 类别 文科 理科 大学英语 《课程要求》 总学时 周学时 总学分
郭詩韻老師 (浸信會呂明才小學音樂科科主任)
第8章 政府的財政預算.
I.禱告先來親近神─ 我們在天上的父 1.敬拜讚美 2.認罪
《政府采购非招标采购方式管理办法》的理解与适用
新高中中國語文課程學與教系列(10)── 自擬單元﹕中文傳意及應用 校本經驗分享
務要火熱服事主.
通識教育科 單元三 現代中國 主題1:中國的改革開放 課題(四)︰ 中國的綜合國力及外交
生物科簡報 主題: ※生長與發育※ 基因與遺傅※.
作业现场违章分析.
蒙福夫妻相处之道 经文:弗5:21-33.
基于课程标准的教学与评价: 政策执行讲评与后续要求
2. 戰後的經濟重建與復興 A. 經濟重建的步驟與措施 1.
孝敬父母长辈.
好好學習 標點符號 (一) 保良局朱正賢小學上午校.
中国注册会计师协会财务报表审计工作底稿研讨班
第三章 我們如何利用時間— 日常生活的韻律.
快遞貨物常見之偽禁藥簡介與 通關注意事項 報告人:臺北關快遞機放組快遞一課 于志安 1.
4. 聯合國在解決國際衝突中扮演的角色 C. 聯合國解決國際衝突的個案研究.
6.5滑坡 一、概述 1.什么是滑坡? 是斜坡的土体或岩体在重力作用下失去原有的稳定状态,沿着斜坡内某些滑动面(滑动带)作整体向下滑动的现象。
行政處分6 – 行政執行 范文清 SS 2011.
新陸書局股份有限公司 發行 第十九章 稅捐稽徵法 稅務法規-理論與應用 楊葉承、宋秀玲編著 稅捐稽徵程序.
品管圈隊呼 喜樂喜樂點子多 個個快樂又活潑 喜樂裡面通通有 品管圈裡搶鋒頭 喜樂 - - 氧樂多 喜樂 - - 健康多
舊制勞退準備金提繳與集體勞動權行使 明理法律事務所 李瑞敏律師 明理法律事務所 1 1.
破漏的囊袋.
民法第四章:權利主體 法人 楊智傑.
五、受体蛋白病 家族性高胆固醇血症(FH)
四年級 中 文 科.
第3.4节 距离保护的整定计算 及其评价.
生鲜谈判.
音樂與節日 —感恩節 3A(12) 李嘉雯.
聖本篤堂 主日三分鐘 天主教教理重温 (94) (此簡報由聖本篤堂培育組製作).
聖公會聖匠堂長者地區中心 長者支援服務隊 香港房屋協會 家維邨義工隊
安慰能力測試 我感到非常孤單 為何要這麼痛苦?做人毫無價值,活著根本沒有意思。 我拖累了你。 假如我不在,情況會如何呢?
聖誕禮物 歌羅西書 2:6-7.
「傳心傳意 2003」 工商機構創意義工服務計劃比賽 計劃主題 : ( I ) 減少廢物 ( II ) 節省能源 ( III ) 愛護大自然
舊制勞退準備金提繳與集體勞動權行使 明理法律事務所 李瑞敏律師 明理法律事務所 1 1.
圣依纳爵堂 主日三分钟 天主教教理重温 (95) (此简报由香港圣本笃堂培育组制作).
依撒意亞先知書 第一依撒意亞 公元前 740 – 700 (1 – 39 章) 天主是宇宙主宰,揀選以民立約,可惜他們犯罪遭
富麗宮全副武裝. 富麗宮全副武裝 屈辱谷大戰魔王 5 靠著聖靈 禱告祈求
基督是更美的祭物 希伯來書 9:1-10:18.
明愛屯門馬登基金中學 中國語文及文化科 下一頁.
經文 : 創世紀一章1~2,26~28 創世紀二章7,三章6~9 主講 : 周淑慧牧師
圣经概論 09.
Presentation transcript:

牛全基因组预测转录因子 数据库构建及分析 导 师: 张勤教授 研究生: 王志鹏 August, 2008

概要 研究背景 材料与方法 数据库构建与网页 结果与讨论

转录因子 定义: 结构特点: 顺式作用元件与反式作用因子 能够结合在某基因上游特异核苷酸序列上从而调控其基因转录的一类蛋白质。 存在结构域和功能域 结构域(DBD) :与DNA结合的具有特异性 结构模式:锌指,亮氨酸拉链, 螺旋-转角-螺旋, 螺旋-环-螺旋 … … 顺式作用元件与反式作用因子

真核生物转录因子 物种 #转录因子 物种 #转录因子 人 1790 拟南芥 1953 猩猩 242 水稻 400 鼠 1305 小麦 97 物种 #转录因子 物种 #转录因子 人 1790 拟南芥 1953 猩猩 242 水稻 400 鼠 1305 小麦 97 鸭嘴兽 139 玉米 37 鸡 585 番茄 29 斑马鱼 874 绿藻 90 果蝇 586 红藻 10 线虫 635 酵母 322 --收集于NCBI

原核生物转录因子 古细菌物种 #转录因子 细菌物种 #转录因子 暖枝菌 8 紫色光合细菌 20 热变形菌 9 具核梭杆菌 2 暖枝菌 8 紫色光合细菌 20 热变形菌 9 具核梭杆菌 2 常温泉古菌 15 乳酸球菌 1 嗜热菌 7 发光杆菌 7 超嗜熱菌 6 双叉杆菌 7 嗜盐杆菌 39 抗辐射细菌 17 古细菌 503 细菌 332 古细菌物种 #转录因子 细菌物种 #转录因子 --收集于NCBI

转录因子所占比例 --J. L. Riechmann 2000 science.

生物进化历史 --J. L. Riechmann 2000 science.

转录因子存在的特性 1. 转录因子存在的普适性 2. 物种间的差异性 3. 与进化历史有一定关系

转录因子的作用 基因调控特别针对真核生物的多级调控结构 基因调控网络 辅助基因网络的推断

已有转录因子数据库

http://www. gene-regulation. com/cgi-bin/pub/databases/transfac/search http://www.gene-regulation.com/cgi-bin/pub/databases/transfac/search.cgi

http://dbd.mrc-lmb.cam.ac.uk/DBD/index.cgi?About

http://bioinformatics.zj.cn/archaeatf/Homepage.php

http://planttfdb.cbi.pku.edu.cn/

http://dbtbs.hgc.jp/

http://regulondb.ccg.unam.mx/

http://flybase.bio.indiana.edu/

http://genome.gsc.riken.jp/TFdb/

http://arabidopsis.med.ohio-state.edu/

http://drtf.cbi.pku.edu.cn/

已有转录因子数据库

农场生物转录因子 物种 #转录因子 猪 94 马 156 牛 634 羊 17 鸡 585 狗 215 猫 5 水稻 400 小麦 97 猪 94 马 156 牛 634 羊 17 鸡 585 狗 215 猫 5 水稻 400 小麦 97 玉米 37 物种 #转录因子 --收集于NCBI

牛转录因子 关注于模式生物 NCBI~634 编码转录因子的基因 TRANSFAC ~10 编码转录因子的基因 ~ 16 转录因子调控的基因 DBD ~ 2333 预测转录因子 (无注释)

目 的 全基因组范围完整注释的 牛转录因子库

概要 背景知识 材料与方法 数据库构建与网页 结果与讨论

实现步骤 数据的收集 转录因子的识别 预测转录因子的注释 预测转录因子的展示

技术路线 注 释 本地 BLAST 转录因子功能注释 QTL区域信息 信息整合 基因注释 转录因子物理位置注释 基本信息 生物功能信息 注 释 基因组,蛋白质组数据 蛋白质二级结构 模型集 ( Pfam &SuperFamily) 预测转录因子集 HMMER 程序 已知转录因子集合

数据收集 牛全基因组序列3.1版本 。( ENSEMBLE ) 收集牛已知蛋白质序列2.7万条。(ENSEMBLE) 获得由GENESCAN 预测蛋白质5.6万条。 与转录因子相关的基因信息4357条, 转录信息4933条。 (NCBI) PDB数据3.6万条 。 (SWISS-MODEL ) 收集涉及91个性状的QTL共846条。(QTLdb) 

转录因子识别 识别蛋白质是否含有DBD结构 与DNA结合的结构域(DBD)具有特异性 HMMER程序 (hmmpscan,hmmsearch) 66个家族231个HMM模型(SCOP) 参数为默认值,取E-value=0.01

预测转录因子的注释 转录因子基本信息物理位置 转录因子家族信息 DBD信息 基因与转录本信息 基因结构与3D结构信息 GO信息 表型性状与QTL信息 序列信息

概要 背景知识 材料与方法 数据库构建与网页 结果与讨论

预测转录因子的展示 C \S构架 动态网站 数据存储 ~ Mysql (5.0.18) 服务 ~ Apache (2.2.4) 界面 ~ Perl (5.8.7) perl :: DBI 、perl :: CGI perl :: GD

数据表结构 TF 基本信息 TF_family 信息 Motif 信息 转录和外显子信息 基因信息 序列信息 QTL 信息 PDB 信息 注释信息

概要 背景知识 材料与方法 数据库构建与网页 结果与讨论

结 果 (I) 共计 5479 个转录因子,4357个基因 由已知蛋白集合预测 3810个基因4932个转录因子 由预测蛋白集合预测    由已知蛋白集合预测 3810个基因4932个转录因子 由预测蛋白集合预测 4260个基因5487个转录因子

结 果 (I) 已知蛋白集合 547~547 3810~4932 预测蛋白集合 4357个基因~5479 个转录因子 占全基因组~14%

转录因子的可变剪切 有886个基因产生2个或2个以上的转录蛋白 1 个基因产生 7个不同的转录因子 3 个基因每个产生 6个转录因子 1 个基因产生 7个不同的转录因子 3 个基因每个产生 6个转录因子 9 个基因每个产生 5个转录因子 712 个基因每个产生 2个转录因子

可变剪切的影响 可变剪切不影响转录因子绑定形式 可变剪切影响转录因子绑定形式 ENSBTAG00000005251产生了7个转录因子 每个转录因子只包含RING/U-box结构。 可变剪切影响转录因子绑定形式 ENSBTAG00000000054产生了4个转录因子 3个含Homeodomain-like和 DEATH domain 1个只含有Homeodomain-like结构 这4个因子的Homeodomain-like均为四联体重复

结 果 (II) 在各条染色体上的分布不均 chr. 19 18 5 3 7 .. 1(146Mb) 367 333 307 287 279 .. 242

结 果 (II) 每条染色体上分布呈非随机性 Chromosome 1

结 果 (III) 3174转录因子分到47个性状中 MY PP PY FP FY SCS SCC 187 274 253 184 180 384 122 合计:1584

产奶量~ 转录因子分布

乳脂量~ 转录因子分布

结 果 (IV) 2967个转录因子只存在一个DBD结构,其余的存在多个DBD结构。 存在结构洗牌现象 同一DBD结构重复

结构洗牌 HTH_11 HTH_1 HTH_10 Basic T_Box Myc_N HLH Com_HTH HLH –T_box HLH – Basic HLH –Myc_N HLH

结构洗牌 Homeobox CUT Pou Zf_C2H2 PAX Fork_head bZip_1 Hom– CUT Hom –Pou Hom –ZF PAX Hom –PAX Fork_head Fork –ZF bZip_1 Zip –ZF

结 果 (IV) 按照DBD结构将转录因子分为64个家族 每个家族所含转录因子数目差异较大,5个家族的成员超过300个,大部分家族含有少许转录因子(幂率分布)。

结 果 (IV) 部分家族具有种属特异性 部分家族成员数目具有种属特异性(与鸡作比) 牛特有家族 ZF-C2H2_DDE GATA_Atrophin-1 哺乳动物特有家族 ZF-C2H2_KRAB_SCAN ZF-C2H2_SCAN 温血动物特有家族 ZF-C2H2_KRAB14 动物特有家族 Fez1 ; Ets 真核生物特有家族 bHLH 部分家族成员数目具有种属特异性(与鸡作比) 牛含量高的家族 ZF-C2H2-3 牛含量低的家族 T-box

结 果 (V) --典型家族进化树分析 bHLH (生物中共有家族) HomeoBox (牛最多成员数家族) Ets (动物中共有家族)

bHLH 此树涉及 33个物种 108条数据

牛 bHLH 家族进化关系图

牛 HomeoBox 进化树包含 128 条数据

牛Ets家族进化树 --14个成员

串联重复 定义:两个或多个同家族成员基因出现在同一条染色体,且距离相差小于200kb。 牛 18号染色体 ENSBTAG00000000332 ~185 ENSBTAG00000007466 ~190 ENSBTAG00000013444 ~193 130Kb 50Kb 定义:两个或多个同家族成员基因出现在同一条染色体,且距离相差小于200kb。

基因重复 X 5 16 187 188 194 17 12 195 197 189

转录因子家族进化树分析结果 存在重复序列和串联重复片段。 有些基因直接来源与祖先基因,一些基因具有直系同源性,一些基因具有并系同源性。 根据进化树可将同一基因家族内的成员进一步细化。

结 论 (I) 在基因组范围内存在一定比例的基因表达转录因子,且在基因组的分布具有非随机性,存在富集区。 与QTL关联的转录因子可作为候选基因考虑,需要进一步实验验证

结 论 (II) 所涉及的结构结合域较多,且组合丰富;推测丰富的结构组合性与生物进化复杂度相关。 部分转录因子家族具有种属特异性 转录因子具有丰富的起源和进化形式。

推论 由于可变剪切,结构洗牌,基因重复和串联重复等特点辅助实现了高等生物特有的复杂性。

致 谢 导师张勤教授 国家基础研究项目2006CB102104 自然基金重点项目30430500 实验室的每一位成员

谢谢!