生物資訊 (Bioinformatics)

Slides:



Advertisements
Similar presentations
陳春賢 老師 長庚大學 資管系 報告人 : ( 研究方向、成果與計畫 ) 資料探勘與生醫資訊相關研究 ( 研究方向、成果與計畫 )
Advertisements

一、人类遗传病概述: 1 、遗传病的概念 由于遗传物质改变引起的人类疾病 1. 单基因遗传病 2. 多基因遗传病 3. 染色体异常遗传病 ( 二 ) 类型 :
科技部專題研究計畫撰寫與分析 國際及兩岸事務暨研究發展處 時 間:2015年11月4日 報 告 人:曾俊堯 博士
13-1 人工智慧 13-2 雲端運算 13-3 感測網路與物聯網 13-4 生物資訊 13-5 計算機萬能嗎?
《中国重要会议论文全文数据库》 《国际会议论文全文数据库》 检索功能特点及使用说明
第十七章 基因组学与医学 GENOMICS AND MEDICINE 刘新文 北京大学医学部生化与分子生物学系.
DNA测序技术 DNA Sequencing
国家科技图书文献中心科技期刊介绍.
刘立明 江南大学生物工程学院环境生物技术室
核酸序列分析与DNA计算 朱德裕 2013年11月8日.
第一章 绪论 本章我们讨论5个问题: 一、现代科学技术发展的基本特点。 二、现代医学面临的挑战和机遇。 三、分子生物学和医学的关系 四、分子生物学回顾、发展现状与展望 五、医学分子生物学理论课和实验课的主要内容.
第9章 转基因动物与动物生物反应器 Transgenic Animal & Animal Bioreactor
WWW Resources for Biotechnology Research
医学细胞生物学 Medical Cell Biology.
分 子 生 物 学 任课教师:宋方洲 马永平 易发平 刘智敏 卜友泉 基础医学院生物化学与分子生物学教研室.
高二生物 绪论 制作人:李 绒.
人类基因组学 朱德裕.
汇报人:李臻 中国海洋大学信息科学与工程学院 计算机科学与技术系
如何利用信息提升研究生 学习与研究质量 安徽省高校研究生信息素养夏令营 武汉大学信息管理学院 黄如花 副院长 教授、博导.
13 生物技术安全性及其应对措施 学习目的 了解生物技术,尤其是转基因技术所带来的安全性,及其对社会安全、伦理、道德可能带来的重大影响;各国对待转基因生物的态度及应对措施;中国加入世界贸易组织以来在生物技术安全性方面面临的问题及对策;克隆人所带来的争议;生物武器对人类的威胁;人类基因组计划带来的担忧。
GIS教学体系探讨 ——以北京大学本科教育为例 邬 伦
生物信息学数据库.
Molecular Pathology introduction 分子病理学导论
医学分子生物学 Medical Molecular Biology
人类科学史上 三大工程 曼哈顿计划(原子弹) 阿波罗计划(登月) 人类基因组计划 了解人类自身,操纵生命 其意义比以上两个计划更为深远.
邹 权 (博士、副教授) 厦门大学数据挖掘实验室
第十二章 人类基因组计划.
遗 传 生命与繁衍的保证.
第3节 人类遗传病.
 DNA cloning Section 1: Gene manipulation (Basic concept & basic techniques) section 2: Cloning vectors (Compare various Cloning vectors) Section 3:
第十四章 基因诊断和基因治疗 表型的改变是由基因异常造成的 表型的改变是由基因异常造成的.
第十四章 真核生物的遗传分析 1.教学目的和要求 (1)掌握真核生物基因组的结构特点。 (2)了解基因家族的概念与类型。 2.教学重点
生物信息学 Bioinformatics.
酵母双杂交系统 Yeast Two-hybrid System(interaction trap)
libD3C: 一种免参数的、支持不平衡分类的二类分类器
生物資訊 bioinformatics 林育慶.
生物信息学 第三章 基因组学与序列分析 张高川 生物信息学教研室 (Department of Bioinformatics)
Chap.8 Advances in Genetics
Computational Chemistry
計算方法設計與分析 Design and Analysis of Algorithms 唐傳義
第六章 微生物的遗传与变异 概述 第一节 微生物遗传的机制 第二节 微生物的变异 第三节 微生物的遗传与变异理论及 实践意义.
化学生物信息学 -从进化到药物发现 张红雨 (华中农业大学生物信息中心).
5、利用EST数据库发现新基因 EST (expressed sequence tags),是从基因表达的短的序列,携带着完整基因某些片断的信息,称为表达序列标签 获得一个EST的途径有三种:1 大规模测序;2 比较同源性;3 差异显示或基因芯片法获得与某一性状相关的EST 电脑克隆 第一步,找到与待克隆基因相关的EST;第二步.
座谈会: 写好本科毕业论文 一般科技论文写作 完成优秀论文答辩 主持:许胜勇 北京大学电子学系 物理电子所
功能基因组学 中英联合实验室.
國立陽明大學 臨床醫學研究所 簡報 2005 報告人 臨床醫學研究所所長 吳肇卿 教授.
An Introduction to Computer Science (計算機概論)
Nature Publishing Group Nature Geoscience
971研究方法課程第九次上課 認識、理解及選擇一項適當的研究策略
ProQuest-CSA Illumina数据库
信息产业导论期末汇报 汇报人:刁梦鸽 学号: 时间:2012年5月31日.
人类基因组计划(human genome project,HGP)是由美国科学家、诺贝尔奖获得者Renato dulbecco于1986年在杂志《Science》上发表的文章中率先提出的,旨在阐明人类基因组脱氧核糖核酸(DNA)3×109核苷酸的序列,阐明所有人类基因并确定其在染色体的位置,从而破译人类全部遗传信息。美国于1990年正式启动人类基因组计划,估计到2003年完成人类基因组全部序列测定。欧共体、日本、加拿大、巴西、印度、中国也相继提出了各自的基因组研究计划。由于各国政府和科学家的共同努力,HG
分子标记的各种类型 Molecular Markers.
英国皇家化学学会 (Royal Society of Chemistr简称RSC) 电子期刊使用指南 国家科学图书馆 吕俊生 2006/11
欢迎大家来到汕头大学从事生命科学研究 希望大家: 调整心态 迎接挑战 抓紧时间 努力拼搏 衷心祝愿大家 学业有成 从胜利走向辉煌.
第十一章 动物基因组学 (Animal Genomics).
在戒慎恐懼中前進,之二: 基改作物、生物資料庫
Total Review of Data Structures
虚 拟 仪 器 virtual instrument
Computational Thinking & Programming
NoeClone 诺京生物信息.
IEEE Computer Society 長亨文化事業有限公司.
系统科学与复杂网络初探 刘建国 上海理工大学管理学院
Interactome data and databases: different types of protein interaction
第九章 人類基因體學與展望.
(二)盲信号分离.
基因组学        第一节 基因组结构特征      第二节    DNA分子标记及其应用 第三节 基因组图谱的构建及应用 第四节   后基因组学.
缅怀植物学家钟 扬:一个心怀家国的“善梦者”
Nature Publishing Index 自然出版指數2010 China中國 Asia-Pacific亞太 Global全球
Pattle Pun. Professor of Biology emeritus, Wheaton College, IL
Presentation transcript:

生物資訊 (Bioinformatics) 蔡懷寬 E-mail: d7526010@csie.ntu.edu.tw

Please tell me Why you are here? Make a definition of bioinformatics

Introduction What is bioinformatics? Why bioinformatics? The past, current, and future in bioinformatics

什麼是生物資訊學? 它是一個跨領域的學門: 終極目標:了解生物特性及生命本質 重要的子領域: 大量資料的分析演算法及統計方法 結合生物、資訊科學、數學、物理及化學等領域 終極目標:了解生物特性及生命本質 重要的子領域: 大量資料的分析演算法及統計方法 各種生物序列, 結構, 功能及演化的分析與解釋 管理及使用各種型態資訊的軟體工具

為什麼需要生物資訊學?

REVOLUTION IN BIO-MEDICAL RESEARCH CLASSICAL APPROACH HIGH-THROUGHPUT APPROACH Northern Hybridization Western Hybridization Southern Hybridization RFPD Differential Display Subtraction Library Real-Time PCR Microarray 2-Dimensional Protein Electrophoresis Serial Analysis of Gene Expression Expression Sequence Tags EXPERIMENT DRIVEN Hypothesis  Experiment INFORMATION DRIVEN Experiment  Hypothesis

為什麼需要生物資訊學? 生物相關資料的累積迅速,資料量非常大,亟需電腦協助分析

The GeneBank Data (9/25/2002) Year Base Pairs Sequences 1982 680338 606 1983 2274029 2427 1984 3368765 4175 1985 5204420 5700 1986 9615371 9978 1987 15514776 14584 1988 23800000 20579 1989 34762585 28791 1990 49179285 39533 1991 71947426 55627 1992 101008486 78608 1993 157152442 143492 1994 217102462 215273 1995 384939485 555694 1996 651972984 1021211 1997 1160300687 1765847 1998 2008761784 2837897 1999 3841163011 4864570 2000 11101066288 10106023 2001 15849921438 14976310

Protein DataBank Data (9/25/2002)

為什麼需要生物資訊學? 生物相關資料的累積迅速,資料量非常大,亟需電腦協助分析 提供實驗設計更宏觀的看法,從以往個別基因的研究,邁向整個基因組的研究 透過資料挖掘來了解基因功能及蛋白質結構 更進一步了解演化歷史及物種間的演化關係

人類基因組解讀計畫

基因組(genome) All the genetic material in the chromosomes of a particular organism Its size is generally given as its total number of base pairs.

基因組的大小 Human: 3000 million bases Mouse: 3000 million bases Drosophila (fruit fly): 165 million bases Nematode (roundworm): 100 million bases Yeast (fungus): 14 million bases E. coli (bacteria) 4.67 million bases

人類基因組解讀計畫 簡稱為HGP (Human Genome Project) 主要目標有: identify all the genes in human DNA, determine the sequences of the 3 billion chemical bases that make up human DNA store this information in databases develop tools for data analysis transfer related technologies to the private sector address the ethical, legal, and social issues (ELSI) that may arise from the project

Human Genome

HGP的沿革與進展 HGP從1990年起開始進行 HGP是由美國及英國所主導的一項全球性計畫 2000年六月與Celera私人公司共同宣布人類基因組的初稿已完成

HGP的沿革與進展(續) 2001年2月: Initial sequencing and analysis of the human genome (Nature, Vol. 409, 15 Feb. 2001, by International Human Genome Sequencing Consortium) The sequence of the human genome (Science, Vol. 291, 16 Feb. 2001, by J. C. Venter, et al.)

Biology moves into the silicon stage in vivo in vitro in silico

從HGP來看整個生物資訊界的脈動

Before HGP String analysis Pair-wise, multiple sequence alignment

Sequence Analysis Alignment Pair-wise alignment SURVIVE SURVIVE SURIUE SUR- IUE Multiple sequence alignment RPCVCPVLRQAAQ s1 RPCVC_ P__VLRQAAQ a1 RPCACCPVLRQVVQ s2 RPCACCP__VLRQVVQ a2 KPCLCPRQLRQV s3 KPCLC_ P RQLRQV_ _ a3 KPCCPRQAAQ s4 KPC_C_ P____ RQAAQ a4 S A

Before HGP String alignment Linkage analysis Pair-wise, multiple alignment Linkage analysis

Linkage Analysis

Before HGP String alignment Linkage analysis Phylogenetic tree Pair-wise, multiple alignment Linkage analysis Phylogenetic tree

Phylogenetic Tree

Phylogenetic Tree

Before HGP String alignment Linkage analysis Phylogenetic tree Pair-wise, multiple alignment Linkage analysis Phylogenetic tree Protein structure prediction …

Protein Structure Prediction

During HGP Sequencing Physical mapping Fragment assembly

Sequencing Strategies (1) Map-Based Assembly: Create a detailed complete fragment map Time-consuming and expensive Provides scaffold for assembly Original strategy of Human Genome Project

Sequencing Strategies (2) Shotgun: Quick, highly redundant – requires 7-9X coverage for sequencing reads of 500-750bp. This means that for the Human Genome of 3 billion bp, 21-27 billion bases need to be sequence to provide adequate fragment overlap. Computationally intensive Troubles with repetitive DNA Original strategy of Celera Genomics

Shotgun Sequencing: Assembly of Random Sequence Fragments To sequence a Bacterial Artificial Chromosome (100-300Kb), millions of copies are sheared randomly, inserted into plasmids, and then sequenced. If enough fragments are sequenced, it will be possible to reconstruct the BAC based on overlapping fragments.

During HGP Sequencing Gene Prediction Physical mapping Fragment assembly Gene Prediction

During HGP Sequencing Gene Prediction … Physical mapping Fragment assembly Gene Prediction …

After HGP (Post Genomic) Microarray

Microarray

After HGP (Post Genomic) Microarray Regulatory network

Regulatory Network  Simplified representation of the NF- B network.

After HGP (Post Genomic) Microarray Regulatory network Proteomics …

生物資訊學的相關課題

生物資訊相關主題(1) 定序(sequencing) 基因組的DNA序列很長,但卻扭曲在小小的細胞內,目前仍然沒有方法可以一次將整個序列讀出來 現階段的方法都是將基因組序列切成很多的小段,然後藉由重疊的區域將整個基因組序列再組合回來

生物資訊相關主題(2) 序列分析(sequence analysis) 藉由序列分析的結果,來探索序列的功能 這是基因組學(genomics)分析的基礎 DNA序列間的比較 蛋白質序列間的比較 長序列的比較 相似序列的比較 多重序列比較 SNP (Single nucleotide polymorphism) Haplotypes

生物資訊相關主題(3) 找尋基因(gene finding) 給定一個基因組序列,決定各個基因的位置 由於目前尚未完全理解DNA語言,所以並沒有百分之一百正確的方法可以直接從基因組序列決定出所有的基因出現位置 現階段的方法,很多都是用已知的基因所歸納出來的規則來做判斷

生物資訊相關主題(4) 生物資訊資料庫(bioinformatics database) 生物序列相關的資訊累積很快,資料庫已成為生物資訊應用上最重要的工具 資料庫就是一堆資料的儲存庫,它的存放方式,通常會規劃得讓電腦可以快速搜尋及擷取資料。而資料庫管理系統則可讓使用者設計所需要的資料庫,以及操作資料庫所需的修訂、存取及搜尋功能。

生物資訊相關主題(5) 蛋白質結構的預測(protein structure prediction) 蛋白質的功能很多是由它的結構所決定的 X-ray及NMR是目前決定蛋白質結構常用的方式 如何從蛋白質的一維序列推測它的三維結構,是一個很難但很重要的研究課題

生物資訊相關主題(6) 蛋白體學(proteomics) methodological developments in protein separation and characterization advances in bioinformatics, and novel applications of proteomics in all areas of the life sciences and industry. (These endeavours give new insights into protein functions, interactions and pathways.)

生物資訊相關主題(7) 演化樹的建構(evolutionary tree construction) 演化樹的建構可協助了解演化過程及歷史 有的方法根據特徵(character)保留的狀況表來決定演化樹 有個方法根據物種間的距離來決定演化樹 大部分的演化樹建構問題都是NP-Complete (換句話說,都是很難的計算問題)

生物資訊相關主題(8) 其他課題: RNA二維結構預測(RNA secondary structures) 比較基因組學(comparative genomics) 基因網路(genetic networks) 微陣列晶片(microarrays 或稱基因晶片) 分子計算機(molecular computers)

生物資訊的相關文獻

Bioinformatics and Computational Biology-Related Journals: Bioinformatics (期刊原名為CABIOS) Bulletin of Mathematical Biology Computers and Biomedical Research Genome Research Genomics Journal of Computational Biology Journal of Molecular Biology Nature Science

Bioinformatics and Computational Biology-Related Conferences: the first IEEE Computer Society Bioinformatics Conference (CSB 2002, CA, USA) Intelligent Systems for Molecular Biology (ISMB 2003, Brisbane, Australia) Pacific Symposium on Biocomputing (PSB 2003, Kauai, Hawaii, USA) The Seventh Annual International Conference on Research in Computational Molecular Biology (RECOMB 2003, Berlin, Germany)

Bioinformatics and Computational Biology-Related Books: Calculating the Secrets of Life: Applications of the Mathematical Sciences in Molecular Biology, by Eric S. Lander and Michael S. Waterman (1995) Introduction to Computational Biology: Maps, Sequences, and Genomes, by Michael S. Waterman (1995) Introduction to Computational Molecular Biology, by Joao Carlos Setubal and Joao Meidanis (1996) Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology, by Dan Gusfield (1997) Computational Molecular Biology: An Algorithmic Approach, by Pavel Pevzner (2000) Introduction to Bioinformatics, by Arthur M. Lesk (2002)

生物資訊學相關網頁 MIT Biology Hypertextbook http://www.mit.edu:8001/afs/athena/course/other/esgbio/www/7001main.html 很不錯的on-line生物學 The International Society for Computational Biology: http://www.iscb.org/ National Center for Biotechnology Information (NCBI, NIH): http://www.ncbi.nlm.nih.gov/ (NCBI, EBI 及 DDBJ是目前生物序列的三大集散中心, 它們互相傳遞資料) European Bioinformatics Institute (EBI): http://www.ebi.ac.uk/ DNA Data Bank of Japan (DDBJ): http://www.ddbj.nig.ac.jp/

生命科學與資訊科學的互動 就某方面而言,這種互動很類似物理與數學間的互動: 因為要解釋某些大量生物資料的信息,帶動了新的資訊分析方法及工具的製作 新的資訊理論及工具的產生,也為未來的生物學研究,舖設了新的途徑。

跨領域合作 真理只有一個 眼光要放遠 文化背景不同 研究步驟不同 Credits 隔行如隔山 分生的應用常迫在眉睫;而資訊理論的開發卻常曠日費時且充滿不確定性 Theory & Practice 真理只有一個 眼光要放遠