第九章 人類基因體學與展望
遺傳圖譜、細胞學圖譜和 實體圖譜 有兩種類型的圖譜: 遺傳連鎖圖譜(genetic linkage maps) 決定染色體上各種標誌區和基因之間的相對排列與 大約距離。 實體圖譜(physical maps) 各種基因或未知功能DNA片段之間真實的位置(以 鹼基對數目表示)和距離,甚至於未知功能的DNA 片段,在染色體特定區域的位置都可以明確地繪製 出來。
圖9-1
圖9-2
圖9-3
細胞學圖譜 另一種常用的圖譜是細胞學圖譜(cytological maps), 它有時可以幫助找出遺傳連鎖圖譜與實體圖譜的關 聯性。在細胞學圖譜中,每條染色體的條帶圖和大 小都有明顯的不同,很容易區別。
圖9-4
圖9-5
圖9-6
實體圖譜 實體圖譜是連續DNA序列(又稱為序列 拼圖:contig)交織而成的完整序列。 在實體圖譜中,DNA路標的距離是以千 對鹼基kilobase(1kb=1000核苷酸)來 表示,實體圖譜呈現出染色體內DNA序 列實在的位置。
圖9-7
圖9-8
圖9-9
圖9-10
人類基因體計畫 1988年,美國國家衛生研究院(NIH)和能源部(DOE)共同規劃組成一個委員會,並提出「人類基因體計劃」(human genome project),一個五年整合型的研究計劃。在1990年十月由國會通過開始執行。 人類基因體計劃的目標 官方和私人公司完成人類基因體序列的第一草案 比較基因體學 人類基因體計畫與疾病
圖9-11
人類基因體計劃的目標 1建立高解析度的遺傳圖譜與實體圖譜, 以幫助找出各種疾病基因的位置。 2架構DNA序列路標,以利在2005年 以幫助找出各種疾病基因的位置。 2架構DNA序列路標,以利在2005年 可以完成整個基因體序列。很有趣地,官 方和私人兩個研究機構,同時在2000 年宣佈完成基因體草圖 3使用生物資訊學、ESTs以及比較基因體 學,鑑定出基因體內所有基因。 4建立多型性資料庫,尤其是單一核苷酸 多形性,有助於疾病診斷、全球人口族群 變遷以及人類演化。
表9-1
圖9-12
官方和私人公司完成人類 基因體序列的第一草案 2001年二月分別由: 賽亞基因體學克瑞創投(craig venture of celera genomics) 人類基因體研究國家中心(NCHGR) 兩個單位發表。
重要發現 兩個基因體版本數據呈現的重要發現: 1人類基因體稍多於30億個鹼基對 2三萬到四萬的蛋白質譯碼基因 3重複序列可能影響染色體結構與動態學 4基因平均長度的變異度很大 5染色體上的基因分布並不均勻 6染色體Y的基因數最少,一號染色體最多 7約200個基因直接源自細菌 8人類蛋白質較為複雜 9男性生殖細胞突變速度較女性快兩倍 10所有人類的核苷酸有99.9%相同 11超過50%新發現基因功能不詳
圖9-13
圖9-14
比較基因體學 基因體研究中,以非人類的基因體與人類的相比對,稱為比較基因體學(comparative genomics)。
表9-2
表9-3
圖9-15
人類基因體計畫與疾病 在人類基因體圖譜的繪製中,遺傳連鎖 分析能用於研究家族所患遺傳疾病的特 徵。通常,研究一個家族中連續幾代的 基因便可獲得足夠的訊息,用於推論出 某個基因是否連鎖。
圖9-16
圖9-17
圖9-18
圖9-19
圖9-20
其它基因體計劃 人類基因體與其它基因體有很多不同之處: 1人類基因體之基因密集區是隨機分佈的 2人類的蛋白質量因過程不同,類似的基因卻得到 不同的蛋白質及功能。 3人類同族系蛋白質的成員數量增加很多,尤其是 發育和免疫系統上。 4人類基因體有很大部分是重複序列 5人類之DNA重複的數目已停止增多,而鼠則尚未 減緩,這是人鼠最基本的差異。
其它基因體計劃 老鼠與其它動物 無脊椎動物 植物 微生物
老鼠與其它動物 人鼠的演化在很久以前就已分道揚鑣,但是 DNA序列的保守性很高,可見功能會限制 基因的演化。另外很多發育、代謝及遺傳學疾病也相當近似,這就是為什麼用老鼠作樣版來研究人類疾病。
無脊椎動物 第一次被定序的兩個多細胞真核生物基因體是果蠅和線蟲,這兩種生物長久以來即被當作樣版動物。
植物 研究人員對植物基因體有興趣的原因 是因為一些植物含有特殊代謝酵素, 具有生物技術的應用價值。
微生物 基因體計劃目標為: 1對重大寄生性病原的媒介生物之基因體有較佳認識。 2累積多型性資料,以便檢測基因體歧異度。 3鑑定種的特有基因,開發有效疫苗 4深入了解病原體生活史,作為開發藥物的根據。
功能基因體學 基因體中所有基因的確切位置與功能 基因如何調節與控制 各個染色體的架構如何形成 非譯碼區的DNA有何角色 各種蛋白質之間的交互作用 各種蛋白質的含量與功能 SNP資料與疾病或個人健康的相關性 在多個基因與致病的疾病中,每個基因扮演角色如何。 各個基因在表現型特徵(實體特徵)中扮演角色為何。 不同生物在演化過程中之保守程度
蛋白質體與蛋白質體學 蛋白質體是指在某一狀況下特定細胞內 所有的蛋白質,而蛋白質體學就是研究 基因體所譯碼出來的蛋白質體。
其它~OMES體學 特定種類的細胞在特別的條件下會製造或表現出轉錄產物(transcript),所有這些表現出來的全部轉錄產物就稱為轉錄體(transcriptome),比較兩個不同條件下所產生的轉錄體,就可以得知該基因體中每個基因表現的改變。
生物資訊學 目標是: 1開發工具高速存取及管理資料庫 2分析大量的DNA與蛋白質資料,找出真諦。 3開發新的演算法及工具,以便利用和操作這些數據。
資料庫 最常用的DNA資料庫由美國國家生物技術資訊中心(NCBI)負責維護。DNA序列可以上傳到此資料庫,通常文章發表前都會將其DNA存入此站,學者也可以從此網站中搜尋並取得DNA序列。資料庫也用於作為data mining,利用已知物種的相似序列,預測某基因或蛋白質的功能和結構,從已知序列萃取整理後,再對其功能建構一個假說,以利進一步試驗。
生物資訊學的工具 1從資料庫取得DNA和蛋白質序列 2搜尋相似的DNA和蛋白質序列 3比較和排齊序列~全區或小區域(兩序列以上) 4RNA二級結構的預測~RNA的疊合 5蛋白質的分類及二級結構預測 6使用DNA與蛋白質序列計算演化關係 7使用DNA序列作基因預測 8各項基因分析工具