第八章 DNA 芯 片 马永平 基础医学院生物化学与分子生物学教研室
内容提要 什么是DNA芯片? DNA芯片的原理 DNA芯片的种类 DNA芯片的应用领域 DNA表达谱数据分析 DNA芯片技术的发展与展望 w2
第一节 概述 DNA芯片也叫基因芯片(Gene chip)是指在固相载体(玻璃、硅等)上有序地、高密度地(点间距<500m)排列固定了大量的靶基因或寡核苷酸,也叫探针。这些被固定的分子探针在基质上形成高密度的DNA微阵列,因此,DNA芯片又叫DNA微矩阵( DNA Microarray)。第一块基因芯片1992年诞生在美国。 Affymetrix公司
DNA芯片属于生物芯片(biochip)的范畴,生物芯片分为DNA芯片、蛋白质芯片及其它芯片(样品制备芯片、核酸扩增芯片、毛细管电泳芯片等)三类。
第二节 DNA芯片的基本原理 1. 基因芯片技术是建立在Southern blot基础之上的,可以说它是Southern blot的改进和发展,它的原理是:变性DNA 加入探针后在一定温度下退火,同源片段之间通过碱基互补形成双链杂交分子。 S; DNA-DNA/RNA; N:RNA-DNA/RNA; W:Protein-protein/DNA;E:Genome DNA-DNA/RNA(Dot blot)
2.基因芯片与Southern blot之比较
3. 基因芯片基本操作流程 制备总RNA→ mRNA经RT-PCR用Cy3(正常对照组)和Cy5(实验组)荧光标记目的基因,得到cDNA 探针→ 混合标记探针→与表达谱芯片上核苷酸片段(或基因)杂交→扫描→分析杂交结果→结论 载体+寡核苷酸-探针分子+荧光染料-点样仪-扫描仪-计算机+专业软件
第三节 DNA芯片的种类 表达谱芯片 诊断芯片 检测芯片
1. 表达谱基因芯片 用于基因功能的研究。原理:用不同的荧光染料通过RT-PCR标记不同来源的细胞mRNA制备成探针,将探针混合后与芯片上的基因杂交、洗涤、扫描,得到这些基因在不同组织或个体中的表达谱,再通过计算机分析这些基因在不同组织或个体中的表达差异,得出这些基因表达的重要信息。即高表达、低表达或不表达。
在DNA 和/或RNA水平上用于疾病诊断, 如肝癌、糖尿病等。 2. 诊断芯片 在DNA 和/或RNA水平上用于疾病诊断, 如肝癌、糖尿病等。 3.检测芯片 HBV、HCV、结核杆菌等病原体检测,商检等。
第四节 基因芯片的应用 基因测序及基因图绘制 检测基因突变 基因表达分析 在药物研究中的应用 在微生物菌种鉴定和致病机制 研究中的应用 在农林业生产中的应用 在军事、司法领域的应用
1.杂交测序和基因作图 杂交测序(SBH)是发展基因芯片技术的初衷,希望能够提供一种新的、快速的测序方法。原理:理论上有4n个长度为n的序列,可以被分析的目标长度大约等于点阵上寡核苷酸数目的平方根。 基因绘图:用光蚀刻技术在载体上合成大规模有序的寡核苷酸序列(标签序列),然后与克隆文库中的每个克隆进行杂交,通过鉴定基因与基因间的大量标签序列(EST,STS等),以较低的等价基因组数把他们绘制成重叠图。
附: 标签序列 expressed sequence tags, EST:表达序列标签,为cDNA的部分序列,平均为300-500bp,它可以确定基因的种类和所代表基因表达的拷贝数。目前,公共数据库中可利用的人类EST超过100万个,它可能代表所有人类基因的50%-90%。 sequence tagged site, STS:序列标签位点,是指染色体定位明确,而且可以用PCR扩增的单拷贝序列,一般每隔100kb距离就有一个标记。
2.检测基因突变 1. G C T A C T C A T G C G T A C 如果基因易发生突变区段的核苷酸序列是已知的,则DNA芯片能很容易地通过再测序鉴别出仅1个碱基的错配。以下面的15nt的探针为例,每个探针只有中间一个核苷酸不同,以红体下划线表示。 1. G C T A C T C A T G C G T A C 2. C T A C T C A T G C G T A C T 3. T A C T C A T G C G T A C T C 4. A C T C A T G C G T A C T C C 5. C T C A T G C G T A C T C C G 6. T C A T G C G T A C T C C G T
TACGCA TACTCA A C G T W13
2.C T A C T C A T G C G T A C T 3. T A C T C A T G C G T A C T C 4. A C T C A T G C G T A C T C C 1. A C T C A T G A G T A C T C C T A C T C A
3.基因表达分析 1) 肺癌相关基因的表达研究 黄达辉 毛裕民等 用含4096条cDNA基因的表达谱芯片研究一组肺癌组织样本的基因表达谱,共筛选出差异表达的基因370条,包含已知基因146条,未知基因224条,其中107条表达增加,263条表达降低。 (第二军医大学学报,2000,21(9):827-830)
2) 基因芯片对PMA激活的血管内皮细胞早期反应基因的研究 吴超群,李瑶,毛裕民,等. 摘要:用含4096条人类基因的DNA芯片研究PMA激活的血管内皮细胞ERG的表达谱,作用6h后,17条基因表达上调,11条基因下调。数据分析表明17条上调基因中13条属于蛋白质磷酸酶和转录调控因子基因,而下调基因中9条为细胞分裂相关蛋白,从而证明PMA激活的人血管内皮细胞ERG主要是转录调控因子基因和蛋白质磷酸酶基因。
4. 基因芯片在肿瘤研究中的应用 1)寻找肿瘤相关基因 2)肿瘤基因表达谱研究 3)肿瘤相关基因功能研究 4)肿瘤分子生物学研究 5)肿瘤诊断
1)寻找肿瘤相关基因 Welford 等结合消减杂交技术,用基因芯片分析了两例具有不同生物学活性的Ewing肉瘤标本,一例为生长迅速的转移灶,另一例为被成功治愈的局限灶。经差异表达后,将消减文库插入质粒,制成cDNA文库,与不同荧光标记的肉瘤组织杂交,共得到173条差异表达的基因,其中有50条为新基因(28.9%)。
2)肿瘤基因表达谱研究 Kononen等用含有4000条已知基因和2000个EST的cDNA芯片对两株分别为激素依赖(CWR22)和非激素依赖(CWR22R)的前列腺癌细胞进行杂交,将其表达谱与269例前列腺癌组织及正常前列腺组织比较,发现在芯片的5148条基因中,有3条基因(0.7%)在非激素依赖中表达超过2倍,有135条基因(2.6%)下调超过50%,其中上调的IGFBP2和HSP27基因在临床激素抵抗复发肿瘤标本中分别有100% 和 31%也是上调的。
3)肿瘤分子生物学研究 Alizadeh 等用基因芯片对DLBCL(diffuse large B-cell lymphoma )进行的病理分型研究发现,依据基因表达差异,DLBCL还可以分为三个亚型。(Nature, 2000,403:503-511) .
4)肿瘤诊断 国外有一个病人临床表现出典型的白血病症状,但形态学检测不典型,根据相关检查,诊断为AML (acute myeloid leukaemia) ,治疗几个月后未见好转。后来用DNA芯片与病人骨髓的mRNA杂交,结果显示AML和ALL(acute lymphoblastic leukaemia)基因都表达较低,而在数据分析中发现,编码原肌球蛋白的基因表达极高,从而确诊为肺泡弹状肌肉瘤,改变治疗方案,病情出现缓解。
5.基因芯片在药物研究中的应用 1)药物筛选 直接检测化合物对生物大分子如受体、酶、离子通道等的结合及作用。 检测化合物作用于细胞后基因表达变化。 选择合适的药物作用靶标 有人用5,766个基因的芯片分析正常与癌变的卵巢组织的mRNA,发现二者有30%的基因表达差异为2倍以上,其中癌变组织9%的基因表达上调,尤以CD9、上皮糖蛋白、P27蛋白等。
2 )指导合理用药 不同个体结合药物的靶标存在差异。 小分子药物在体内的作用靶标不可能有绝对专一性。
6. 基因芯片在微生物菌种鉴定中的应用 菌种鉴定 细菌基因分型及菌种鉴定 监测细菌抗药性基因 W21
7. 基因芯片在病原体致病机制中应用 1)致病机制研究 研究病原体基因组,了解其致病基因,抗药机制及抗药基因等。 分析药物作用下病原体基因表达情况 监测宿主在染病状态下基因表达的变化
2) 病原体致病机制的研究 1996年Kozal等首次用基因芯片技术发现HIV-1包膜B蛋白酶极其多变,其中许多氨基酸的改变与抗蛋白酶抑制剂的抗药性有关。
检测生物战病原体,研制生物战保护剂。 DNA指纹鉴定、血型鉴定; 8. 基因芯片在军事司法方面的应用 生物武器一致被誉为“穷人的原子弹”,在未来的战争中必将占有一席之地,如果将所有生物武器的基因集中在一张芯片上,就可以很快检测出病原体,作出相应的保护措施,为赢得战争,保护人员安全争取宝贵的时间。
1) DNA指纹 DNA fingerprint:人类基因组内散布着许多串联重复的短小DNA序列,叫小卫星DNA(MSDNA),由于不受选择压力,卫星DNA呈现高度的多态性,具有孟德尔式稳定遗传的特性。因此,用MSDNA探针与总DNA限制性酶切片段(酶切位点在MSDNA之外)杂交,可以得到个体特异的DNA指纹图谱。
第五节 数据分析 1.图象分析(Image analysis) 第五节 数据分析 1.图象分析(Image analysis) 2.标准化处理(Normalization): 是指以持(管)家基因(housekeeping gene)的表达率为参照,对原始数据进行校正的过程。实际操作中常常剔除Cy3和Cy5信号强度均小于400的基因表达,使数据标准化。 3.散点图分析(scatter plot)
基因芯片的扫描示意图 M Cy3 Cy5 Cy3/Cy5
基因芯片扫描结果图 W16
Scatter plot of differentially expressed gene
1) 数据分析 4.Ratio 值分析 Ratio=Cy3/Cy5, 一般认为Ratio 值在0.5-2.0范围内(即2倍以下)的基因不存在显著表达差异,该范围之外的基因表达认为具有显著差异,由于实验条件不同,此域值区间会根据可信度有所调整。 5.聚类分析(Clustering ):就是根据统计分析原理对具有相同统计行为的多个基因或样本进行归类的分析方法,归为一类(簇)的基因或样本可能具有相似的功能或类型。
聚类示意图 A B a1 a2 a3 a4 a5 b1 b2 b3 b4 b5
2) 对基因芯片结果的验证 RT-PCR Northern blot
第六节 基因芯片的发展与展望 2003年HGP完成后,人们面临的问题是如何了解10万条基因中每一个基因的功能,以及基因之间的相互关系等,从而衍生出人类基因组多样性计划、环境基因组学、肿瘤基因解剖学计划、药物基因组学等。基因芯片以其无可比拟的高信息量、高通量、高自动化和快速准确的优势必将成为后基因组时代最重要最常用的技术,因此,它 被誉为“微缩芯片实验室”(lab-in-a-chip)。
1)中药开发 中医药体系一直是在“整体观念,辨证施治”理论指导下完善发展而成的,现代医学也正是朝“整体观念,辨证施治”的方向发展。因此,中医药里既有巨大的宝藏,又有无限的商机。基因芯片为中医药的研究提供了平行、快速、高通量、多参数的研究手段和筛选方法。 大黄治疗糖尿病 全反式维甲酸;三氧化二砷治疗白血病
2)SNPs(single nucleotide polymorphisms) 染色体的某个位点上存在单个碱基的变化如果在人群中的频率超过1%,则认为是单核苷酸多态(SNPs) 。 SNPs 是近年来出现的第三代遗传标记。另两个是RFLP,MSDNA;用途:1)基因连锁分析,用于基因作图和疾病基因定位;2)人群中寻找SNPs位点; 3)检测保守基因中的点突变;4)病例与对照间的相关分析等。 SNPs分析的前提是所研究基因的DNA序列必须是已知的。