基于高密度SNP芯片进行 中国荷斯坦牛CNV检测 刘剑锋 张勤 中国农业大学动物科技学院 2010.8.17
一、研究背景 拷贝数变异是指与参照基因组比较,DNA片段缺失、复制、插入或复杂基因组重排区域大于1Kb至Mb的结构变异。
…
CNV在人类基因组上的研究 CNVs大约占有12%的区域 几千个基因存在拷贝数变异 SNP研究任何两个随机人类基因组都至少有0.1%的差异 ,CNVs研究为至少1%
CNV在人类基因组上的研究 2004年,lafrate等在5个人群39名没有亲缘关系的健康个体中发现255个位点包含CNVs ,平均长度150kb-425kb 2004年,Sebat等在20个没有血缘关系的个体中发现221个拷贝数变异,平均跨越465kb
CNV在人类基因组上的研究 2005年,Tuzun等比较两组不同种族的人类基因组序列,共发现241个CNVs,片断大小在8~40kb。 2008年,Hasin等通过3个不同祖先的25个个体检测嗅觉受体(OR)基因位点的CNVs。发现93个OR基因位点受到CNVs影响。
CNV在小鼠中的研究 2007年,Chris 等比较C57BL/6品系的14个高度近交967代的亚群鉴别出38个CNVs。 CNVs的范围在4Kb-4Mb。
CNV在大鼠中的研究 2008年,Guryey等研究发现643个CNVs约占基因组的1.4%,65%的CNV片段长度小于10kb 。 发现18号染色体(RNO18)没有CNV 。
CNV在猪中的研究 12头没有亲缘关系的杜洛克猪与一头没有亲缘关系的汉普夏公猪比较 共发现37个拷贝数变异区域,5个位于染色体重复区域
CNV在牛中的研究 14 Holsteins 3 Simmental 2 Red danish 1 Hereford 基于CGH技术
来自17个公牛家系的248个半同胞个体 基于SNP 50 K芯片技术
CNV的研究价值
CNV的研究价值 CNVs 除了具有覆盖范围广、组成形式多样的特点以外,还具有其作为遗传标记的三个重要特点 —— 可遗传性 ——相对稳定性 —— 可遗传性 ——相对稳定性 ——高度异质性
CNV作用机制与疾病 通过剂量效应直接改变基因表达量,引起功能紊乱。 通过影响基因转录调控因子,间接影响基因的表达量。
研究CNV的相关试验技术 分辨率范围从1Mb到几Kb Array-CGH ROMA 准确程度依靠芯片上片段的数量和距离 Fosmid末端比较 FISH SNP芯片技术 分辨率范围从1Mb到几Kb 准确程度依靠芯片上片段的数量和距离
二、试验群体 2047荷斯坦奶牛,来自14个公牛家系 基于Illumina高密度SNP50K芯片检测平台
三、CNV检测 利用BEADSTUDIO产生每个个体的所有SNP位点探针杂交信号强度数据; 基于隐马尔科夫链算法,采用PennCNV软件,检测个体CNV。
PennCNV简介 从SNP芯片数据检测CNVs 隐马尔科夫模型(hidden Markov model) 可处理 Illumina、Affymetrix及其他芯片数据 集成多方面信息:total signal intensity、每个SNP标记的allelic intensity ratio、相邻SNPs的距离、SNP等位点的群体频率、系谱信息。
四、检测结果 共检测出8010个CNV,存在于1746 samples内。 其中大多数含SNP数不超过10个,检测出CNV数超过100个的有7 samples(low quality)。 需进行质量控制,以减少假阳性结果。
对牛SNP50芯片数据的分析 质量控制 sample-level: No.CNV:50 LRR_SD:0.24 BAF_DRIFT:0.01 WF:0.05
2047 samples--------->>>>1246 samples 8010 CNVs-------------->>>>2448 CNVs
质量控制 call-level 质控水平:7 SNPs,100 Kb 2448 CNVs-------->>>242 CNVs
质量控制: 去除特定染色体区域的CNV:如染色体端、着丝粒附近等区域。
对牛SNP50芯片数据的分析 最终结果
对牛SNP50芯片数据的分析
五、下一步工作 对检出的CNV进行进一步验证: 1、CGH芯片 2、RT-PCR 3、测序验证 进行CNV与奶牛生产性能的GWAS分析
六、展望 随着高通量全基因组CNVs 扫描平台和新的统计推算方法的不断发展,基于CNVs 这一新的遗传标志的GWAS 将和基于SNPs 的传统GWAS 一样,成为研究复杂性状遗传机理的有力工具。
六、展望 联合使用SNPs 和CNVs 这两个具有互补性的遗传标志,将为深入理解复杂性状的分子机制和鉴定易感基因,对遗传变异和复杂性状表型关系的认识具有重要意义。
致谢 感谢课题组姜力博士生在基因型分析、信号强度分析给予的付出和帮助 感谢课题组蒋纪才硕士生在PENNCNV软件调试中付出的努力 感谢张勤教授对总体研究方案给予的支持、教导和帮助!
衷心感谢各位老师!