群体遗传学 Population genetics
1.什么是群体遗传学及其研究的主要内容? 2.遗传结构变化的表现方式和影响因素? 研究人群中的遗传结构及其变化的规律。而我们所学习的这一部分主要是研究致病基因的群体中的变化,以及遗传病在群体中的发生、流行的规律。 2.遗传结构变化的表现方式和影响因素? 主要表现在基因频率和基因型频率的变化,影响因素有:群体大小、婚配方式、基因突变率、选择压力、群体间隔离状态、迁移等。
第八章 群体遗传学 第一节 群体中的遗传平衡 第二节 影响群体遗传平衡的因素 第三节 遗传负荷
本章节重点 1、基因频率和基因型频率及计算; 2、遗传平衡定律; 3、影响群体遗传平衡的因素; 4、近婚系数的计算(难点)。
第一节 群体中的遗传平衡 一、基本定义 二、基因频率和基因型频率的计算 三、遗传平衡定律的内涵与应用
一、基本定义 群体 ( population )分为广义和狭义两种概念: 广义:地球上单一物种全部个体; 狭义:某一物种生活在某一地区内的,能相互随机杂交的有性生殖个体群,也称之为孟德尔式群体(Mendelian population)。 基因库 ( gene pool ) 一个群体所具有的全部遗传信息称为基因库,每个个体携带的只是一部分。
基因型频率 ( genotype frequency ) 基因频率 ( gene frequency ) 某一等位基因占该基因座上全部等位基因的比例。 f(A)=p、f(a)=q p+q=1 基因型频率 ( genotype frequency ) 指群体中某一基因型个体占群体总体基因型的比例。 f(AA)=D、f(Aa)=H、f(aa)=R D + H + R = 1
二、基因频率和基因型频率的计算 表型 基因型频率 基因频率 MN血型为共显性遗传性状,决定于4q28-q31上的等位基因M、N。有人在一个地区调查747人。M血型占 31.2%;N血型占17.3%;MN血型占51.5%。求M、N基因频率。
747人的群体 M血型 基因型为MM 占31.2% N血型 基因型为NN 占17.3% MN血型 基因型为MN 占51.5% 设M、N基因频率分别为p、q,据定义: P =(747×0.312×2+747×0.515)/747×2 q =(747×0.173×2+747×0.515)/747×2
P =(0.312 ×2+0.515)/2 = 0.312 + 0.515 /2 = 0.57 q =(0.173 ×2+0.515)/2 = 0.173 + 0.515 /2 = 0.43 所以 P=MM+1/2MN q=NN+1/2MN
对于共显性和不完全显性性状 p + q = 1 D + H + R =1 p = D + 1/2H q = R + 1/2H (以1对等位基因为例) 有一对等位基因 A 和 a 基因 A 的频率为 p 基因 a 的频率为 q p + q = 1 基因型 AA 的频率为 D D + H + R =1 基因型 Aa 的频率为 H 基因型 aa 的频率为 R p = D + 1/2H q = R + 1/2H
( law of genetic equilibrium ) W.Weinberg 三、遗传平衡定律 ( law of genetic equilibrium ) (一)遗传平衡定律的内容 DH.Hardy (二)遗传平衡定律的内涵 (三)遗传平衡定律的应用
(一)遗传平衡定律的内容 遗传平衡必需条件: 1.群体很大 2.随机婚配 3.没有突变 4.没有选择 5.没有大规模迁移 群体中的基因频率和基因型频率在世代传递中保持不变,如果一个群体达到了这种状态,就是一个遗传平衡的群体。
(二)Hardy-Weinberg 定律的内涵 有一对等位基因 A 和 a:f(A)=p f(a)=q p+q=1 基因型频率按下列分布展开: 精子 f(A)=p f(a)=q 卵 子 (AA)p2 (Aa)Pq (aa)Q2 f(AA) =p2 f(Aa) =2pq f(aa)=q2
据数学原理: (p + q) 2 =(p + q)(p + q) = p2 + 2pq + q2 = 1 即 AA:Aa:aa = p2 :2pq :q2 ---- 为遗传平衡群体 D = AA = P2 ; H = Aa = 2pq ;R = aa =q2
先计算该群体基因型频率: AA →0.36 Aa →0.48 aa →0.16 举例说明 假设一个群体 100万人, 假设一个群体 100万人, AA 36万人,Aa 48万人,aa 16万人。 假定A→P, a→q 先计算该群体基因型频率: AA →0.36 Aa →0.48 aa →0.16
故群体是一个遗传平衡的群体 再计算基因频率: A → p = 0.36 + 0.48/2 = 0.60 a → q = 0.16 + 0.48/2 = 0.40 如果是遗传平衡的群体,基因型频率应为: p2 = 0.36 2pq = 0.48 q2 = 0.16 此群体基因型频率为: AA : 0.36、 A a : 0.48、 a a :0.16 故群体是一个遗传平衡的群体
(三)Hardy-Weinberg 定律的应用 1、判断一个群体是否为平衡群体 一个群体100人,AA60人,Aa20人,aa20人。这是一个遗传平衡群体吗? 假定A→p, a→q 先计算该群体基因型频率: AA →0.6 Aa →0.2 aa →0.2
故群体是一个遗传不平衡的群体 再计算基因频率: A → p = 0.60 + 0.20/2 = 0.70 a → q = 0.20 + 0.20/2 = 0.30 如果是遗传平衡的群体,基因型 频率应为: p2 = 0.49 2pq = 0.42 q2 = 0.09 此群体基因型频率为: AA :0.6、 A a : 0.2、 a a :0.2 故群体是一个遗传不平衡的群体
达到了遗传平衡状态 精子 A (0.70) a (0.30) 卵子A(0.70) AA (0.49) Aa(0.21) 一次随机交配:F1代基因型AA:Aa:aa的比例变化 精子 A (0.70) a (0.30) 卵子A(0.70) AA (0.49) Aa(0.21) a(0.30) Aa (0.21) aa(0.09) AA(p1)2 :Aa(2p1q1):aa(q1)2=0.49:0.42:0.09 达到了遗传平衡状态
精子 A(0.70) a(0.30) 卵子A(0.70) AA(0.49) Aa(0.21) F2基因型AA:Aa:aa的比例变化 精子 A(0.70) a(0.30) 卵子A(0.70) AA(0.49) Aa(0.21) a(0.30) Aa(0.21) aa(0.09) AA(p2)2=0.49,Aa(2p2q2)=0.42,aa(q2)2=0.09 再次随机交配: 因此,一个遗传不平衡的群体,只要是进行随机交配,一代以后即可达到遗传平衡。
(三)Hardy-Weinberg 定律的应用 2、基因频率的计算 1、常染色体隐性遗传病(AR) 2、常染色体显性遗传病(AD) 3、X连锁基因
1、常染色体隐性遗传病(AR) aa=q2 = 隐性表型频率 = 群体发病率 a 基因频率q = q2 = 隐性表型频率 = 发病率 = 隐性表型频率 = 发病率 A 基因频率p = 1- q Aa = 2pq = 2q (1 – q ) = 2q – 2q2 ≈2q
aa = q2 = 1/40000 a = q =√1/40000 = 1/200 A = p =1-q=1-0.005=0.995≈1 一个群体中白化病的发病率为1/40000,求致病基因频率;携带者频率? 按遗传平衡定律计算: aa = q2 = 1/40000 a = q =√1/40000 = 1/200 A = p =1-q=1-0.005=0.995≈1 Aa = 2pq=2q–2q2 =2×1/200=1/100
2、常染色体显性遗传病(AD) a基因频率q= q2 = 正常人的频率 A 基因频率 p =1-q D+H =p2 +2pq H =2pq =2p(1-p)=2p-p2 ≈ 2p p =H /2
性 别 女 性 男 性 基因型 XAXA XAXa XaXa XAY XaY 频 率 p2 2pq q2 p q 性 别 女 性 男 性 基因型 XAXA XAXa XaXa XAY XaY 频 率 p2 2pq q2 p q 男性表型频率=男性相应的基因型频率 =男性群体基因频率 女性纯合体的频率 =男性相应表型频率的平方
通过调查男性的表型频率就可以直接得出群体基因频率; 发病率较低的XD病中,男性患者与女性患者比例为: p/(p2+2pq)=1/(p+2q)≈1/2 发病率较低的XD病中,女性携带者与男性患者比例为: 2pq:q≈2q:q=2
XR:红绿色盲在男性中占7%,致病基因频率q为0.07,女性红绿色盲发病率q2预期应为(0.07)2即0.0049,实际观察到的数值为0.5% 女性携带者频率2pq = 2(1-q)q = 2q-2q2 = 2q = 2×0.07 = 0.14
第二节 影响群体遗传平衡的因素 Mutation(突变) Selection(选择) Consanguineous(近亲婚配) 第二节 影响群体遗传平衡的因素 Mutation(突变) Selection(选择) Consanguineous(近亲婚配) random genetic drift(随机漂变) Isolation(隔离) Migration(迁移)
一、突 变 (一)定义: 突变率(mutation rate) :每个基因 都有一定的突变率,用每一世代中每一 一、突 变 (一)定义: 突变率(mutation rate) :每个基因 都有一定的突变率,用每一世代中每一 百万个基因中发生基因突变的次数来表示。 即 n×10-6 / 基因 / 代
(二)突变间的平衡 一对等位基因 A 和 a f(A) = p,突变率为 u f(a) = q,突变率为 v p = qv ; q = pu qv =(1 – q)u q = u u + v qv + qu =u q( u + v )= u p = v u + v
= 0.3 中性突变(neutral mutation) 如:我国汉族人群中,对苯硫脲(PTC)尝味能 力决定于5p15的T,T突变为t失去尝味能力。 若U=0.9×10-6/代, V=2.1×10-6/代。求 缺乏尝味能力的味盲基因(t)的频率: q = u /u + v = 0.9/0.9+2.1 = 0.3
二、选 择 (一)定义: (一)定义: (一)定义: 选择selection:指增高或降低个体的适合度。 二、选 择 (一)定义: 选择selection:指增高或降低个体的适合度。 (一)定义: 选择selection:指增高或降低个体的适合度。 (一)定义: 选择selection:指增高或降低个体的适合度。 适合度(fitness):是指一定环境条件下,一个个体能生存并能将他的基因传给后代的能力。用f表示。一般用相对生育率来衡量(举例)。 适合度(fitness):是指一定环境条件下,一个个体能生存并能将他的基因传给后代的能力。用f表示。一般用相对生育率来衡量(举例)。 适合度(fitness):是指一定环境条件下,一个个体能生存并能将他的基因传给后代的能力。用f表示。一般用相对生育率来衡量(举例)。 选择系数:S 代表在选择作用下,降低的适合度。 S = 1 - f 选择系数:S 代表在选择作用下,降低的适合度。 S = 1 - f
有人在丹麦调查了108名软骨发育不全性侏儒,他们一共生育了27个孩子,而他们的457个健康亲属共生育了582个孩子,计算适合度。 f=(27/108)/(582/457) =0.2
(二)选择与突变间的平衡 在一个遗传平衡的群体中,选择压力和突变压力基本上维持着平衡。 选择和突变对群体遗传结构的作用方向正好相反 选择压力(selection pressure) :淘汰有害基因 突变压力(mutation pressure) :补充有害基因 在一个遗传平衡的群体中,选择压力和突变压力基本上维持着平衡。
(二)选择与突变间的平衡 1、选择对显性基因的作用 A → p ,a → q A 是有害的致病基因,当选择对显性基因A不利时,杂合子Aa和纯合子AA都会被淘汰。这样,基因A最终会从群体中消失。这时如要达到遗传平衡,就要靠基因a突变为基因A来补偿。
在选择的作用下,其选择系数为S,每一代中基因频率的改变将为Sp 。 AD患者都是杂合体(H)=2pq P的值很小,所以q=1 H=2p; p=1/2H 在一个遗传平衡的群体中,被淘汰p必将由突变率v来补偿,以维持平衡。 即 v=Sp=S·1/2H
2、选择对隐性基因的作用 隐性有害基因a只有在aa状态下才面临选择, aa→q2;选择系数→S, 则每一代中,将有 Sq2 隐性基因被淘汰。 在一个遗传平衡的群体中,这必将由突变率u来补偿。 即:u = Sq2
3、选择对 X 连锁隐性基因的作用 一个群体中,XR致病基因只有在男性才受选择的影响, 2/3的a存在于女性杂合体XAXa中,但不受选择的影响,女性XaXa可以忽略。如果致病基因频率为q,选择系数为S,每一代中将有1/3Sq的致病基因被淘汰, u = 1/3Sq
4、选择对 X 连锁显性基因的作用 如果致病基因频率为p,选择系数为S,q=1 每一代中将有S(p/3+ 2p/3)的致病基因被淘汰 一个群体中,XD致病基因A在p/3的男性, 2pq/3的女性杂合体XAXa受选择,女性XaXa可以忽略。 如果致病基因频率为p,选择系数为S,q=1 每一代中将有S(p/3+ 2p/3)的致病基因被淘汰 v = sp
(三)选择压力的变化对遗传平衡的影响 AD: AR: 1、选择压力的增强 群体中致病基因的频率在一代中即可降低为0,下一代的致病基因频率靠新的基因突变来维持。 AR: 群体中的致病基因大多存在于杂合子中,可持续向后代传递,隐性致病基因频率降低的速度可按下列公式计算: n = 1/qn - 1/q
XD:杂合子XAXa和半合子(XAY)均面临选择 XR:只有半合子(XaY)才面临选择 故群体中Xa的频率q每一代中即可降低1/3 XD:杂合子XAXa和半合子(XAY)均面临选择 故群体中XA的频率p与突变率v相同而不会 从上一代中传来致病基因XA
AD: 2、选择压力的放松 AR: XR: XD:同AD 。 若患者被治愈就和正常人一样结婚生育,群体中致病基因的频率在1代后就增加1倍,出现家族病例。 AR: 患者的 f=1,S=0。隐性致病基因频率的缓慢上升按公式:n = ( qn - q )/u XR: 只有男性患者才面临选择。若该病是致死的,在完全放松选择后, 也要经过3代,致病基因频率才可增加1倍,即男性患者的发病率增高1倍。 XD:同AD 。
三、近亲婚配 一、近婚系数 近婚系数(inbreeding coefficient,F): 是指近亲婚配的一对夫妇可能从共同祖先得到同一基因,有可能把同一基因传给他们的子女,子女得到这样一对来源相同且纯合的概率为近婚系数。
常染色体上的基因: P 1 2 B 1 2 A1A2 A3A4 S 同胞兄妹 3 1 2 A1A1 A2A2 A3A3 A4A4 4
F = 4 (1/2)4 = 1/4 4:表示基因数目 4:表示路经数 A1A1 A2A2 A3A3 A4A4 同胞兄妹 P 1 2 B 1 2 A1A2 A3A4 S 同胞兄妹 F = 4 (1/2)4 = 1/4 4:表示基因数目 4:表示路经数 A1A1 A2A2 A3A3 A4A4
兄妹婚配(一级亲属) A1A2 A3A4 一级亲属的近婚系数: F= 4 (1/2)4=1/4 S A1A1 A2A2 A3A3 A4A4
舅甥女婚配(二级亲属) 二级亲属的近婚系数: F= 4 (1/2)5=1/8 A1A2 A3A4 A1A1 A2A2 A3A3 A4A4 S A1A1 A2A2 A3A3 A4A4
半同胞婚配 A3A4 A1A2 A5A6 半同胞的近婚系数: F=2 (1/2)4=1/8 S A1A1 A2A2
女性有两条X染色体,可形成纯合子;男性只有一条X染色体,是个半合子。所以,只需计算女性的近婚系数F。 由于交叉遗传: 男性的X连锁基因一定传给女儿,传递概率为 1 男性的X连锁基因不会传给儿子,传递概率为 0
姨表兄妹婚配(三级亲属) 姨表兄妹的近婚系数: F =(1/2)3+2 (1/2)5 = 3/16 X1Y X2X3 X1X1 X2X2 S X1X1 X2X2 X3X3
舅表兄妹婚配(三级亲属) S X1Y X2X3 X2X2 X3X3 舅表兄妹的近婚系数: F=2(1/2)4= 1/8
姑表兄妹婚配(三级亲属) S X1Y X2X3 姑表兄妹的近婚系数 F = 0
堂表兄妹婚配(三级亲属) S X1Y X2X3 堂表兄妹的近婚系数 F = 0
四、随机遗传漂变 子女数目少,导致的等位基因频率产生 相当大的随机波动的现象。 随机遗传漂变(random genetic drift): 在一个小的群体中,由于所生育的 子女数目少,导致的等位基因频率产生 相当大的随机波动的现象。
随机遗传漂变 孤岛模型:假设有一对等位基因A和a,频率各为0.5 AA Aa Aa aa AA×AA aa×aa AA×AA AA×Aa
随机遗传漂变 所以遗传漂变导致某些等位基因的消失,另一些等位基因的固定,从而改变了群体的遗传结构。 25人 250人 2500人 世 代 数 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 世 代 数 25人 基因 A 的频率 2500人 250人 所以遗传漂变导致某些等位基因的消失,另一些等位基因的固定,从而改变了群体的遗传结构。
五、隔 离 由于自然条件或宗教、民族风俗习惯等因素所形成的isolation,使该群体与其他人群无基因交流,可以使纯合子的比例增加,产生类似于近亲婚配的遗传效应。
六、迁 移 migration 迁移压力(migration pressure)。 欧洲和西亚白人:tt→36% t→0.6 PTC 欧洲和西亚白人:tt→36% t→0.6 宁夏回族: tt→20% t→0.45 中国汉人: tt→9% t→0.3
第三节 遗传负荷 遗传负荷的估计:我国一般每个人平均带有5-6 个有害基因。 遗传负荷(Genetic laod):指在一个群体中, 第三节 遗传负荷 遗传负荷(Genetic laod):指在一个群体中, 由于致死基因(lethal gene)或有害基因的存在而使该群体适合度降低的现象。一般用群体中平均每个个体携带的有害基因的数量来表示。 遗传负荷的估计:我国一般每个人平均带有5-6 个有害基因。
重点知识回顾 基因频率和基因型频率及计算 遗传平衡定律 影响群体遗传平衡的因素 近婚系数的计算