第六章 群体遗传学
群体(popualtion)是指同一物种生活于某一地区并能相互杂交的个体群。人种大约50多亿的成员分为许多不同的亚群体,其中最大的通常称为种族(races)。不同的群体,作为大群体其基因库也是彼此不同的。人类有三个主要人种区分:高加索人.黑人各亚细亚人,但他们又都有许多遗传上不同的亚群,种与亚群体存在主要差异的遗传基础是突变。
群体遗传学(population genetics)是研究群体的遗传变化规律的学科,研究群体中基因的分布.基因频率和基因型频率的维持和变化的科学。医学研究群体遗传是要探讨遗传病的发病频率.遗传方式及其基因频率和变化的规律,从而了解遗传病在群体中的发生和散布的规律,为预防、监测和治疗遗传病提供重要的信息和措施。因此有人又称之为遗传流行病学(genetic epidemiology)。
第一节 群体中的遗传平衡
群体中的遗传基因和基因型需要保持平衡,才能保证人种的世代繁殖。而一个群体所具有的全部遗传信息,亦即含有在特定位点的全部等位基因称为基因库(gene pool)。个体的基因型只代表基因库的一小部分。在研究群体变化、群体中遗传病的变化时,需要了解遗传的发病率及其遗传性状,这就要了解某一基因的存在,分析并计算基因频率。
一、基因频率
基因频率(gene frequency)是指群体中某一基因的数量。基因频率也就是等位基因的频率。群体中某一特定基因的频率可以从基因频率(genotype frequency)来推算。如人们熟悉的人的MN血型,它是由一对共显性等位基因M和N所决定,产生3种基因型M/M、M/N和N/N,而相应的表型是M、MN和N,而且比例是1/4M、1/2MN和1/2N。这个原理可以推广到一般群体内婚配,如以群体中MN表型(基因型)的具体样本数被所观察到总数相除即可得到(转换)相对频率数。表6-1示某一群体的MN血型的相对基因频率,再用此观察到的相对来估算M和N在群体中等位基因的频率。该群体中总人数为1419人,其中M血型(基因型M/M)392人,N血型(基因型N/N)320人,MN血型(基因型M/N)707人,按此可直接推算出M的等位基因频率为:
2×392——707/1419×2=0.53
表6-1 某群体的MN血型的相对基因频率
表型 |
基因型 |
个体数 |
相对频率 |
M |
M/M |
392 |
0.276 |
N |
N/N |
320 |
0.226 |
MN |
M/N |
707 |
0.498 |
总计 |
1419 |
1.000 |
同样,N的基因频率为1-0.53=0.47。因为两个等位基因的相对频率相加必须等于1。换言之,设M的基因频率为p,N的基因频率为q,p+q=1(或100%)。所以,在研究一个等位基因在群体中的频率时,就要考虑到基因库。基因库实际上就是一个群体的全部等位基因。如果知道MN两个等位基因在基因库中的相对频率是0.53(M)和0.47(N),而群体中样本人数是1419,那么这3种组合的等位基因(基因型)的相对比例就得以知道。
即2M=0.53×0.53=0.281
2N=0.47×0.47=0.221
MN=(0.53×0.47)+(0.47×0.53)=0.498
上述例子以一般公式表示:p、q分别为两个等位基因频率,等位基因的3种组合的频率应为:
二、遗传平衡定律
表型、基因型和等位基因频率之间关系的一个重要原则就是基因型的比例在世代传递中不会改变。因此,群体中个体的等位基因频率的分布比例和基因型的分布比例(频率)世代维持恒定。这是群体遗传学的一个基本原则,是Hardy和Weinberg于1908年应用数学方法探讨群体中基因频率变化所得出的结论,即遗传平衡定律(又称Hardy Weinberg定律)。意即一个群体符合这种状况,即达到了遗传平衡,也就是一对等位基因的3种基因型的比例分布符合公式:p2+2pq+q2=1,p+q=1,(p+q)2=1.基因型MM的频率为p2,NN的频率为q2,MN的频率为2pq。MN:MN:NN=P2:2pq:q2。MN这对基因在群体中达此状态,就是达到了遗传平衡。如果没有达到这个状态,就是一个遗传不平衡的群体。但随着群体中的随机交配,将会保持这个基因频率和基因型分布比例,而较易达到遗传平衡状态。
1.遗传平衡的条件要维持群体的遗传平衡需要一定的条件,或者说这种遗传平衡受一些因素的影响。这些条件和因素是:①群体要很大,不会由于任何基因型传递而产生频率的随意或太大的波动;②必须是随机交配而不带选择交配;③没有自然选择,所有的基因型(在一个座位上)都同等存在,并有恒定的突变率,即由新突变来替代因死亡而丢失的突变等位基因;④不会因迁移而产生群体结构的变化。如果缺乏这些条件则不能保持群体的遗传平衡。
2.群体的遗传平衡和等位基因频率推算由于人类群体中大多数遗传性状都处于遗传平衡状态,据此可计算等位基因频率。如已知某种常染色体隐性遗传病(白化病)在一特定人群中频率,就能计算这个异常基因的携带者和基因频率。白化病发病(aa)(q2)的频率为1/10000,即其基因型频率,则致病基因(a)频率=[]=1/100=0.01;基因A的频率=1-0.01=0.99;而杂合子携带者的频率为2pq=2×99/100×1/100≈1/50。因此,在比例中,每个受累的个体将有200个左右在临床上无症状的携带者。
常染色体显性遗传病,如并指症,在一个群体多为杂合子(Aa)发病。杂合子(H)的频率为2pq,由于q值大,近于1,故H=2p,p=1/2H。因此,只要知道杂合子发病率,就易求得基因A的频率。如并指症的发病率为1/1000,H=1/2000,p=1/2H=1/4000,即致病基因A的频率为0.000025。
X连锁遗传性状也符合遗传平衡定律。因为女性中的基因频率及基因型频率分布和常染色体相同,而男性是半合子,其基因频率.基因型频率与表型频率相同,如表6-2所示。
表6-2 X连锁红绿色盲的基因型及基因频率
性别 |
基因型 |
表现型 |
基因型频率 |
发病率 |
男 |
XAY XaY |
正常 色盲 |
p q |
0.92 0.08 |
女 |
XAYA XAXa XaXa |
正常 正常 色盲 |
p2(纯合) 2pq(杂合) q2 |
(0.922)=0.846 2(0.92)(0.08)=0.147 (0.08)2=0.0064 |
至于罕见的常染色体隐性遗传病纯合子患者频率(q2)很低,所以2pq=2(1-q)q=2q-1q2=2q,即杂合子携带者频率(2pq)约为致病基因频率的2倍,故致病基因多以携带者的方式存在于一个群体中。在前述白化病中,发病率1/10000,q为0.01,携带者频率约为2q,即2×0.01=0.02(1/50)。