第2回 2019/4/17
- 講師:大橋 順
ハーディ・ワインバーグ平衡
概要
- 多型とハーディ・ワインバーグ平衡
- ハーディ・ワインバーグ平衡からずれる要因
- 仮説検定
- カイ2乗検定とHWE検定
- 尤度比検定とHWE検定
1. 多型とハーディ・ワインバーグ平衡
ハーディ・ワインバーグ平衡(Hardy-Weinberg equilibrium; HWE)とは、「任意交配を行う二倍体集団で観察される遺伝子頻度の平衡状態」のこと。この状態下では、世代交代後も遺伝子頻度と遺伝子型頻度が一定に保たれる。
一般に、対立遺伝子 \(A_i\) の頻度を \(p_i\) とすると以下のように与えられる。
- 遺伝子型 \(A_iA_i\) の頻度は \(p_i^2\)
- 遺伝子型 \(A_iA_j\) の頻度は \(2p_ip_j\)
2. ハーディ・ワインバーグ平衡からずれる要因
近交係数(inbreeding coefficient)
近交係数(inbreeding coefficient)は、近親交配の度合いを表す数値である。固定指数(fixation index)とも呼び、それを略して \(F\) 値とも言われる。
近交係数は、「ある個体の持つ2つの相同遺伝子(つまり、その個体を作った2つの配偶子の遺伝子)が、共通祖先の同一遺伝子に由来する確率」と定義され、以下の式で表される。
なお、親世代中の各遺伝子型の頻度を以下のように表す。
- \(AA\) の頻度を \(P\)
- \(Aa\) の頻度を \(Q\)
- \(aa\) の頻度を \(R\)
この時、親世代中の \(A\) と \(a\) の対立遺伝子頻度は以下のように表される。
- \(A\) 対立遺伝子頻度 \(p\) は \(p=P+Q/2\)
- \(a\) 対立遺伝子頻度 \(q\) は \(p=P+Q/2\)
したがって、期待される子供の各遺伝子頻度は、以下で表される。
- \(AA\) の頻度は \((P+Q/2)^2=p^2\)
- \(Aa\) の頻度は \(2(P+Q/2)(Q/2+R)=2pq\)
- \(aa\) の頻度は \((Q/2+R)^2=q^2\)
ゆえに、\(F\) は、「HWEが成立する場合の \(Aa\) 遺伝子型頻度の期待頻度 \(2pq\) から観察頻度 \(Q\) がどの程度ずれているかを、期待頻度の大きさで標準化した指標」である。
同類交配(assortative mating)
同類交配(assortative mating)とは、「似た表現型を持つ個体同士が、任意交配で予想されるよりも頻繁に相互に交配すること」である。
ある形質の表現型が2つの対立遺伝子を持つ一遺伝子座によって完全に決定され、同じ表現型の個体同士のみが交配すると仮定する。
すると、ホモ接合体の観察頻度が期待頻度よりも大きくなる。(\(F>0\))
近親交配(inbreeding)
同一家庭内の個体(近親者)同士が、任意交配で予想されるよりも頻繁に相互に交配すると、ホモ接合体の観察頻度が期待頻度よりも大きくなる(∵ \(AA\) と \(aa\) の子孫はそれぞれ親と同じ、\(Aa\) の子孫も一定確率で \(AA\) と \(Aa\) になる。)
自然選択
遺伝子型によって生存確率が異なると、子供時点ではHWE状態にあった遺伝子型頻度が、成体になった時にはHWE状態からずれる。
ハーディ・ワインバーグの条件
ハーディ・ワインバーグ条件は、以下の理想的な(単純な)条件下でのみ成立する。
- 交配が任意である。(任意交配)
- 集団が十分大きい。(無限大)
- 突然変異が起きない。(無突然変異)
- 他の集団との個体の移動がない。(無移動)
- 異なる遺伝子型で、生存力や妊性に相違がない。(無選択)
3. 仮説検定
統計学的検定では、「観察値(データ)」と「帰無仮説の下での期待値」とのズレを評価する。
- 観察データを、「検定統計量」という一つの指標に要約する。(ズレが大きくなるほど大きくなる確率変数)
- 帰無仮説下で期待される検定統計量の確率分布を元に、「観察された検定統計量以上の検定統計量が得られる確率(p値)」を計算する。つまり、p値は偽陽性確率。
- 得られたp値と事前に設定した有意水準とを比較し、有意水準よりもp値が小さければ(今回の観察が起こり得る確率は極めて起こりにくいということなので)、観察値と期待値には統計学上有意な差があり、帰無仮説を棄却する。
なお、仮説検定の対象となるのは帰無仮説で、仮説検定により帰無仮説が棄却されれば、対立仮説が支持される。
また、帰無仮説が棄却されなかったといっても必ずしも帰無仮説として述べられた内容が正しいということにはならず、「判定を保留する」という判断を行う。(サンプルサイズを増やしたら結果変わるかもしれないから)
4. カイ2乗検定とHWE検定
ここで導出したカイ二乗分布を用いて、ハーディ・ワインバーグの平衡検定を行うことができる。
5. 尤度比検定とHWE検定
尤度比検定(likelihood ratio test)とは、尤度比(帰無仮説と対立仮説における尤度の比)の対数値に \(-2\) をかけた値がカイ二乗分布に従うことを利用した検定方法である。
具体的には、
- パラメータ数 \(\theta_1\) の単純なモデル1(帰無モデル)の尤度関数を \(L_1\)
- パラメータ数 \(\theta_2\) のより複雑なモデル2(対立モデル)の尤度関数を \(L_2\)(ここで、\(\theta_2>\theta_1\))
とし、各モデルの最尤推定値を代入した尤度比の自然対数をとって \(-2\) をかけた
が、帰無仮説の下で自由度 \(\theta_2-\theta_1\) のカイ二乗分布に漸近的に従うことを利用する。
ハーディ・ワインバーグ平衡検定
以下のような遺伝子型頻度の分布が得られたとする。
AA | Aa | aa | |
---|---|---|---|
観察値 | 30 | 40 | 20 |
上の表に対して、以下の2つのモデルを考える。
- 調べた集団はハーディ・ワインバーグ平衡(HWE)にある。
- 調べた集団はハーディ・ワインバーグ平衡(HWE)にはない。
ここで、モデル1では、「各遺伝子型頻度はAの対立頻度pのみによって記述できる」と考え、モデル2では「AAとAaの遺伝子型頻度PとQによって記述できる」と考える。
- モデル1に従う場合
表のようなデータが得られる尤度 \(L_1\) は、
$$L_1 = (p^2)^{30}\{2p(1-p)\}^{40}\{(1-p)^2\}^{30}$$で与えられ、\(p=0.5\) のときに \(L_1\) は最大値 \(L_{1m}\) をとる。
- モデル2に従う場合
$$L_2 = P^{30}Q^{40}(1-P-Q)^{30}$$で与えられ、\(P=0.3,Q=0.4\) のときに \(L_2\) は最大値 \(L_{2m}\) をとる。
帰無仮説のもとで、\(G=-2\ln(L_{1m}/L_{2m})\) の値は漸近的に自由度 \(2-1=1\) の \(\chi^2\) 分布に従うことが期待される。
\(G=4.027>3.841\) より、有意水準5%で帰無仮説を棄却し、「調べた集団はハーディ・ワインバーグ平衡にはない」と結論付けられる。