第9回 2019/7/3
突然変異の固定確率
対立遺伝子頻度変化の確率論的記述
機械的遺伝的浮動(random genetic drift)
生物集団のサイズが有限であるため、配偶子選択の過程においてゆらぎが生じ、対立遺伝子頻度が世代毎に確率的に変動し、有限時間以内に必ず「固定」または「消失」が起きる。
ここで、「固定」または「消失」が起きると、その後は対立遺伝子頻度は変化しない。
そこで、「究極的固定確率」や「究極的消失確率」がどのように値になるのか?また、突然変異(対立遺伝子)が究極的に固定する確率はどの程度なのか?を考えるために、以下の二つのモデルがよく利用されている。
Wright-Fisherモデル
- 世代は離散的(全固体が入れ替わる)
- 任意婚
- 親世代の各個体が、次世代の任意の子供の親である確率は等しい(\(1/N\))
総分散の定理
確率変数 \(Y\) の分散は、同一確率空間内の確率変数 \(X\) を条件づけることで以下の2つの要素の和に分解できる。
1単位時間経過後の平均と分散
現在のAアリル頻度が \(p\)、aアリル頻度が \(q\) であるとき、1世代後の \(2N\) 個のコピー中にAが \(i\) 個含まれるとすると、\(i\) の期待値 \(\mathrm{E}[i]\) と分散 \(\mathrm{V}[i]\) は、
世代 \(t\) における平均
上記の結果から、世代 \(t-1\) においてAアリルの個数が \(i_{t-1}\) 個(Aの頻度が \(p_{t-1}\))であるとき、1世代後のAの個数 \(i_t\) の期待値は、
なので、これを繰り返すことで、\(\mathrm{E}[i_t] = \mathrm{E}[i_0] = i_0\) となり、初期の個数 \(i_0\) と一致する。つまり、
であり、期待頻度は経過時間に依らず、初期頻度と同じ(一定)である。
世代 \(t\) における分散
世代 \(t\) におけるAの個数 \(i_t\) 分散は、
ここで、
であるので、
ここで、\(\mathrm{V}[i_0] = 0\) に注意してこの漸化式を解くと、
頻度に変換するために両辺を \((2N)^2\) で割ると、
以上より、
このことから、Aアリル頻度の分散は時間経過と共に大きくなり、\(t\rightarrow\infty\) で \(\mathrm{V}[p_t] = p_0(1-p_0)\) になることがわかる。
なお、初期頻度 \(p_0\) のAアリルを持つ個体が - 固定する(頻度が1になる)確率は \(p_0\) - 消失する(頻度が0になる)確率は \(1-p_0\)
である。
Moranモデル
- 個体数 \(N\) の一倍体の生物
- 単位時間あたり、無作為に選ばれた1個体が子供を産み、無作為に選ばれた1個体が死亡する。(同一個体が子供を残し死亡することもある)
- Aアリルを持つ個体数が \(i\)、aアリルを持つ個体数が \(N-i\)
\(p=i/N\) として、単位時間経過後に \(i\) が \(j\) になる確率 \(P_{ij}\)
1単位時間経過後の平均と分散
現在のAアリルを持つ個体数が \(i(=Np)\) のとき、1単位時間経過後のAアリルを持つ個体数 \(j\) の期待値 \(\mathrm{E}[j]\) と分散 \(\mathrm{V}[j]\) は、
時間 \(t\) における平均
上記の結果から、世代 \(t-1\) においてAアリルを持つ個体数が \(i_{t-1}\)(Aアリルの頻度が \(p_t\))であるとき、1世代後のAアリルを持つ個体数 \(i_t\) の期待値は、
なので、これを繰り返すことで、\(\mathrm{E}[i_t] = \mathrm{E}[i_0] = i_0\) となり、初期のAアリルを持つ個体数 \(i_0\) と一致する。つまり、
であり、期待頻度は経過時間に依らず、初期頻度と同じ(一定)である。
時間 \(t\) における分散
時間 \(t\) におけるAアリルを持つ個体数の分散は、以下で求められる。
ここで、
であるので、
ここで、\(\mathrm{V}[i_0] = 0\) に注意してこの漸化式を解くと、
頻度に変換するために両辺を \(N^2\) で割ると、
以上より、
このことから、Aアリルを持つ個体頻度の分散は時間経過と共に大きくなり、\(t\rightarrow\infty\) で \(\mathrm{V}[p_t] = p_0(1-p_0)\) になることがわかる。
なお、Wright-Fisherモデルと同様に、初期頻度 \(p_0\) のAアリルを持つ個体が - 固定する(頻度が1になる)確率は \(p_0\) - 消失する(頻度が0になる)確率は \(1-p_0\)
である。
ヘテロ接合度の時間変化
ヘテロ接合度
ある集団中における、
- アリルAの対立遺伝子頻度を \(p\)
- アリルaの対立遺伝子頻度を \(q\)
とおく。\((p+q=1)\)
ハーディ・ワインバーグ平衡にあると仮定した場合のヘテロ接合体の期待頻度 \(2pq\) をヘテロ接合度 \(H\) という。(※ ヘテロ接合体の観察頻度ではないことに注意!!)
Wright-Fisherモデル
世代 \(t\) におけるヘテロ接合度は \(H_t=2p_t(1-p_t)\) である。
ここで、Wright-Fisherモデルでは \(\mathrm{E}[p_t] = p_0\) と、期待頻度が経過時間に依らず、一定であるから、次世代の \(H\) の期待値 \(H_{t+1}\) は、
ヘテロ接合度の初期値を \(H_0\) とすると、\(\mathrm{E}[H_t] = H_0(1-1/2N)^t\) であるので、機械的浮動があることでヘテロ接合度は毎世代 \((1-1/2N)\) 倍に減少することがわかる。
Moranモデル
Moranモデルでは1倍体を考えているので、ヘテロ接合度 \(H\) とは、\(N\) 個体からなる集団から復元抽出で無作為にとった \(2\) 個体が異なるアリルを持つ確率のことである。
\(p_t=j/N\) として、\(1\) 単位時間経過後の \(H\) の期待値 \(H_{t+1}\) は、
ヘテロ接合度の初期値を \(H_0\) とすると、\(\mathrm{E}[H_t] = H_0(1-2/N^2)^t\) であるので、機械的浮動があることでヘテロ接合度は毎世代 \((1-2/N^2)\) 倍に減少することがわかる。
固定確率の理論的導出
Wright-Fisherモデル
上の議論により、ヘテロ接合度のは \(\mathrm{E}[H_t] = H_0(1-1/2N)^t\) で表されるので、\(t\rightarrow\infty\) で、\(\mathrm{E}[H_t]=2p_tq_t=0\) になることがわかる。
つまり、初期頻度によらず以下が起こる。 - \(p_t=0\)(Aアリルが消滅) - \(q_t=0\)(Aアリルが固定)
ここで、「初期頻度 \(p\) の対立遺伝子が固定する確率 \(u(p)\)」を求めることを考える。
1世代後に頻度 \(p\) から頻度 \(p+\Delta p\) に変化する確率を \(t(\Delta p)\) とおくと、(\(\sum_{\Delta p}t(\Delta p) = 1\))
となる。ここで、Taylor展開によって \(\Delta p\) の3次以上の項を無視すると、
以上より、以下の式が成立することがわかる。
自然選択上中立の場合
自然選択に置いて、適応度に差がない場合を考える。すると、
これらを \((\ast)\) に代入すると、\(u(p)=Cp\ (C:\mathrm{const.})\) であり、\(u(0)=0,u(1)=1\) より、\(C=1\) とわかる。したがって、\(u(p) = p\) である。
すなわち、初期頻度が \(1/2N\) で自然選択上中立(selectively natural)な突然変異が固定する確率 \(u_n\) は、\(u_n= 1/2N\) である。
自然選択上中立ではない場合
各遺伝子型に以下の適応度の差がある場合を考える。
AA | Aa | aa |
---|---|---|
\(1\) | \(1-s/2\) | \(1-s\) |
すると、決定論的方程式から \(\mathrm{E}[\Delta p] = (s/2)p(1-p)\) がわかるので、
これらを \((\ast)\) に代入すると、
ここで、\(u(0)=0,u(1)=1\) より、\(u(p) = (1-e^{-2Nsp})/(1-e^{-2Ns})\) となる。
すなわち、初期頻度が \(1/2N\) でヘテロだと \(s/2\)、ホモだと \(s\) 有利な突然変異が固定する確率 \(u_s\) は、\(u_s= (1-e^{-s})/(1-e^{-2Ns})\) である。