3S
  • Portfolio Top
  • Categories
  • Tags
  • Archives

分子進化学 第9回

第9回 2019/7/3

  • 大橋 順

突然変異の固定確率

  1. 対立遺伝子頻度変化の確率論的記述
  2. ヘテロ接合度の時間変化
  3. 固定確率の理論的導出

対立遺伝子頻度変化の確率論的記述

機械的遺伝的浮動(random genetic drift)

生物集団のサイズが有限であるため、配偶子選択の過程においてゆらぎが生じ、対立遺伝子頻度が世代毎に確率的に変動し、有限時間以内に必ず「固定」または「消失」が起きる。

ここで、「固定」または「消失」が起きると、その後は対立遺伝子頻度は変化しない。

そこで、「究極的固定確率」や「究極的消失確率」がどのように値になるのか?また、突然変異(対立遺伝子)が究極的に固定する確率はどの程度なのか?を考えるために、以下の二つのモデルがよく利用されている。

Wright-Fisherモデル

  • 世代は離散的(全固体が入れ替わる)
  • 任意婚
  • 親世代の各個体が、次世代の任意の子供の親である確率は等しい(\(1/N\))

総分散の定理

確率変数 \(Y\) の分散は、同一確率空間内の確率変数 \(X\) を条件づけることで以下の2つの要素の和に分解できる。

$$ \begin{aligned} \mathrm{V}[Y] &=\mathrm{E}[Y^2] - \mathrm{E}[Y]^2 = \mathrm{E}[\textcolor{orange}{\mathrm{E}[Y^2|X]}] - [\mathrm{E}[\mathrm{E}[Y|X]]]^2\\ &= \mathrm{E}[\textcolor{orange}{\mathrm{V}[Y|X] + \mathrm{E}[Y|X]^2}] - [\mathrm{E}[\mathrm{E}[Y|X]]]^2\\ &=\mathrm{E}[\mathrm{V}[Y|X]] + \mathrm{E}[\mathrm{E}[Y|X]^2] - [\mathrm{E}[\mathrm{E}[Y|X]]]^2\\ &= \mathrm{E[\mathrm{V}[Y|X]]} + \mathrm{V}[\mathrm{E}[Y|X]] \end{aligned} $$

1単位時間経過後の平均と分散

現在のAアリル頻度が \(p\)、aアリル頻度が \(q\) であるとき、1世代後の \(2N\) 個のコピー中にAが \(i\) 個含まれるとすると、\(i\) の期待値 \(\mathrm{E}[i]\) と分散 \(\mathrm{V}[i]\) は、

$$ \begin{aligned} \mathrm{E}[i] &= \sum_{i=0}^{2N}\left[i{{2N}\choose{i}} p^i(1-p)^{2N-i}\right]\\ &= 2Np\sum_{i=0}^{2N-1}\left[{{2N-1}\choose{i}} p^i(1-p)^{(2N-1)-i}\right]\\ &= 2Np \left[p + (1-p)\right]^{2N-1} = 2Np\\ \mathrm{E}[i(i-1)] &= \sum_{i=0}^{2N}\left[i(i-1){{2N}\choose{i}} p^i(1-p)^{2N-i}\right]\\ &= 2Np\sum_{i=0}^{2N-1}\left[(i-1){{2N-1}\choose{i}} p^i(1-p)^{(2N-1)-i}\right]\\ &= 2N(2N-1)p^2\sum_{i=0}^{2N-2}\left[{{2N-2}\choose{i}} p^i(1-p)^{(2N-2)-i}\right]\\ &= 2N(2N-1)p^2\left[p + (1-p)\right]^{2N-2} = 2N(2N-1)p^2\\ \mathrm{E}[i^2] &= \mathrm{E}[i(i-1) + i]\\ &= 2N(2N-1)p^2 + 2Np = 2Np\left\{1+(2N-1)p\right\}\\ \mathrm{V}[i] &= \mathrm{E}[i^2] - \mathrm{E}[i]^2 = 2Np(1-p) \end{aligned} $$

世代 \(t\) における平均

上記の結果から、世代 \(t-1\) においてAアリルの個数が \(i_{t-1}\) 個(Aの頻度が \(p_{t-1}\))であるとき、1世代後のAの個数 \(i_t\) の期待値は、

$$\mathrm{E}[i_t] = \mathrm{E}[\mathrm{E}[i_t|i_{t-1}]] = \mathrm{E}[2Np_{t-1}] = \mathrm{E}[2N\times(i_{t-1}/2N)] = \mathrm{E}[i_{t-1}]$$

なので、これを繰り返すことで、\(\mathrm{E}[i_t] = \mathrm{E}[i_0] = i_0\) となり、初期の個数 \(i_0\) と一致する。つまり、

$$\mathrm{E}[p_t] = p_0$$

であり、期待頻度は経過時間に依らず、初期頻度と同じ(一定)である。

世代 \(t\) における分散

世代 \(t\) におけるAの個数 \(i_t\) 分散は、

$$ \begin{aligned} \mathrm{V}[i_t] &=\mathrm{E}\left[\mathrm{V}\left[i_{t} | i_{t-1}\right]\right]=\mathrm{E}\left[\mathrm{E}\left[i_{t}^{2} | i_{t-1}\right]-\mathrm{E}\left[i_{t} | i_{t-1}\right]^{2}\right]\\ &= \mathrm{E}\left[\mathrm{E}\left[i_{t}^{2} | i_{t-1}\right]\right]-\mathrm{E}\left[\mathrm{E}\left[i_{t} | i_{t-1}\right]^{2}\right]\\ &=\mathrm{E}\left[\mathrm{E}\left[i_{t}^{2} | i_{t-1}\right]\right]-\mathrm{E}\left[i_{0}^{2}\right]=\mathrm{E}\left[\mathrm{E}\left[i_{t}^{2} | i_{t-1}\right]\right]-i_{0}^{2} \end{aligned} $$

ここで、

$$ \begin{aligned} \mathrm{\mathrm{E}}\left[\mathrm{\mathrm{E}}\left[i_{t}^{2} | i_{t-1}\right]\right] &=\textcolor{red}{\mathrm{\mathrm{E}}\left[\mathrm{\mathrm{\mathrm{V}}}\left[i_{t} | i_{t-1}\right]+\mathrm{\mathrm{E}}\left[i_{t} | i_{t-1}\right]^{2}\right]}(\because \text{条件付き分散})\\ &=\mathrm{E}\left[2Np_{t-1}(1-p_{t-1}) + i_{t-1}^2 \right]\\ &=\textcolor{blue}{\mathrm{E}\left[i_{t-1}^{2}\right]}\left(1-1 / 2N\right)+\textcolor{green}{\mathrm{E}\left[i_{t-1}\right]} \end{aligned} $$

であるので、

$$ \begin{aligned} \mathrm{V}\left[i_{t}\right]+i_{0}^{2} &=\textcolor{blue}{\left\{\mathrm{V}\left[i_{t-1}\right]+i_{0}^{2}\right\}}\left(1-1/2N\right)+\textcolor{green}{i_{0}}\\ &=\mathrm{V}\left[i_{t-1}\right]\left(1-1/ 2N\right)+i_{0}^{2}-i_{0}^{2} / 2N+i_{0}\\ \mathrm{V}\left[i_{t}\right]-i_{0}\left(2N-i_{0}\right) &=\left(1-1 / 2N\right)\left\{\mathrm{V}\left[i_{t-1}\right]-i_{0}\left(2N-i_{0}\right)\right\} \end{aligned} $$

ここで、\(\mathrm{V}[i_0] = 0\) に注意してこの漸化式を解くと、

$$\mathrm{V}\left[i_{t}\right]=i_{0}\left(2N-i_{0}\right)\left\{1-\left(1-1 / 2N\right)^{t}\right\}$$

頻度に変換するために両辺を \((2N)^2\) で割ると、

$$ \begin{aligned} \mathrm{V}\left[i_{t}\right] / (2N)^{2} &=\left(i_{0} / 2N\right)\left(1-i_{0} / 2N\right)\left\{1-\left(1-1 /2 N\right)^{t}\right\} \\ \mathrm{V}\left[i_{t} / 2N\right] &=\left(i_{0} / 2N\right)\left(1-i_{0} / 2N\right)\left\{1-\left(1-1 /2 N\right)^{t}\right\} \end{aligned} $$

以上より、

$$\mathrm{V}\left[p_{t}\right]=p_{0}\left(1-p_{0}\right)\left\{1-\left(1-\frac{1}{2N}\right)^{t}\right\}$$

このことから、Aアリル頻度の分散は時間経過と共に大きくなり、\(t\rightarrow\infty\) で \(\mathrm{V}[p_t] = p_0(1-p_0)\) になることがわかる。

なお、初期頻度 \(p_0\) のAアリルを持つ個体が - 固定する(頻度が1になる)確率は \(p_0\) - 消失する(頻度が0になる)確率は \(1-p_0\)

である。

Moranモデル

  • 個体数 \(N\) の一倍体の生物
  • 単位時間あたり、無作為に選ばれた1個体が子供を産み、無作為に選ばれた1個体が死亡する。(同一個体が子供を残し死亡することもある)
  • Aアリルを持つ個体数が \(i\)、aアリルを持つ個体数が \(N-i\)

\(p=i/N\) として、単位時間経過後に \(i\) が \(j\) になる確率 \(P_{ij}\)

$$P_{ij} = \begin{cases} p(1-p), & \text{if}\ j=i+1 \\ (1-p)p, & \text{if}\ j=i-1 \\ p^2 + (1-p)^2, & \text{if}\ j=i \\ \end{cases} $$

1単位時間経過後の平均と分散

現在のAアリルを持つ個体数が \(i(=Np)\) のとき、1単位時間経過後のAアリルを持つ個体数 \(j\) の期待値 \(\mathrm{E}[j]\) と分散 \(\mathrm{V}[j]\) は、

$$ \begin{aligned} \mathrm{E}[j] &= (Np+1)p(1-p) + (Np-1)(1-p)p + Np\left(p^2 + (1-p)^2\right)\\ &= Np = i\\ \mathrm{V}[j] &= (Np+1-\mathrm{E}[j])^2p(1-p) + (Np-1-\mathrm{E}[j])^2(1-p)p\\ &+ (Np-\mathrm{E}[j])^2\left(p^2 + (1-p)^2\right) = 2p(1-p)\\ &= 2(i/N)(1-i/N)\\ \mathrm{E}[j^2] &= \mathrm{V}[j] + \mathrm{E}[j]^2 = 2p(1-p) + N^2p^2\\ &= 2\left(\frac{i}{N}\right)\left(1-\frac{i}{N}\right) + i^2 \end{aligned} $$

時間 \(t\) における平均

上記の結果から、世代 \(t-1\) においてAアリルを持つ個体数が \(i_{t-1}\)(Aアリルの頻度が \(p_t\))であるとき、1世代後のAアリルを持つ個体数 \(i_t\) の期待値は、

$$\mathrm{E}[i_t] = \mathrm{E}[\mathrm{E}[i_t|i_{t-1}]] = \mathrm{E}[N\times(i_{t-1}/N)] = \mathrm{E}[i_{t-1}]$$

なので、これを繰り返すことで、\(\mathrm{E}[i_t] = \mathrm{E}[i_0] = i_0\) となり、初期のAアリルを持つ個体数 \(i_0\) と一致する。つまり、

$$\mathrm{E}[p_t] = p_0$$

であり、期待頻度は経過時間に依らず、初期頻度と同じ(一定)である。

時間 \(t\) における分散

時間 \(t\) におけるAアリルを持つ個体数の分散は、以下で求められる。

$$ \mathrm{V}[i_t] =\mathrm{E}\left[\mathrm{E}\left[i_{t}^{2} | i_{t-1}\right]\right]-i_{0}^{2} $$

ここで、

$$ \begin{aligned} \mathrm{\mathrm{E}}\left[\mathrm{\mathrm{E}}\left[i_{t}^{2} | i_{t-1}\right]\right] &=\textcolor{red}{\mathrm{\mathrm{E}}\left[\mathrm{\mathrm{\mathrm{V}}}\left[i_{t} | i_{t-1}\right]+\mathrm{\mathrm{E}}\left[i_{t} | i_{t-1}\right]^{2}\right]}(\because \text{条件付き分散})\\ &=\mathrm{E}\left[2 \times\left(i_{t-1} / N\right) \times\left(1-\left(i_{t-1} / N\right)\right)+i_{t-1}^{2}\right]\\ &=\textcolor{blue}{\mathrm{E}\left[i_{t-1}^{2}\right]}\left(1-2 / N^{2}\right)+2 \textcolor{green}{\mathrm{E}\left[i_{t-1}\right]} / N \end{aligned} $$

であるので、

$$ \begin{aligned} \mathrm{V}\left[i_{t}\right]+i_{0}^{2} &=\textcolor{blue}{\left\{\mathrm{V}\left[i_{t-1}\right]+i_{0}^{2}\right\}}\left(1-2 / N^{2}\right)+\textcolor{green}{2 i_{0}} / N \\ &=\mathrm{V}\left[i_{t-1}\right]\left(1-2 / N^{2}\right)+i_{0}^{2}-2 i_{0}^{2} / N^{2}+2 i_{0} / N\\ \mathrm{V}\left[i_{t}\right]-i_{0}\left(N-i_{0}\right) &=\left(1-2 / N^{2}\right)\left\{\mathrm{V}\left[i_{t-1}\right]-i_{0}\left(N-i_{0}\right)\right\} \end{aligned} $$

ここで、\(\mathrm{V}[i_0] = 0\) に注意してこの漸化式を解くと、

$$\mathrm{V}\left[i_{t}\right]=i_{0}\left(N-i_{0}\right)\left\{1-\left(1-2 / N^{2}\right)^{t}\right\}$$

頻度に変換するために両辺を \(N^2\) で割ると、

$$ \begin{aligned} \mathrm{V}\left[i_{t}\right] / N^{2} &=\left(i_{0} / N\right)\left(1-i_{0} / N\right)\left\{1-\left(1-2 / N^{2}\right)^{t}\right\} \\ \mathrm{V}\left[i_{t} / N\right] &=\left(i_{0} / N\right)\left(1-i_{0} / N\right)\left\{1-\left(1-2 / N^{2}\right)^{t}\right\} \end{aligned} $$

以上より、

$$\mathrm{V}\left[p_{t}\right]=p_{0}\left(1-p_{0}\right)\left\{1-\left(1-\frac{2}{N^2}\right)^{t}\right\}$$

このことから、Aアリルを持つ個体頻度の分散は時間経過と共に大きくなり、\(t\rightarrow\infty\) で \(\mathrm{V}[p_t] = p_0(1-p_0)\) になることがわかる。

なお、Wright-Fisherモデルと同様に、初期頻度 \(p_0\) のAアリルを持つ個体が - 固定する(頻度が1になる)確率は \(p_0\) - 消失する(頻度が0になる)確率は \(1-p_0\)

である。

ヘテロ接合度の時間変化

ヘテロ接合度

ある集団中における、

  • アリルAの対立遺伝子頻度を \(p\)
  • アリルaの対立遺伝子頻度を \(q\)

とおく。\((p+q=1)\)

ハーディ・ワインバーグ平衡にあると仮定した場合のヘテロ接合体の期待頻度 \(2pq\) をヘテロ接合度 \(H\) という。(※ ヘテロ接合体の観察頻度ではないことに注意!!)

Wright-Fisherモデル

世代 \(t\) におけるヘテロ接合度は \(H_t=2p_t(1-p_t)\) である。

ここで、Wright-Fisherモデルでは \(\mathrm{E}[p_t] = p_0\) と、期待頻度が経過時間に依らず、一定であるから、次世代の \(H\) の期待値 \(H_{t+1}\) は、

$$ \begin{aligned} \mathrm{E}[H_{t+1}] &= \mathrm{E}[2p_t(1-p_t)]\\ &= \mathrm{E}[2\times i/2N\times (2N-i)/2N]\\ &= 2\mathrm{E}[i]/2N - \textcolor{blue}{2\mathrm{E}[i^2]}/(2N)^2\\ &= 2p - \textcolor{blue}{4Np\{1+(2N-1)p\}}/(2N)^2\qquad(\because \text{上で計算済み})\\ &= 2p_t(1-p_t)(1-1/2N) = H_t(1-1/2N) \end{aligned} $$

ヘテロ接合度の初期値を \(H_0\) とすると、\(\mathrm{E}[H_t] = H_0(1-1/2N)^t\) であるので、機械的浮動があることでヘテロ接合度は毎世代 \((1-1/2N)\) 倍に減少することがわかる。

Moranモデル

Moranモデルでは1倍体を考えているので、ヘテロ接合度 \(H\) とは、\(N\) 個体からなる集団から復元抽出で無作為にとった \(2\) 個体が異なるアリルを持つ確率のことである。

\(p_t=j/N\) として、\(1\) 単位時間経過後の \(H\) の期待値 \(H_{t+1}\) は、

$$ \begin{aligned} \mathrm{E}[H_{t+1}] &= \mathrm{E}[2\times j/N\times (N-j)/N]\\ &= 2\mathrm{E}[j]/N-\textcolor{blue}{2\mathrm{E}[j^2]/N^2}\\ &= 2p - \textcolor{blue}{\{4p(1-p)/N^2 + 2p^2\}}\qquad(\because \text{上で計算済み})\\ &= 2p_t(1-p_t)(1-2/N^2) = H_t(1-2/N^2) \end{aligned} $$

ヘテロ接合度の初期値を \(H_0\) とすると、\(\mathrm{E}[H_t] = H_0(1-2/N^2)^t\) であるので、機械的浮動があることでヘテロ接合度は毎世代 \((1-2/N^2)\) 倍に減少することがわかる。

固定確率の理論的導出

Wright-Fisherモデル

上の議論により、ヘテロ接合度のは \(\mathrm{E}[H_t] = H_0(1-1/2N)^t\) で表されるので、\(t\rightarrow\infty\) で、\(\mathrm{E}[H_t]=2p_tq_t=0\) になることがわかる。

つまり、初期頻度によらず以下が起こる。 - \(p_t=0\)(Aアリルが消滅) - \(q_t=0\)(Aアリルが固定)

ここで、「初期頻度 \(p\) の対立遺伝子が固定する確率 \(u(p)\)」を求めることを考える。

1世代後に頻度 \(p\) から頻度 \(p+\Delta p\) に変化する確率を \(t(\Delta p)\) とおくと、(\(\sum_{\Delta p}t(\Delta p) = 1\))

$$u(p) = \sum_{\Delta p}t(\Delta p)u(p+\Delta p)$$

となる。ここで、Taylor展開によって \(\Delta p\) の3次以上の項を無視すると、

$$ \begin{aligned} u(p) &= \sum_{\Delta p}t(\Delta p)\textcolor{blue}{u(p+\Delta p)}\\ &= \sum_{\Delta p}t(\Delta p)\textcolor{blue}{\left\{u(p)+u'(p)\Delta p + (1/2)u''(p)(\Delta p)^2\right\}}\\ &= u(p) + u'(p)\mathrm{E}[\Delta p] + (1/2)u''(p)\mathrm{E}[(\Delta p)^2] \end{aligned}$$

以上より、以下の式が成立することがわかる。

$$(1/2)u''(p)\textcolor{green}{\mathrm{E}[(\Delta p)^2]} + u'(p)\textcolor{blue}{\mathrm{E}[\Delta p]} = 0\ \cdots(\ast)$$

自然選択上中立の場合

自然選択に置いて、適応度に差がない場合を考える。すると、

$$ \begin{aligned} \textcolor{blue}{\mathrm{E}[\Delta p]} &= \mathrm{E}[i/2N-p] = (1/2N)\mathrm{E}[i]-\mathrm{E}[p] = (1/2N)\cdot2Np-p = 0\\ \textcolor{green}{\mathrm{E}[(\Delta p)^2]} &= \mathrm{V}[\Delta p] + \textcolor{blue}{\mathrm{E}[\Delta p]}^2 = \mathrm{V}[\Delta p] = \mathrm{V}[i/2N-p] \\ &= \mathrm{V}[i/2N] = 2Np(1-p) / (2N)^2 = p(1-p)/N \end{aligned} $$

これらを \((\ast)\) に代入すると、\(u(p)=Cp\ (C:\mathrm{const.})\) であり、\(u(0)=0,u(1)=1\) より、\(C=1\) とわかる。したがって、\(u(p) = p\) である。

すなわち、初期頻度が \(1/2N\) で自然選択上中立(selectively natural)な突然変異が固定する確率 \(u_n\) は、\(u_n= 1/2N\) である。

自然選択上中立ではない場合

各遺伝子型に以下の適応度の差がある場合を考える。

AA Aa aa
\(1\) \(1-s/2\) \(1-s\)

すると、決定論的方程式から \(\mathrm{E}[\Delta p] = (s/2)p(1-p)\) がわかるので、

$$ \begin{aligned} \textcolor{blue}{\mathrm{E}[\Delta p]} &= (s/2)p(1-p)\\ \textcolor{green}{\mathrm{E}[(\Delta p)^2]} &= \mathrm{V}[\Delta p] + \textcolor{blue}{\mathrm{E}[\Delta p]}^2 = \mathrm{V}[i/2N-p] + \mathrm{E}[\Delta p]^2\\ &= (1/2N)^2\mathrm{V}[i] + \mathrm{V}[p] + (s/2)^2p^2(1-p)^2\\ &= (1/2N)^2 \times 2N(p+\Delta p)(1-p-\Delta p) + (s/2)^2p^2(1-p)^2 \\ &\fallingdotseq p(1-p)/2N \end{aligned} $$

これらを \((\ast)\) に代入すると、

$$ \begin{aligned} (1/2)u''(p)\textcolor{green}{p(1-p)/2N} + u'(p)\textcolor{blue}{(s/2)p(1-p)} &= 0\\ u''(p) + u'(p)\cdot2Ns &= 0\\ [u'(p)\exp(2Nsp)]' &= 0 \\ u'(p) &= C\exp(-2Nsp)\\ \therefore u(p) &= C_1\exp(-2Nsp) + C_2 \end{aligned}$$

ここで、\(u(0)=0,u(1)=1\) より、\(u(p) = (1-e^{-2Nsp})/(1-e^{-2Ns})\) となる。

すなわち、初期頻度が \(1/2N\) でヘテロだと \(s/2\)、ホモだと \(s\) 有利な突然変異が固定する確率 \(u_s\) は、\(u_s= (1-e^{-s})/(1-e^{-2Ns})\) である。


  • « シークエンス解析実習1
  • シークエンス解析実習2 »
hidden
Table of Contents
Published
Jul 3, 2019
Last Updated
Jul 3, 2019
Category
分子進化学
Tags
  • 3S 95
  • 分子進化学 13
Contact
Other contents
  • Home
  • Blog
  • Front-End
  • Kerasy
  • Python-Charmers
  • Translation-Gummy
    • 3S - Shuto's Notes
    • MIT
    • Powered by Pelican. Theme: Elegant