3S
  • Portfolio Top
  • Categories
  • Tags
  • Archives

分子進化学 課題回答

課題の解答

大橋 順准教授の講義で取り扱った課題の解答を作成したので挙げる。

課題1

問題 解答

課題2

  • 常染色体、X染色体、Y染色体をA,X,Yと略記する。
  • 男性の突然変異率が女性の突然変異率の \(a\) 倍であるとする。(突然変異率は生殖細胞の分裂数に比例するので、\(a\) = 「精子の分裂数/卵の分裂数」に等しい)

  • 各染色体の突然変異率は以下のようにかける。

    $$ \begin{cases} \begin{aligned} \mathrm{MA} &= \mathrm{MA♂} + \mathrm{MA♀}\\ &\propto (1/2)\times a + (1/2)\times 1\\ &=(a+1)/2\\ \mathrm{MX} &= \mathrm{MX♂} + \mathrm{MX♀}\\ &\propto (1/3)\times a + (2/3)\times 1\\ &=(a+2)/3\\ \mathrm{MY} &= \mathrm{MY♂}\\ &\propto 1\times a\\ &=a\\ \end{aligned} \end{cases} $$
    ここで、
    $$\mathrm{MA}:\mathrm{MY} = \frac{a+1}{2}:a= 1.2:1.7$$
    より、\(a=\frac{17}{7}\)

  • $$\mathrm{MX} = 1.7\times\frac{(a+2)/3}{a} = \frac{31}{30}$$

課題3

  1. $$p=\frac{40\times2+40}{100\times2} = 0.6$$
  2. 対立遺伝子Aの頻度が \(p\) の時、ハーディ・ワインバーグ平衡下の各遺伝子の期待人数は以下のようになる。
    • AA:\(100p^2\)
    • Aa:\(100\times2p(1-p)\)
    • aa:\(100(1-p)^2\)
  3. 標本中の対立遺伝子Aの頻度 \(p\) が \(0.6\) であることから計算した対立遺伝子頻度に基づく遺伝子型頻度(期待頻度)と、観察された遺伝子型頻度(観察頻度)の差を考えれば良い。
\(P\) \(Q\) \(R\) \(p\) \(q\)
\(40/100\) \(40/100\) \(20/100\) \(0.6\) \(1-p=0.4\)

を用いて計算すれば、近交係数は

$$F = \frac{2\left(\mathrm{P} + \frac{\mathrm{Q}}{2}\right)\left(\frac{\mathrm{Q}}{2}+\mathrm{R}\right) - \mathrm{Q}}{2\left(\mathrm{P} + \frac{\mathrm{Q}}{2}\right)\left(\frac{\mathrm{Q}}{2}+\mathrm{R}\right)}=\frac{2\mathrm{pq}-\mathrm{Q}}{2\mathrm{pq}}=\frac{1}{6}$$

課題4

分集団2のサイズを \(N\) とおくと、各頻度は以下のようにかける。

サイズ \(A\) \(a\) \(AA\) \(Aa\) \(aa\)
分集団1 \(mN\) \(p_1\) \(1-p_1\) \(p_1^2\) \(2p_1(1-p_1)\) \((1-p_1)^2\)
分集団2 \(N\) \(p_2\) \(1-p_2\) \(p_2^2\) \(2p_2(1-p_2)\) \((1-p_2)^2\)
集団 \(Z\) \((m+1)N\) \(\frac{mp_1+p_2}{m+1}\) \(\frac{m(1-p_1)+(1-p_2)}{m+1}\) 略 \(\frac{2mp_1(1-p_1) + 2p_2(1-p_2)}{m+1}\) 略

したがって、

$$\begin{aligned}F &= \frac{2\left(\mathrm{P} + \frac{\mathrm{Q}}{2}\right)\left(\frac{\mathrm{Q}}{2}+\mathrm{R}\right) - \mathrm{Q}}{2\left(\mathrm{P} + \frac{\mathrm{Q}}{2}\right)\left(\frac{\mathrm{Q}}{2}+\mathrm{R}\right)}=\frac{2\mathrm{pq}-\mathrm{Q}}{2\mathrm{pq}}\\ &=1-\frac{(m+1)\left\{mp_1(1-p_1)+p_2(1-p_2)\right\}}{(mp_1+p_2)\left\{(m(1-p_1) + (1-p_2))\right\}}\end{aligned}$$

なお、上記の式は \(m=0,m\rightarrow\infty\)(分集団の片方のみ)のどちらにおいても \(F=0\)(ハーディ・ワインバーグ平衡状態にあるため、観察頻度と期待頻度に差がない)となることが確かめられる。

課題5

以下の漸化式を立てることができる。

$$ \begin{cases} p_{t+1} &= (1-u)p_t + vq_t\\ q_{t+1} &= up_t + (1-v)q_t \end{cases} $$

したがって、

$$ \begin{aligned} p_{t+1} &= (1-u)p_t + v(1-p_t)\\ &= (1-u-v)p_t + v\\ \left(p_{t+1}-\frac{v}{u+v}\right)&=(1-u-v)\left(p_{t}-\frac{v}{u+v}\right)\\ p_t &= (1-u-v)^t\left(p_{0}-\frac{v}{u+v}\right) + \frac{v}{u+v} \end{aligned} $$

ここで、\(|1-u-v|<1\) なので、\(t\rightarrow\infty\) で \(p_t\rightarrow\frac{v}{u+v}\) となる。

課題6

初期個体数を \(N\) とおく。

世代 Aを持つ個体数 aを持つ個体数 全体の個体数
\(0\) \(Np_0\) \(Nq_o\) \(N\)
\(1\) \(Nw_Ap_0\) \(Nw_aq_o\) \(Nw_Ap_0+Nw_aq_o\)
\(\vdots\)
\(t\) \(Nw_A^tp_0\) \(Nw_a^tq_o\) \(Nw_A^tp_0+Nw_a^tq_o\)
  1. $$p_1 = \frac{w_Ap_0}{w_Ap_0 + w_aq_o}$$
  2. $$p_t = \frac{w_A^tp_0}{w_A^tp_0 + w_a^tq_o}$$
  3. $$p_t = \frac{p_0}{p_0 + (1-s)^tq_0}$$

※ なお、この時 \(p_{t+1} = \frac{p_t}{p_t + (1-s)q_t}\) という漸化式が成り立っている。(課題7への伏線)

課題7

\(t\) 世代目の成体中(配偶子中)のAとaの頻度をそれぞれ \(p_t\) と \(q_t\) とする(\(p_t+q_t=1\))と、\(t+1\) 世代目の子ども中のAA,Aa,aaの頻度は \(p_t^2,2p_tq_t,q_t^2\) で表せる。

この時、これらの子供が成長して成体になると、適応度の影響を受けるので、相対頻度は \(p_t^2:2(1-s)p_tq_t:(1-s)^2q_t^2\) となる。したがって、Aの頻度の漸化式は以下で表せる。

$$ \begin{aligned} p_{t+1} &= \frac{p_t^2 + p_tq_t(1-s)}{p_t^2 + 2(1-s)p_tq_t + q_t^2(1-s)^2}\\ &=\frac{p_t\left(p_t+q_t(1-s)\right)}{\left(p_t+(1-s)q_t\right)^2}\\ &= \frac{p_t}{p_t+(1-s)q_t}\\ \therefore p_t&= \frac{p_0}{p_0+(1-s)^tq_0}\quad\left(\because \text{課題6}\right) \end{aligned}$$

課題8

世代 \(t\) における対立遺伝子Aの頻度を \(p_t\) とすると、平衡時には、以下の式が成り立つ。

$$p_{t+1} = \frac{p_t^2(1-s_1) + p_tq_t}{p_t^2(1-s_1) + 2p_tq_t + q_t^2(1-s_2)} = p_t$$

したがって、これを解いて、

$$ \begin{aligned} (s_1+s_2)p_t^2 - (s_1+2s_2)p_t + s_2 &= 0\\ \left((s_1+s_2)p_t - s_2\right) (p_t - 1)&= 0\\ \therefore p_t &= \frac{s_2}{s_1+s_2}, 1 \end{aligned}$$

課題9

各遺伝子型で適応度に差がないとすると、以下の漸化式が成り立つ。

$$ \begin{cases} \begin{aligned} P_{t+1} &= P_t + \frac{1}{4}Q_t\\ Q_{t+1} &= \frac{1}{2}Q_t\\ R_{t+1} &= R_t + \frac{1}{4}Q_t \end{aligned} \end{cases} $$

したがって、\(Q/2\)

課題10

  1. 世代 \(t+1\) の子ども中のAAとAaの遺伝子型頻度は、それぞれ \((1-q_t)^2,2q_t(1-q_t)\) とおける。
  2. これらの子供が成長して大人になると、アリルaのホモ接合型が致死なので、
    $$q_{t+1} = \frac{1}{2}\cdot\frac{2q_t(1-q_t)}{1-q_t^2} = \frac{q_t}{1+q_t}$$
    3.
    $$ \begin{aligned} q_1&=\frac{q_0}{1+q_0}\\ q_2&=\frac{q_1}{1+q_1} = \frac{\frac{q_0}{1+q_0}}{1+\frac{q_0}{1+q_0}}=\frac{q_0}{1+2q_0}\\ \vdots&\\ q_t &= \frac{q_0}{1+tq_0} \end{aligned}$$
  3. \(\frac{1}{2}q_0=\frac{q_0}{1+tq_0}\) となる \(t\) と考えれば良いので、\(t = 1/0.001 = 1000\) 世代。

課題11

$$ \begin{aligned} cov(W,p) &= \frac{1}{n}\sum_{i=1}^n\left(W_i-\overline{W}\right)\left(p_i-\overline{p}\right)\\ &= \frac{1}{n}\sum_{i=1}^n\left(W_i-\left(p_t^2W_{AA} + 2p_tq_tW_{Aa} + q_t^2W_{aa}\right)\right)\left(p_i-p_t\right)\\ &= p_t^2\times\left\{\left(W_{AA}-\left(p_t^2W_{AA} + 2p_tq_tW_{Aa} + q_t^2W_{aa}\right)\right)\left(1-p_t\right)\right\}\\ &\quad + 2p_tq_t\times\left\{\left(W_{Aa}-\left(p_t^2W_{AA} + 2p_tq_tW_{Aa} + q_t^2W_{aa}\right)\right)\left(\frac{1}{2}-p_t\right)\right\}\\ &\quad+ q_t^2\times\left\{\left(W_{aa}-\left(p_t^2W_{AA} + 2p_tq_tW_{Aa} + q_t^2W_{aa}\right)\right)\left(0-p_t\right)\right\}\\ &=p_t^2W_{AA}(1-p_t) + 2p_tq_tW_{Aa}\left(\frac{1}{2}-p_t\right) + q_t^2W_{aa}(-p_t)\\ &\quad-\left(p_t^2W_{AA} + 2p_tq_tW_{Aa} + q_t^2W_{aa}\right)\left(p_t^2(1-p_t) + 2p_tq_t\left(\frac{1}{2}-p_t\right) + q_t^2(-p_t)\right)\\ &= p_t^2W_{AA}q_t + p_tq_tW_{Aa}(q_t-p_t) -p_tq_t^2W_{aa}\\ &\quad- \left(p_t^2W_{AA} + 2p_tq_tW_{Aa} + q_t^2W_{aa}\right)\left(p_t^2q_t + p_tq_t(q_t-p_t) - p_tq_t^2\right)\\ &= p_tq_t\left(p_tW_{AA} + (q_t-p_t)W_{Aa} + q_tW_{aa}\right) - 0\\ &= p_tq_t\left\{p_t\left(W_{AA} - W_{Aa}\right) + q_t\left(W_{Aa} - W_{aa}\right)\right\} \end{aligned} $$

課題12

  • 世代 \(t\) における成体中の正常アリルNの集団頻度を \(p_t\)、アリルDの集団頻度を \(q_t\) とおく。(\(p_t+q_t=1\))
  • NN,ND,DDの相対適応度は \(1,1,0\)
  • NからDへの突然変異率を \(u\) とし、DからNへの復帰突然変異を無視する。

すると、\(W=p_t^2 + 2p_tq_t\) であり、Dの頻度に着目すると、

$$q_{t+1}=p_tq_t/W = \frac{p_tq_t}{p_t^2 + 2p_tq_t} = \frac{q_t}{1+q_t}$$

となる。したがって、自然選択による変化量は、

$$\Delta q_t = q_{t+1}-q_t = \frac{q_t}{1 + q_t} - q_t$$

ここに、突然変異による変化量を加えると、厳密な計算方法では無いが十分に近似できるので(重ね合わせの原理)

$$ \begin{aligned} \Delta q_t = \left(\frac{q_t}{1 + q_t} - q_t\right) + u(1-q_t) \end{aligned} $$

平衡状態 \(q_t = q_{eq}\) を考えると、この状態では \(D\) の頻度は変化しない(\(\Delta q_t=0\))。したがって、

$$u = \frac{q_{eq}^2}{1-q_{eq}^2}$$

ここで、\(q_{eq}^2 = \frac{1}{10000}\) であるから、

$$u = \frac{1}{9999}$$

課題13

  1. 最大頻度:\(0.1\) 最小頻度:\(0\)
  2. 最大頻度:\(0.6\) 最小頻度:\(0.6+0.7-1=0.3\)

課題14

\(A_1\) \(A_2\) Total
\(B_1\) \(x_{11} = p_1\cdot q_1 + D\) \(x_{21} = p_2\cdot q_1 + D\) \(q_1\)
\(B_2\) \(x_{12} = p_1\cdot q_2 + D\) \(x_{22} = p_2\cdot q_2 + D\) \(q_2\)
Total \(p_1\) \(p_2\) \(1\)

ここで、

  • \(p_1=0.1+0.2=0.3\)
  • \(p_2=0.3+0.4=0.7\)
  • \(q_1=0.1+0.3=0.4\)
  • \(q_2=0.2+0.4=0.6\)

であり、

  • \(x_{11}=0.1\)
  • \(x_{12}=0.2\)
  • \(x_{21}=0.3\)
  • \(x_{22}=0.4\)

である。ゆえに、アリル \(A_1\) とアリル \(B_1\) に着目した連鎖不平衡係数 \(D\) は、

$$\begin{aligned} D_{A_1B_1} &= x_{11} - p_1\times q_1 = 0.1-0.3\times0.4=-0.02\\ &= x_{11}x_{22} - x_{12}x_{21} = 0.1\times0.4 - 0.2\times0.3 = -0.02 \end{aligned}$$

また、

$$r^2 = \frac{D_{A_1B_1}}{p_1p_2q_1q_2} = \frac{0.02^2}{0.3\times0.7\times0.4\times0.6} = \frac{1}{126}$$

であり、

$$ \begin{aligned} D_{A_1B_1}' &= \begin{cases} D_{A_1B_1}/D_{A_1B_1\max} &= D_{A_1B_1}/\left\{\min(p_1,q_1)-p_1q_1\right\}& (D_{A_1B_1}>0)\\ -D_{A_1B_1}/D_{A_1B_1\min} &= D_{A_1B_1}/\left\{\max(p_1+q_1-1,0)-p_1q_1\right\} & (D_{A_1B_1}<0)\\ \end{cases}\\ &=D_{A_1B_1}/\left(0-0.3\times0.4\right)\\ &= \frac{1}{6} \end{aligned}$$

課題15

Wright-Fisherモデルは以下のようなモデルである。

  • 世代は離散的(全固体が入れ替わる)
  • 任意婚
  • 親世代の各個体が、次世代の任意の子供の親である確率は等しい(\(1/N\))

ここで、

$$ \begin{aligned} \mathrm{E}[i] &= \sum_{i=0}^{2N}\left[i{{2N}\choose{i}} p^i(1-p)^{2N-i}\right]\\ &= 2Np\sum_{i=0}^{2N-1}\left[{{2N-1}\choose{i}} p^i(1-p)^{(2N-1)-i}\right]\\ &= 2Np \left[p + (1-p)\right]^{2N-1} = 2Np\\ \mathrm{E}[i(i-1)] &= \sum_{i=0}^{2N}\left[i(i-1){{2N}\choose{i}} p^i(1-p)^{2N-i}\right]\\ &= 2Np\sum_{i=0}^{2N-1}\left[(i-1){{2N-1}\choose{i}} p^i(1-p)^{(2N-1)-i}\right]\\ &= 2N(2N-1)p^2\sum_{i=0}^{2N-2}\left[{{2N-2}\choose{i}} p^i(1-p)^{(2N-2)-i}\right]\\ &= 2N(2N-1)p^2\left[p + (1-p)\right]^{2N-2} = 2N(2N-1)p^2\\ \mathrm{E}[i^2] &= \mathrm{E}[i(i-1) + i]\\ &= 2N(2N-1)p^2 + 2Np = 2Np\left\{1+(2N-1)p\right\}\\ \end{aligned} $$

より、

$$\mathrm{E}[i^2] = 2Np\left\{1+(2N-1)p\right\}$$

であることを用いれば、世代 \(t\) におけるAアリルの個数を \(i\) とすると、次世代(\(t+1\))のAAホモ接合体の期待頻度は、

$$ \begin{aligned} \mathrm{E}[G_{t+1}] &= \mathrm{E}[p_i^2] = \mathrm{E}[(i/2N)^2] = \frac{\mathrm{E}[i^2]}{(2N)^2}\\ &=\frac{2Np_t\left\{1+(2N-1)p_t\right\}}{(2N)^2}\\ &=p_t^2 + \frac{2p_t(1-p_t)}{4N}\\ &=G_t + \frac{H_t}{4N} \end{aligned} $$

なお、ここで \(H_t\) は、ヘテロ接合体の期待頻度を表す。

また、次世代の \(H\) の期待値 \(H_{t+1}\) は、

$$ \begin{aligned} H_{t+1}=\mathrm{E}[H_{t+1}] &= \mathrm{E}[2p_t(1-p_t)]\\ &= \mathrm{E}\left[2\times \frac{i}{2N} \times \frac{2N-i}{2N}\right]\\ &= \frac{2\mathrm{E}[i]}{2N} - \frac{2\mathrm{E}[i^2]}{(2N)^2}\\ &= 2p - \frac{4Np\{1+(2N-1)p\}}{(2N)^2}\\ &= 2p_t(1-p_t)\left(1-\frac{1}{2N}\right)\\ &= H_t\left(1-\frac{1}{2N}\right) \end{aligned} $$

となるから、\(\mathrm{E}[H_t] = H_0(1-1/2N)^t\) となる。ここで、先ほどの \(\mathrm{E}[G]\) の式を再帰的に呼び出すと、

$$ \begin{aligned} G_{t} =\mathrm{E}[G_{t}] &=G_{t-1} + \frac{H_{t-1}}{4N}\\ &= \left(G_{t-2} + \frac{H_{t-2}}{4N}\right) + \frac{H_{t-1}}{4N}\\ &=\cdots\\ &=G_0 + \frac{1}{4N}\left(H_0+\cdots+H_{t-1}\right)\\ &=G_0 + \frac{1}{4N}\cdot H_0\left\{1+\cdots+\left(1-\frac{1}{2N}\right)^{t-1}\right\}\\ &=G_0 + \frac{1}{4N}\cdot H_0\cdot2N\left\{1-\left(1-\frac{1}{2N}\right)^t\right\}\\ &=G_0 + \frac{H_0}{2}\left\{1-\left(1-\frac{1}{2N}\right)^t\right\} \end{aligned} $$

また、\(G_0=p_0^2\) より、

$$2p_0(1-p_0) = 2\sqrt{G_0}\left(1-\sqrt{G_0}\right)$$

したがって、

$$G_t = G_0 + \sqrt{G_0}\left(1-\sqrt{G_0}\right)\left(1-\left(1-\frac{1}{2N}\right)^t\right)$$

課題16

Moranモデルは以下のようなモデルである。

  • 個体数 \(N\) の一倍体の生物
  • 単位時間あたり、無作為に選ばれた1個体が子供を産み、無作為に選ばれた1個体が死亡する。(同一個体が子供を残し死亡することもある)
  • Aアリルを持つ個体数が \(i\)、aアリルを持つ個体数が \(N-i\)

したがって、\(p=i/N\) として、単位時間経過後に \(i\) が \(j\) になる確率 \(P_{ij}\) は、以下のように表される。

$$P_{ij} = \begin{cases} p(1-p), & \text{if}\ j=i+1 \\ (1-p)p, & \text{if}\ j=i-1 \\ p^2 + (1-p)^2, & \text{if}\ j=i \\ \end{cases} $$

よって、現在のAアリルを持つ個体数が \(i(=Np)\) のとき、1単位時間経過後のAアリルを持つ個体数 \(j\) の期待値 \(\mathrm{E}[j]\) と分散 \(\mathrm{V}[j]\) は、

$$ \begin{aligned} \mathrm{E}[j] &= (Np+1)p(1-p) + (Np-1)(1-p)p + Np\left(p^2 + (1-p)^2\right)\\ &= Np = i\\ \mathrm{V}[j] &= (Np+1-\mathrm{E}[j])^2p(1-p) + (Np-1-\mathrm{E}[j])^2(1-p)p\\ &+ (Np-\mathrm{E}[j])^2\left(p^2 + (1-p)^2\right) = 2p(1-p)\\ &= 2(i/N)(1-i/N)\\ \mathrm{E}[j^2] &= \mathrm{V}[j] + \mathrm{E}[j]^2 = 2p(1-p) + N^2p^2\\ &= 2\left(\frac{i}{N}\right)\left(1-\frac{i}{N}\right) + i^2 \end{aligned} $$

課題15と同様に考えると、

$$ \begin{aligned} \mathrm{G_{t+1}} &= \mathrm{E}\left[\left(\frac{j}{N}\right)^2 + \left(\frac{N-j}{N}\right)^2\right]\\ &= \frac{1}{N^2}\mathrm{E}\left[2j^2 - 2Nj + N^2\right]\\ &= \frac{1}{N^2}\left\{2\left(2p_t(1-p_t) + N^2p_t^2\right) - 2N^2p_t + N^2\right\}\\ &= \frac{2}{N^2}2p_t(1-p_t) + \left(2p_t^2 + 2p_t + 1\right)\\ &= \frac{2}{N^2}H_t + G_t \end{aligned} $$

なお、ここで \(H_t\) は、ヘテロ接合体の期待頻度を表す。

また、次世代の \(H\) の期待値 \(H_{t+1}\) は、

$$ \begin{aligned} \mathrm{E}[H_{t+1}] &= \mathrm{E}[2\times \frac{j}{N}\times \frac{N-j}{N}\\ &= 2\frac{\mathrm{E}[j]}{N}-2\frac{\mathrm{E}[j^2]}{N^2}\\ &= 2p - \left\{\frac{4p(1-p)}{N^2} + 2p^2\right\}\\ &= 2p_t(1-p_t)\left(1-\frac{2}{N^2}\right)\\ &= H_t\left(1-\frac{2}{N^2}\right) \end{aligned} $$

となるから、\(\mathrm{E}[H_t] = H_0(1-1/2N^2)^t\) となる。ここで、先ほどの \(\mathrm{E}[G]\) の式を再帰的に呼び出すと、

$$ \begin{aligned} G_{t} =\mathrm{E}[G_{t}] &=G_{t-1} + \frac{2}{N^2}H_{t-1}\\ &= \left(G_{t-2} + \frac{2}{N^2}H_{t-2}\right) + \frac{2}{N^2}H_{t-1}\\ &=\cdots\\ &=G_0 + \frac{2}{N^2}\left(H_0+\cdots+H_{t-1}\right)\\ &=G_0 + \frac{2}{N^2}\cdot H_0\left\{1+\cdots+\left(1-\frac{1}{2N^2}\right)^{t+1}\right\}\\ &=G_0 + \frac{2}{N^2}\cdot H_0\cdot 2N^2\left\{1-\left(1-\frac{1}{2N^2}\right)^t\right\}\\ &=G_0 + 4H_0\left\{1-\left(1-\frac{1}{2N}\right)^t\right\} \end{aligned} $$

また、\(H_0= 1-G_0\) であるから、

$$G_t = G_0 + 4(1-G_0)\left\{1-\left(1-\frac{1}{2N}\right)^t\right\}$$

課題17

  1. $$P = (1-F)\cdot p^2 + F\cdot p$$
  2. $$R = (1-F)\cdot q^2 + F\cdot q$$
  3. $$Q = (1-F)\cdot 2pq$$

課題18

それぞれ左から配列 \(1\sim5\) と番号をつける。また、以下の関係を使う。

$$\begin{aligned} \mathrm{E}[S] &= \theta\sum_{i=1}^{n-1}\frac{1}{i},\quad \mathrm{E}[d] = \theta \end{aligned}$$

A:\(S=5\)

site1 site2 site3 site4 site5
1 ● ●
2 ● ●
3 ● ●
4 ● ●
5 ● ● ●
$$d = \frac{3\times2 + 3\times2 + 3\times 2+3\times 2 + 4\times 1}{_5\mathrm{C}_2} = \frac{14}{5}$$

よって、

$$\theta = \begin{cases} \begin{aligned} &5\times\frac{12}{25} = \frac{12}{5} & \left(\text{by } S\right)\\ &\frac{14}{5} & \left(\text{by } d\right) \end{aligned} \end{cases} $$

B:\(S=5\)

site1 site2 site3 site4 site5
1 ● ●
2
3 ●
4 ●
5 ●
$$d = \frac{1\times4 + 1\times4 + 1\times4 + 1\times 4 + 1\times 4}{_5\mathrm{C}_2} = \frac{20}{10} = 2$$

よって、

$$\theta = \begin{cases} \begin{aligned} &5\times\frac{12}{25} = \frac{12}{5} & \left(\text{by } S\right)\\ &2 & \left(\text{by } d\right) \end{aligned} \end{cases} $$

課題19

\(\mathrm{A}\) \(\mathrm{G}\) Total
\(\mathrm{C}\) \(1/2\) \(3/8\) \(7/8\)
\(\mathrm{T}\) \(1/8\) \(0\) \(1/8\)
Total \(5/8\) \(3/8\) \(1\)
  1. $$D_{AC} = \frac{1}{2} - \frac{5}{8}\cdot\frac{7}{8} = -\frac{3}{64}$$
  2. $$d = \frac{5\times3 + 7\times1 + 7\times 1+6\times 2}{_8\mathrm{C}_2} = \frac{41}{28}$$
  3. $$\theta = \frac{4}{\sum_{i=1}^{4-1}\frac{1}{i}} = \frac{24}{11}$$
  4. EHHは、以下の式によって求められる。
    $$\mathrm{EHH}_i = \frac{\sum_{j=1}^s\binom{e_{ij}}{2}}{\binom{c_i}{2}},\quad c_i=\sum_{j=1}^se_{ij}$$

なお、それぞれの記号は以下を意味する。

  • \(c_i\):アリル \(i\) を含むハプロタイプ数
  • \(e_{ij}\):アリル \(i\) を含むハプロタイプのうち \(j\) 番目のハプロタイプ数
  • \(s\):アリル \(i\) を含む異なるハプロタイプの総数

よって、ここでSNP1のAアリルに着目すれば、以下のように \(\mathrm{EHH}\) が求められる。(SNP1のAアリルに着目しているので、SNP1がGアリルのものは考えなくて良い。)

SNP1 SNP2 SNP3 SNP4
s 1 2 3 3
1a A C G A
1b A T G A
2a A C A A
2b A C G A
3a A C G A
\(\mathrm{EHH}_A\) - 6/10 3/10 3/10
$$ \begin{aligned} \mathrm{EHH}_{A,\mathrm{SNP}2} &= \frac{\binom{1}{2} + \binom{4}{2}}{\binom{5}{2}} &= \frac{6}{10}\\ \mathrm{EHH}_{A,\mathrm{SNP}3} &= \frac{\binom{1}{2} + \binom{3}{2} + \binom{1}{2}}{{\binom{5}{2}}} &=\frac{3}{10} \\ \mathrm{EHH}_{A,\mathrm{SNP}4} &= \frac{\binom{1}{2} + \binom{3}{2} + \binom{1}{2}}{{\binom{5}{2}}} &=\frac{3}{10} \\ \end{aligned} $$

課題20

  1. $$\frac{1}{_3\mathrm{C}_2} = \frac{1}{3}$$
  2. $$\frac{1}{_4\mathrm{C}_2} + \frac{1}{_4\mathrm{C}_2}\cdot\frac{1}{_3\mathrm{C}_2} = \frac{2}{9}$$
  3. $$p_{n+1} = \frac{_{n-1}\mathrm{C}_2}{_{n+1}\mathrm{C}_2}\cdot p_n + \frac{1}{_{n+1}\mathrm{C}_2}$$

  • « シミュレーション実習 Day6
  • シミュレーション実習 Day7 »
hidden
Table of Contents
Published
Jul 17, 2019
Last Updated
Jul 17, 2019
Category
分子進化学
Tags
  • 3S 95
  • 分子進化学 13
Contact
Other contents
  • Home
  • Blog
  • Front-End
  • Kerasy
  • Python-Charmers
  • Translation-Gummy
    • 3S - Shuto's Notes
    • MIT
    • Powered by Pelican. Theme: Elegant