課題の解答
大橋 順准教授の講義で取り扱った課題の解答を作成したので挙げる。
課題1
問題 | 解答 |
---|---|
課題2
- 常染色体、X染色体、Y染色体をA,X,Yと略記する。
-
男性の突然変異率が女性の突然変異率の \(a\) 倍であるとする。(突然変異率は生殖細胞の分裂数に比例するので、\(a\) = 「精子の分裂数/卵の分裂数」に等しい)
-
各染色体の突然変異率は以下のようにかける。
$$ \begin{cases} \begin{aligned} \mathrm{MA} &= \mathrm{MA♂} + \mathrm{MA♀}\\ &\propto (1/2)\times a + (1/2)\times 1\\ &=(a+1)/2\\ \mathrm{MX} &= \mathrm{MX♂} + \mathrm{MX♀}\\ &\propto (1/3)\times a + (2/3)\times 1\\ &=(a+2)/3\\ \mathrm{MY} &= \mathrm{MY♂}\\ &\propto 1\times a\\ &=a\\ \end{aligned} \end{cases} $$ここで、$$\mathrm{MA}:\mathrm{MY} = \frac{a+1}{2}:a= 1.2:1.7$$より、\(a=\frac{17}{7}\) -
$$\mathrm{MX} = 1.7\times\frac{(a+2)/3}{a} = \frac{31}{30}$$
課題3
-
$$p=\frac{40\times2+40}{100\times2} = 0.6$$
- 対立遺伝子Aの頻度が \(p\) の時、ハーディ・ワインバーグ平衡下の各遺伝子の期待人数は以下のようになる。
- AA:\(100p^2\)
- Aa:\(100\times2p(1-p)\)
- aa:\(100(1-p)^2\)
- 標本中の対立遺伝子Aの頻度 \(p\) が \(0.6\) であることから計算した対立遺伝子頻度に基づく遺伝子型頻度(期待頻度)と、観察された遺伝子型頻度(観察頻度)の差を考えれば良い。
\(P\) | \(Q\) | \(R\) | \(p\) | \(q\) | |
---|---|---|---|---|---|
\(40/100\) | \(40/100\) | \(20/100\) | \(0.6\) | \(1-p=0.4\) |
を用いて計算すれば、近交係数は
課題4
分集団2のサイズを \(N\) とおくと、各頻度は以下のようにかける。
サイズ | \(A\) | \(a\) | \(AA\) | \(Aa\) | \(aa\) | |
---|---|---|---|---|---|---|
分集団1 | \(mN\) | \(p_1\) | \(1-p_1\) | \(p_1^2\) | \(2p_1(1-p_1)\) | \((1-p_1)^2\) |
分集団2 | \(N\) | \(p_2\) | \(1-p_2\) | \(p_2^2\) | \(2p_2(1-p_2)\) | \((1-p_2)^2\) |
集団 \(Z\) | \((m+1)N\) | \(\frac{mp_1+p_2}{m+1}\) | \(\frac{m(1-p_1)+(1-p_2)}{m+1}\) | 略 | \(\frac{2mp_1(1-p_1) + 2p_2(1-p_2)}{m+1}\) | 略 |
したがって、
なお、上記の式は \(m=0,m\rightarrow\infty\)(分集団の片方のみ)のどちらにおいても \(F=0\)(ハーディ・ワインバーグ平衡状態にあるため、観察頻度と期待頻度に差がない)となることが確かめられる。
課題5
以下の漸化式を立てることができる。
したがって、
ここで、\(|1-u-v|<1\) なので、\(t\rightarrow\infty\) で \(p_t\rightarrow\frac{v}{u+v}\) となる。
課題6
初期個体数を \(N\) とおく。
世代 | Aを持つ個体数 | aを持つ個体数 | 全体の個体数 |
---|---|---|---|
\(0\) | \(Np_0\) | \(Nq_o\) | \(N\) |
\(1\) | \(Nw_Ap_0\) | \(Nw_aq_o\) | \(Nw_Ap_0+Nw_aq_o\) |
\(\vdots\) | |||
\(t\) | \(Nw_A^tp_0\) | \(Nw_a^tq_o\) | \(Nw_A^tp_0+Nw_a^tq_o\) |
-
$$p_1 = \frac{w_Ap_0}{w_Ap_0 + w_aq_o}$$
-
$$p_t = \frac{w_A^tp_0}{w_A^tp_0 + w_a^tq_o}$$
-
$$p_t = \frac{p_0}{p_0 + (1-s)^tq_0}$$
※ なお、この時 \(p_{t+1} = \frac{p_t}{p_t + (1-s)q_t}\) という漸化式が成り立っている。(課題7への伏線)
課題7
\(t\) 世代目の成体中(配偶子中)のAとaの頻度をそれぞれ \(p_t\) と \(q_t\) とする(\(p_t+q_t=1\))と、\(t+1\) 世代目の子ども中のAA,Aa,aaの頻度は \(p_t^2,2p_tq_t,q_t^2\) で表せる。
この時、これらの子供が成長して成体になると、適応度の影響を受けるので、相対頻度は \(p_t^2:2(1-s)p_tq_t:(1-s)^2q_t^2\) となる。したがって、Aの頻度の漸化式は以下で表せる。
課題8
世代 \(t\) における対立遺伝子Aの頻度を \(p_t\) とすると、平衡時には、以下の式が成り立つ。
したがって、これを解いて、
課題9
各遺伝子型で適応度に差がないとすると、以下の漸化式が成り立つ。
したがって、\(Q/2\)
課題10
- 世代 \(t+1\) の子ども中のAAとAaの遺伝子型頻度は、それぞれ \((1-q_t)^2,2q_t(1-q_t)\) とおける。
- これらの子供が成長して大人になると、アリルaのホモ接合型が致死なので、
$$q_{t+1} = \frac{1}{2}\cdot\frac{2q_t(1-q_t)}{1-q_t^2} = \frac{q_t}{1+q_t}$$3.$$ \begin{aligned} q_1&=\frac{q_0}{1+q_0}\\ q_2&=\frac{q_1}{1+q_1} = \frac{\frac{q_0}{1+q_0}}{1+\frac{q_0}{1+q_0}}=\frac{q_0}{1+2q_0}\\ \vdots&\\ q_t &= \frac{q_0}{1+tq_0} \end{aligned}$$
- \(\frac{1}{2}q_0=\frac{q_0}{1+tq_0}\) となる \(t\) と考えれば良いので、\(t = 1/0.001 = 1000\) 世代。
課題11
課題12
- 世代 \(t\) における成体中の正常アリルNの集団頻度を \(p_t\)、アリルDの集団頻度を \(q_t\) とおく。(\(p_t+q_t=1\))
- NN,ND,DDの相対適応度は \(1,1,0\)
- NからDへの突然変異率を \(u\) とし、DからNへの復帰突然変異を無視する。
すると、\(W=p_t^2 + 2p_tq_t\) であり、Dの頻度に着目すると、
となる。したがって、自然選択による変化量は、
ここに、突然変異による変化量を加えると、厳密な計算方法では無いが十分に近似できるので(重ね合わせの原理)
平衡状態 \(q_t = q_{eq}\) を考えると、この状態では \(D\) の頻度は変化しない(\(\Delta q_t=0\))。したがって、
ここで、\(q_{eq}^2 = \frac{1}{10000}\) であるから、
課題13
- 最大頻度:\(0.1\) 最小頻度:\(0\)
- 最大頻度:\(0.6\) 最小頻度:\(0.6+0.7-1=0.3\)
課題14
\(A_1\) | \(A_2\) | Total | |
---|---|---|---|
\(B_1\) | \(x_{11} = p_1\cdot q_1 + D\) | \(x_{21} = p_2\cdot q_1 + D\) | \(q_1\) |
\(B_2\) | \(x_{12} = p_1\cdot q_2 + D\) | \(x_{22} = p_2\cdot q_2 + D\) | \(q_2\) |
Total | \(p_1\) | \(p_2\) | \(1\) |
ここで、
- \(p_1=0.1+0.2=0.3\)
- \(p_2=0.3+0.4=0.7\)
- \(q_1=0.1+0.3=0.4\)
- \(q_2=0.2+0.4=0.6\)
であり、
- \(x_{11}=0.1\)
- \(x_{12}=0.2\)
- \(x_{21}=0.3\)
- \(x_{22}=0.4\)
である。ゆえに、アリル \(A_1\) とアリル \(B_1\) に着目した連鎖不平衡係数 \(D\) は、
また、
であり、
課題15
Wright-Fisherモデルは以下のようなモデルである。
- 世代は離散的(全固体が入れ替わる)
- 任意婚
- 親世代の各個体が、次世代の任意の子供の親である確率は等しい(\(1/N\))
ここで、
より、
であることを用いれば、世代 \(t\) におけるAアリルの個数を \(i\) とすると、次世代(\(t+1\))のAAホモ接合体の期待頻度は、
なお、ここで \(H_t\) は、ヘテロ接合体の期待頻度を表す。
また、次世代の \(H\) の期待値 \(H_{t+1}\) は、
となるから、\(\mathrm{E}[H_t] = H_0(1-1/2N)^t\) となる。ここで、先ほどの \(\mathrm{E}[G]\) の式を再帰的に呼び出すと、
また、\(G_0=p_0^2\) より、
したがって、
課題16
Moranモデルは以下のようなモデルである。
- 個体数 \(N\) の一倍体の生物
- 単位時間あたり、無作為に選ばれた1個体が子供を産み、無作為に選ばれた1個体が死亡する。(同一個体が子供を残し死亡することもある)
- Aアリルを持つ個体数が \(i\)、aアリルを持つ個体数が \(N-i\)
したがって、\(p=i/N\) として、単位時間経過後に \(i\) が \(j\) になる確率 \(P_{ij}\) は、以下のように表される。
よって、現在のAアリルを持つ個体数が \(i(=Np)\) のとき、1単位時間経過後のAアリルを持つ個体数 \(j\) の期待値 \(\mathrm{E}[j]\) と分散 \(\mathrm{V}[j]\) は、
課題15と同様に考えると、
なお、ここで \(H_t\) は、ヘテロ接合体の期待頻度を表す。
また、次世代の \(H\) の期待値 \(H_{t+1}\) は、
となるから、\(\mathrm{E}[H_t] = H_0(1-1/2N^2)^t\) となる。ここで、先ほどの \(\mathrm{E}[G]\) の式を再帰的に呼び出すと、
また、\(H_0= 1-G_0\) であるから、
課題17
-
$$P = (1-F)\cdot p^2 + F\cdot p$$
-
$$R = (1-F)\cdot q^2 + F\cdot q$$
-
$$Q = (1-F)\cdot 2pq$$
課題18
それぞれ左から配列 \(1\sim5\) と番号をつける。また、以下の関係を使う。
A:\(S=5\)
site1 | site2 | site3 | site4 | site5 | |
---|---|---|---|---|---|
1 | ● | ● | |||
2 | ● | ● | |||
3 | ● | ● | |||
4 | ● | ● | |||
5 | ● | ● | ● |
よって、
B:\(S=5\)
site1 | site2 | site3 | site4 | site5 | |
---|---|---|---|---|---|
1 | ● | ● | |||
2 | |||||
3 | ● | ||||
4 | ● | ||||
5 | ● |
よって、
課題19
\(\mathrm{A}\) | \(\mathrm{G}\) | Total | |
---|---|---|---|
\(\mathrm{C}\) | \(1/2\) | \(3/8\) | \(7/8\) |
\(\mathrm{T}\) | \(1/8\) | \(0\) | \(1/8\) |
Total | \(5/8\) | \(3/8\) | \(1\) |
-
$$D_{AC} = \frac{1}{2} - \frac{5}{8}\cdot\frac{7}{8} = -\frac{3}{64}$$
-
$$d = \frac{5\times3 + 7\times1 + 7\times 1+6\times 2}{_8\mathrm{C}_2} = \frac{41}{28}$$
-
$$\theta = \frac{4}{\sum_{i=1}^{4-1}\frac{1}{i}} = \frac{24}{11}$$
- EHHは、以下の式によって求められる。
$$\mathrm{EHH}_i = \frac{\sum_{j=1}^s\binom{e_{ij}}{2}}{\binom{c_i}{2}},\quad c_i=\sum_{j=1}^se_{ij}$$
なお、それぞれの記号は以下を意味する。
- \(c_i\):アリル \(i\) を含むハプロタイプ数
- \(e_{ij}\):アリル \(i\) を含むハプロタイプのうち \(j\) 番目のハプロタイプ数
- \(s\):アリル \(i\) を含む異なるハプロタイプの総数
よって、ここでSNP1のAアリルに着目すれば、以下のように \(\mathrm{EHH}\) が求められる。(SNP1のAアリルに着目しているので、SNP1がGアリルのものは考えなくて良い。)
SNP1 | SNP2 | SNP3 | SNP4 | |
---|---|---|---|---|
s | 1 | 2 | 3 | 3 |
1a | A | C | G | A |
1b | A | T | G | A |
2a | A | C | A | A |
2b | A | C | G | A |
3a | A | C | G | A |
\(\mathrm{EHH}_A\) | - | 6/10 | 3/10 | 3/10 |
課題20
-
$$\frac{1}{_3\mathrm{C}_2} = \frac{1}{3}$$
-
$$\frac{1}{_4\mathrm{C}_2} + \frac{1}{_4\mathrm{C}_2}\cdot\frac{1}{_3\mathrm{C}_2} = \frac{2}{9}$$
-
$$p_{n+1} = \frac{_{n-1}\mathrm{C}_2}{_{n+1}\mathrm{C}_2}\cdot p_n + \frac{1}{_{n+1}\mathrm{C}_2}$$