第8回 2019/6/26

大橋順

対立遺伝子頻度の時間変化

※ この講義は、第3回(5/15)の講義の続きである。

3. 連鎖不平衡係数

連鎖不平衡係数(linkage disequilibrium, LD)

（連鎖する）2つ以上の遺伝子座における対立遺伝子間に関連（非独立性）が存在すること。

ハプロタイプ頻度が、そのハプロタイプを構成する対立遺伝子頻度の積（＝独立を仮定）では与えられない状態。

ここで、2つの遺伝子座にそれぞれ2つの対立遺伝子が存在する場合を考える。（下図参照）

ここで、 - 左側の座位（座位A）の対立遺伝子をA1,A2 - 右側の座位（座位B）の対立遺伝子をB1,B2

と置き、それぞれの対立遺伝子の相対頻度を、座位Aは $p_1,p_2$、座位Bでは $q_1,q_2$ とする。（$p_1+p_2=1,q_1+q_2=1$）

2つ以上の座位の対立遺伝子の組み合わせの1対を ディプロタイプと呼び、対のそれぞれ片方をハプロタイプと呼ぶ。

今回の例の場合、ハプロタイプは「A1-B1」,「A1-B2」,「A2-B1」,「A2-B2」の四種類が存在することになる。

ここで、ハプロタイプ頻度が次のように得られたとする。

ハプロタイプ	理論的な頻度	実際の頻度
A1-B1	$p_1\cdot q_1$	$x_{11}$
A1-B2	$p_1\cdot q_2$	$x_{12}$
A2-B1	$p_2\cdot q_1$	$x_{21}$
A2-B2	$p_2\cdot q_2$	$x_{22}$

$D_{A1,B1}$

この時、

$$D_{A1,B1} = x_{11}-p_1\cdot q_1$$

を、対立遺伝子A1と対立遺伝子B1との間の連鎖不平衡係数と呼ぶ。

なお、同様に考えて

$$ \begin{aligned} D_{A1,B1} &= x_{11}-p_1\cdot q_1\\ D_{A1,B2} &= x_{12}-p_1\cdot q_2\\ D_{A2,B1} &= x_{21}-p_2\cdot q_1\\ D_{A2,B2} &= x_{22}-p_2\cdot q_2\\ \end{aligned} $$

とおけるが、

$$ \begin{aligned} x_{11}+x_{12} &= (\text{ハプロタイプ}[A_1,B_1]\text{の頻度}) + (\text{ハプロタイプ}[A_1,B_2]\text{の頻度})\\ & = (\text{座位}A\text{の遺伝子が}A_1\text{である確率})\\ &= p_1 \end{aligned} $$

といった関係があるため、以下の表のようにかける。

$D$

	$A_1$	$A_2$	Total
$B_1$	$x_{11}=p_1\cdot q_1 + D$	$x_{21}=p_2\cdot q_1 - D$	$q_1$
$B_2$	$x_{12}=p_1\cdot q_2 - D$	$x_{22}=p_2\cdot q_2 + D$	$q_2$
Total	$p_1$	$p_2$	$1$

ここで、$D$ は、先ほど定義した連鎖不平衡係数 $D_{A1,B1}$ と等しい。

また、上記の関係性を用いると、$D_{A1,B1}$ は以下のようにかける。

$$ \begin{aligned} D_{A1,B1} &= x_{11}-p_1\cdot q_1 \\ &= x_{11}-(x_{11} + x_{12})(x_{11} + x_{21}) \\ &= x_{11}(1-x_{11}-x_{21}-x_{12}) - x_{12}x_{21} \\ &= x_{11}x_{22}-x_{12}x_{21} \end{aligned}$$

$D'$

上で定義した $D は、対立遺伝子の頻度にも依存しているため、異なるアレルのペアと連鎖の不均衡度合いを比較する値としては望ましくない。

そこで、以下で定義される $D'$ が使われる。

$$ \begin{array}{l} {D^{\prime}=D / D_{\max }} \\ {\text { where }} \\ {D_{\max }= \left\{ \begin{array}{l} {\max \left\{p_1q_2,p_2q_1\right\}} & {\text { whenM } D>0} \\ {\min \left\{-p_1q_1,-p_2q_2\right\}} & {\text { when } D<0} \end{array} \right.} \end{array} $$

4. 集団中のハプロタイプ頻度推定

一般に、シークエンスによって得られるSNP遺伝子型タイピングデータは、各遺伝子座のアレルを調べることができ、各個体の遺伝子型を知ることはできるが、1本の染色体上の遺伝子の並び（ハプロタイプ）を特定することができない。

例えば、ある個体の遺伝子型が座位Aで $[A_1/A_2]$、座位Bで $[B_1]$ だとした場合、ハプロタイプは $[A_1B_1]$ と $[A_2B_1]$ だとわかる。

一方で、ある個体の遺伝子型が座位Aで $[A_1/A_2]$ 、座位Bで $[B_1/B_2]$ だとした場合、ハプロタイプは $[A_1B_1]$ と $[A_2B_2]$ の組み合わせなのか、$[A_1B_2]$ と $[A_2B_1]$ の組み合わせなのかわからない。

そこで、どちらの組み合わせなのかを推定する必要がある。なお、単一個体ではどちらなのかの推定になるが、一般には $N$ 体の個体のうち $x_1$ 体の遺伝子型が座位Aで $[A_1/A_2]$、座位Bで $[B_1/B_2]$、$x_2$ 体の遺伝子型が座位Aで $[A_1]$、座位Bで $[B_1]$、…といった形でデータが得られるので、ハプロタイプ頻度の推定になる。（本質的には同じ）

以下のデータが得られたとする。

	$B_1/B_1$	$B_1/B_2$	$B_2/B_2$
$A_1/A_1$	$n_{1111}$	$n_{1112}$	$n_{1122}$
$A_1/A_2$	$n_{1211}$	$n_{1212}$	$n_{1222}$
$A_2/A_2$	$n_{2211}$	$n_{2212}$	$n_{2222}$

なお、ここで

$$ \begin{aligned} n_{1212} &= n_{A_1B_1/A_2B_2} + n_{A_1B_2/A_2B_1}\\ &= x\cdot n_{1212} + (1-x)\cdot n_{1212} \end{aligned} $$

と分けて考える。（$0\leq x\leq1$）

すると、全 $2N$ 本の染色体中のハプロタイプ $A_iB_j$ の割合を $h_{A_iB_j}$ とした際に、

$$x = \frac{h_{A_1B_1}h_{A_2B_2}}{h_{A_1B_1}h_{A_2B_2} + h_{A_1B_2}h_{A_2B_1}}\quad \cdots\ (1)$$

という関係が成り立つと仮定すると、この式 $(1)$ と

$$ \begin{aligned} \begin{cases} h_{A_1B_1} &= (2n_{1111} + n_{1211} + n_{1112} + x\cdot n_{1212}) / 2N\\ h_{A_1B_2} &= (n_{1112} + (1-x)\cdot n_{1212} + 2n_{1122} + n_{1222}) / 2N\\ h_{A_2B_1} &= (n_{1211} + 2n_{2211} + (1-x)\cdot n_{1212} + n_{2212}) / 2N\\ h_{A_2B_2} &= (x\cdot 2n_{1212} + n_{2212} + n_{1222} + 2n_{2222}) / 2N\\ \end{cases}\quad \cdots (2) \end{aligned} $$

この式 $(2)$ を繰り返して値が変化しなくなるまで繰り返せば、ハプロタイプ頻度を予測することができる。

5. ハプロタイプ頻度変化

今までと同じモデルにおいて、世代 $t$ から世代 $t+1$ に移る際に、確率 $c$ で組み換えが起こると仮定する。

すると、

$$\begin{aligned} h_{A_1B_1}^{(t+1)} &= (1-c)(\text{世代tでハプロタイプ}[A_1,B_1]\text{の頻度}) + c(\text{世代tで座位Aが}[A_1]\text{の頻度})\times(\text{世代tで座位Bが}[B_1]\text{の頻度}) \\ &= (1-c)h_{A_1B_1}^{(t)} + c(h_{A_1B_1}^{(t)} + h_{A_1B_2}^{(t)})(h_{A_1B_1}^{(t)} + h_{A_2B_1}^{(t)})\\ &= (1-c)h_{A_1B_1}^{(t)} + cpq\\ h_{A_1B_1}^{(t+1)} - pq &= (1-c)(h_{A_1B_1}^{(t)} - pq)\\ \therefore h_{A_1B_1}^{(t)} &= (1-c)^t(h_{A_1B_1}^{(0)} - pq) + pq \qquad \cdots(\mathrm{式A}) \end{aligned}$$

また、$D^{(t)} = h_{A_1B_1}^{(t)} - pq$ より、$D^{(t)} = (1-c)^tD^{(0)}$ である。

よって、$t\rightarrow\infty$ で、$h_{A_1B_1}^{(t)}\rightarrow pq,\quad D^{(t)}\rightarrow0$

低頻度派生アリルの年齢推定

（$D>0$ であるとして、）式Aの両辺を $p$ で割ると、

$$h_{A_1B_1}^{(t)}/p = (1-c)^t(h_{A_1B_1}^{(0)}/p - p) + q$$

ここで、$h_{A_1B_1}^{(t)}/p$ は「$A_1$ アリルを持つハプロタイプ中の $B_1$ アリルを含むものの割合」を表す。この割合を $\delta_{A_1B_1}^{(t)}$ とおくと、

$$\delta_{A_1B_1}^{(t)} = (1-c)^t(\delta_{A_1B_1}^{(0)}-q) + q$$

この時、アリル $B_1$ を持つ染色体上にアリル $A_1$ が突然現れた（突然変異）とすると、$\delta_{A_1B_1}^{(0)} = 1$ であるから、

$$\frac{\delta_{A_1B_1}^{(t)} - q}{1-q} = (1-c)^t$$

これを $t$ について解くと、

$$t = \frac{\ln\left(\delta_{A_1B_1}^{(t)} - q\right) - \ln\left(1-q\right)}{\ln\left(1-c\right)}$$

となる。この式より、アリル $A_1 の年齢を推定することができる。

ハプロタイプ	理論的な頻度	実際の頻度
A1-B1	\(p_1\cdot q_1\)	\(x_{11}\)
A1-B2	\(p_1\cdot q_2\)	\(x_{12}\)
A2-B1	\(p_2\cdot q_1\)	\(x_{21}\)
A2-B2	\(p_2\cdot q_2\)	\(x_{22}\)

	\(A_1\)	\(A_2\)	Total
\(B_1\)	\(x_{11}=p_1\cdot q_1 + D\)	\(x_{21}=p_2\cdot q_1 - D\)	\(q_1\)
\(B_2\)	\(x_{12}=p_1\cdot q_2 - D\)	\(x_{22}=p_2\cdot q_2 + D\)	\(q_2\)
Total	\(p_1\)	\(p_2\)	\(1\)

	\(B_1/B_1\)	\(B_1/B_2\)	\(B_2/B_2\)
\(A_1/A_1\)	\(n_{1111}\)	\(n_{1112}\)	\(n_{1122}\)
\(A_1/A_2\)	\(n_{1211}\)	\(n_{1212}\)	\(n_{1222}\)
\(A_2/A_2\)	\(n_{2211}\)	\(n_{2212}\)	\(n_{2222}\)

分子進化学第8回

第8回 2019/6/26

対立遺伝子頻度の時間変化

3. 連鎖不平衡係数

\(D_{A1,B1}\)

\(D\)

\(D'\)

4. 集団中のハプロタイプ頻度推定

5. ハプロタイプ頻度変化

低頻度派生アリルの年齢推定

Table of Contents

Published

Last Updated

Category

Tags

Contact

Other contents