第1回 2019/8/1 1限
- 講師:伊藤隆司
- 参考書:現代生物科学入門1:ゲノム科学の基礎
- 参考書:ゲノム医学 メディカルサイエンスインターナショナル
講義概要
# | 日付 | 時限 | 内容 |
---|---|---|---|
1 | 8/1 | 1 | ゲノム解析技術Ⅰ |
2 | 8/1 | 2 | ゲノム解析技術Ⅱ |
3 | 8/1 | 3 | ゲノム解析技術Ⅲ |
4 | 8/1 | 4 | エピゲノム解析Ⅰ |
5 | 8/2 | 1 | エピゲノム解析Ⅱ |
6 | 8/2 | 2 | トランスクリプトーム解析 |
7 | 8/2 | 3 | フェノーム解析 |
ゲノム解析技術
ヒトゲノム計画
ヒトゲノム配列決定の流れ
なお、ヒトゲノムのマッピングは、以下の方法がある。 - 目印となる配列(DNAマーカー)を集める。 - DNAマーカーをゲノムに沿って並べる。 - DNAマーカーを使ってBACクローンを並べる。
巨大DNAのクローニング系
YAC: Yeast Artificial Chromosome | BAC: Bacterial Artificial Chromosome |
---|---|
A vector (carrier) constructed from the telomeric, centromeric, and replication origin sequences needed for replication in yeast cells. | A DNA constructed based on a functional fertility plasmid (or F-plasmid), used for transforming and cloning in bacteria, usually E.coli |
酵母人工染色体 | 細菌人工染色体 |
特定の領域 |
F因子の複製起点を利用して作られる。 |
200~1000kb | 100~200kb |
機能が不安定。キメラも多い。 | 機能が安定 |
染色体なので、取り出すのが難しい。 | プラスミドとしての単離が容易。 |
整列クローン地図
- クローンコンティグ(Clone Contig)作成
- 相互に重なり合ったクローンの集合
- はぐれものはシングルトン(singleton)
- つまり、ヒトゲノム解析の理想は24コンティグ
- 作り方
- DNAマーカーを使う方法:STSコンテントマッピング
- DNAマーカーを予め並べて置く方法(地図にクローンを貼り付ける)
- 遺伝地図(連鎖地図)
- RH地図
- 細胞遺伝学的地図
- 制限酵素地図
- DNAマーカーを予め並べて置かない(わからない)方法
- DNAマーカーを予め並べて置く方法(地図にクローンを貼り付ける)
- DNAマーカーを使わない方法:フィンガープリント
- DNAマーカーを使う方法:STSコンテントマッピング
遺伝地図(連鎖地図), linkage map
- 減数分裂時の組換え頻度が尺度であり、2つの形質がどれ位の頻度で共通に子孫に伝わるかを利用。(遺伝学的距離)
- 100回に1回組み変わる距離を1cMと定義。\(\propto\) 物理的距離
- DNA多型マーカー
- RFLP:制限酵素断片の長さの違い
- マイクロサテライト:単純配列の反復回数の違い
- SNPs:一塩基の違い
- 家系の中での表現系に影響する遺伝子の伝わり方に注目していたが、追跡しやすい表現系の種類には限度がある。
- 形質の原因は、突き詰めると遺伝子配列の差異:遺伝子でない部分のDNAも、遺伝子と同様に子孫に伝えられる。→DNA配列の違い(多型)の伝わり方に注目!
制限酵素切断長多型(RFLP)
制限酵素を使った時に、ある人は切れるけど、ある人は切れない、という部分を調べる。(論文 link)
マイクロサテライト
細胞核やオルガネラのゲノム上に存在する反復配列で、特に数塩基の単位配列の繰り返しからなるもの。様々な反復回数のアレルが存在する。
様々なマイクロサテライトの伝わり方を見ることで、マイクロサテライト同士の距離がわかる。
※ 縦列型反復配列(short tandem repeat; STR)あるいは単純反復配列(simple sequence repeat; SSR)とも呼ばれる。
単一塩基多型(SNP)
- Single Nucleotide Polymorphism
- 個々の情報量は少ない(ほとんどがdimorphic)が、数が圧倒的なため、詳細なマッピングに最適
RH地図
- 放射線雑種細胞マッピング(Radiation Hybrid Mapping)
- ヒトでは交配実験ができないので、原理的に減数分裂を模したこと(放射線でズタズタにした細胞を融合)を行う。
- 放射線によって断片化されたヒト染色体を保持したヒト-げっ歯類雑種細胞のセット(RHパネル)を用意。
- RHパネル中での2つのマーカーの共起頻度(→確率)から距離(cR)を推定する。2つのマーカーの距離が近い程、両者の間を放射線が切断する確率は低いので、同じRHに保持される確率が高い。
- 【利点】照射する放射線量で断片化の程度を調節できる。
細胞遺伝学地図
ここまでの地図作成法だと、ローカルには関係性がわかるが、巨視的に見た時に染色体の向きがわからない。そこで、染色体上でマーカーを視覚化することでこの問題に対処する。
よく使われるものは、F蛍光染色体ハイブリッド形成法(FISH法,Fluorescence in situ hybridization)
制限酵素地図
- パルスフィールドゲル電気泳動
- ゲル電気泳動では、一定の分子量を超えると等速で泳動してしまい、泳動距離に差がつかないという問題があった。
- 電場の方向を交互に変換することでこの問題に対処。「パルス時間」=「方向転換時間」+「正味の泳動時間」と分解ができるが、方向転換に要する時間は分子量と相関があるので、これによって分子量による分解が可能。
- Rare cutterとFrequent cutter
ゲノムマッピング
STSコンテントマッピング
たくさんのクローンについてPCRをおこない、各STSが増えるかどうかを調べる。STSを共有するクローンはそこでオーバーラップしているはずなので、綺麗に重なるように(対角線上に並ぶように)並べれば、STSもクローンも整列できる。
フィンガープリンティング
相互にオーバーラップするクローンは制限酵素消化パターンが類似する。
重なりを確実に判定できる場合は伸びが少なく、大きな伸びを期待できる場合は判定が怪しい。
部分消化によって情報量を増やす。
ゲノムマッピング
- 1cM間隔でのマイクロサテライトマーカーの地図
- 疾患遺伝子の場所探し※
- ゲノム全体をカバーする整列クローンセット
- 疾患遺伝子単離の材料※
ゲノムシーケンシング
- ショットガン・シーケンシング:シークエンサーでランダムに配列を決める。
- アセンブリ:計算機で配列をつなぐ。
- フィニッシング:穴を埋める。
ショットガン・シーケンシング
- 主に長いDNAの塩基配列の決定に対して適用される配列決定手法。
- 対象DNAをランダムに切断
- 物理的(せん断、超音波)
- サイズを調節可能
- プラスミドベクターにクローニング
- ペアエンド・シークエンス(Paired-End Sequence)
- カバー数(coverage/depth)
- リード数×平均リード長/対象ゲノムサイズ
べースコール
電気泳動パターンには、 - 不均一なピーク高 - 不均一なピーク間隔 - 異常な挙動
がある。そこで、正解配列をたくさんシークエンスして学んだ読み取りの癖を活用する。元々は人間がパラメタ調整を行なっていたが、現在は機械学習。読み取りの正確さをスコア付けて表す。
アセンブリ
- 反復配列のマスク:ユニーク配列のみでアセンブリ→配列のコンティグ
- ペアエンドの情報
- クオリティスコアによる重み付け
- 信頼性の高いリードによる重なりを重視
- PHRAP:PHREDスコアを利用するアセンブラ
- コンティグのマージ
フィニッシング
- ギャップフィリング(Gap Filling)
- シークエンスギャップ
- クローンギャップ
- 低品質領域:PHREDスコアが低い→やり直し
- 方向性:どっち向きだかわからない→FISH,PCR,etc
ゲノムデータベースとゲノムのアノテーション
- データベース
- 遺伝子
- 統計的特徴:遺伝子に特徴的な配列や傾向を探す。
- 進化的特徴:他の生物でも保存されているかを調べる。
- 実験的証拠:実際に転写されているかを調べる。
- 遺伝子以外の要素
- 制御領域(プロモーター、エンハンサー)
- 染色体構成要素(テロメア、セントロメア、複製起点)
- 反復配列
- 偽遺伝子
ゲノムサイズと推定遺伝子数
生物種 | ゲノムサイズ | 推定遺伝子数 |
---|---|---|
大腸菌 | 4Mb | 4,000 |
出芽酵母 | 13Mb | 6,000 |
ショウジョウバエ | 120Mb | 14,000 |
シロイヌナズナ | 125Mb | 26,000 |
ヒト | 3200Mb | 20,000 |