第1回 2019/4/8
- 講師:浅井 潔
Lecture Schedule
# | date | teacher | title |
---|---|---|---|
1 | 4/8 | Asai | Introduction to sequence analysis |
2 | 4/15 | Gotoh | Pairwise sequence alignment |
3 | 4/22 | Asai | More on sequence alignment |
4 | 5/13 | Asai | Hidden Markov Model (HMM) |
5 | 5/20 | Kato | Multiple sequence alignment & Phylogeny |
6 | 5/27 | Asai | Advanced topics |
7 | 6/3 | Paper Test |
Evaluation
- Task reports (several times)
- Short paper tests
- 50% reports + short tests & 50% paper test
Biological sequence analysis
生物配列情報解析(biological sequence analysis)では、生物配列を文字列として扱う。
文字列を比較することがあらゆる解析の基本で、その中でも配列アラインメント(sequence alignment)が重要である。
Sequence analyses in practice
実際の配列情報解析では、以下の5つのことが基本的に行われる。
言葉 | meaning |
---|---|
シークエンシング | 目的の配列を実験などによって決定すること。現在では次世代シークエンサー(NGS)の登場によりかなり高速化している。 |
アセンブリ | 高速シーケンサーが出力したリードとよばれる短い DNA または RNA 塩基配列を次々と繋げていくことによって、元の完全な塩基配列を復元すること。 |
マッピング | クリーニング後のリードを、データベースからダウンロードしたリファレンス配列、あるいはアセンブリーしたリファレンス配列にマッピングし、各リードがどの遺伝子に由来するのかを決定すること。 |
アノテーション | 塩基配列データに遺伝子構造や遺伝子機能の情報、また文献情報などを注釈付けすること。 |
RNAシークエンシング | RNAをcDNAに変換したシーケンスリードの本数をカウントすることで、遺伝子の発現量を測定すること。 トランスクリプトーム(細胞内における遺伝子転写産物(mRNA)全てを要素とする集合。)の解析。 RNAの二次元構造の解析 |
余談
- 個人ゲノム情報に基づき健康な乳腺を切除した米女優アンジェリーナ・ジョリー
- GWAS(Genome-Wide Association Study):病気と特定の遺伝子の関係の研究
- ゲノムコホート研究:病気と遺伝・環境など全要因の関係の研究
- 個人ゲノム情報の実名での公開(慶應義塾大学 環境情報学部の冨田勝 教授)
- 匿名ゲノムからミスターXを当てるシンポジウムの開催(2014年医薬生命化学連合大会)
- ネアンデルタール人の完全なゲノム塩基配列:初期現生人類の間 で遺伝子流動が何度か起こったことが明らかに。
配列情報解析の要素技術
- 動的計画法(DP, Dynamic Programming)
- 大域アラインメント, Needleman-Wunsh algorithm (1970)
- 局所アラインメント, Smith-Waterman (1981)
- アフィンギャップ, Gotoh algorithm(1982)
- Seed & Extend for local alignment, homology search
- BLAST(S.F.Altschul et al.1990)
- BLAT(W.J.Kent et al.2002)
- LAST(M.Frith et al.2010)
- Suffix tree/array, FM index
- Linear order algorithms
- FFT/DFT as a replacement of DP
- Alignment, RNA structures
- MAFFT(K.Kato et al.2002)