Computational tools,ぱらぱらめくる『Nature Reviews Genetics 2012』
- ここに"Computational tools"として記事をまとめている
- Text-mining solutions for biomedical research
- 文字情報ベースの文献から情報を抽出し、データベース化・グラフ化し新たな知を見出すための計算機的処理
- 情報抽出
- 情報の分解・パーツ化
- Knowledge baseの構築(たとえばPharmGKB)
- データ統合→知識発見→仮説構築→データ統合→知識発見…
- ツールリスト
- 文字情報ベースの文献から情報を抽出し、データベース化・グラフ化し新たな知を見出すための計算機的処理
- Analysing and interpreting DNA methylation data
- Molecular phylogenetics: principles and practice
- 主な手法分類
- 距離法
- Parsimony(倹約法・けちけち法)
- 尤度
- ベイジアン
- 大雑把な比較
- 大規模データには距離法が威力、小規模データには尤度・ベイジアン
- 基礎
- 木
- マルコフ連鎖モンテカルロ
- Neighbor Joining
- 気にされている問題Long-branch attraction:Long-branchとshort-branchの継ぎ目で木のトポロジーが誤って推定されること
- サンプリングエラー、リサンプリングによるバリデーション
- 主な手法分類
- A beginner's guide to eukaryotic genome annotation
- Computer simulations: tools for population and evolutionary genetics
- 何をシミュレーションする?
- 数千マーカー、歴史を反映、組換えパターンを現実的に、種の性殖パターンを反映、複雑な形質を反映した上での選択圧、ボトルネックとAdmixture
- どうシミュレーションする?
- Forward/Backwardの2方向
- 40くらいのパッケージのリストがある(こちら)
- なんのために使う?
- 将来予測、疫学アプローチの成否予測
- 統計的に過去を推定
- 統計解析手法のパフォーマンス評価
- シミュレーションスタディのデザイニング
- ゴール設定
- モデル設定
- パラメタ決定
- シミュレーション中のモニタリング指標の剪定
- ForwardにするかBackwardにするか
- プログラムを選ぶ
- プログラムを走らせる
- 結果を読む・解釈する
- 場合によっては実データとシミュレーション結果とを比べる
- 結論を出す
- 何をシミュレーションする?
- Repetitive DNA and next-generation sequencing: computational challenges and solutions
- ヒトゲノムの繰り返し配列
- Minisatellite, microsatellite, satellite
- SINE
- DNA transposon
- LRT retrotransposon
- LINE
- rDNA
- Segmental duplications and other classes
- 性染色体と常染色体とで繰り返し配列の存在比率に差がある
- 次世代シークエンサーのゲノムアラインメント・アセンブリのツールリスト
- SV/CNV detection
- BreakDancer
- CNVnator
- He et al.
- PEMer
- VariationHunter
- SNP detection
- GATK
- SAMtools
- SOAPsnp
- Sniper
- VarScan
- Short-read alignment
- Bowtie
- BFAST
- Burrows-Wheeler Aligner(BWA)
- SOAPAligner
- De novo assembly
- Allpaths-LG
- CABOG
- SGA
- SOAPdenovo
- Velvet
- SV/CNV detection
- トランスクリプトーム用
- Spliced read alignment
- GSNAP
- MapSplice
- RUM
- SpliceMap
- TopHat
- Reference-guided transcript assembly
- Fufflinks
- ERANGE
- G-Mo.R-Se
- Myrna
- Scripture
- De novo transcript assembly
- Multiple-k
- Rnnotator
- Trinity
- Trans-ABySS
- Velvet-Oases
- Spliced read alignment
- 繰り返し配列が邪魔をする
- 読み長が長くなれば、問題は縮小する
- やっぱ、長いライブラリを作ってそれを読むこととサンガー法等の長いシークエンシングとの併用で乗り越える?
- ヒトゲノムの繰り返し配列
- Experimental and analytical tools for studying the human microbiome
- SGAはNGSデータ圧縮手法