Computational tools,ぱらぱらめくる『Nature Reviews Genetics 2012』

  • ここに"Computational tools"として記事をまとめている
  • Text-mining solutions for biomedical research
  • Analysing and interpreting DNA methylation data
    • シークエンス・アレイ→処理・QC→データ可視化・(記述)統計→意味の読み取り的統計解析
    • 各段階にたくさんのツール
      • Bisulphite-sequencing data処理ツール
      • Bisulphite microarray data処理ツール
      • Enrichment-based data処理ツール
      • メチル化状態の視覚化ツール
      • メチル化状態の(記述統計的)差異検出ツール
      • メチル化状態の差異の統計学的解釈ツール
    • Epigenomeデータの公開先はGEO
  • Molecular phylogenetics: principles and practice
    • 主な手法分類
    • 大雑把な比較
      • 大規模データには距離法が威力、小規模データには尤度・ベイジアン
    • 基礎
      • マルコフ連鎖モンテカルロ
      • Neighbor Joining
      • 気にされている問題Long-branch attraction:Long-branchとshort-branchの継ぎ目で木のトポロジーが誤って推定されること
      • サンプリングエラー、リサンプリングによるバリデーション
  • A beginner's guide to eukaryotic genome annotation
    • ゲノム配列がどれくらい読み切ってあるかの評価基準
    • 遺伝子をゲノム上に当てる
      • Prediction(一番、「らしい」エクソン構造を見つける)かAnnotation(RNAバリアントについても総合的に情報化する)か
    • アノテーション手法は、精度と計算コストとのバランスにより、いろいろな段階わけが可能
  • Computer simulations: tools for population and evolutionary genetics
    • 何をシミュレーションする?
      • 数千マーカー、歴史を反映、組換えパターンを現実的に、種の性殖パターンを反映、複雑な形質を反映した上での選択圧、ボトルネックとAdmixture
    • どうシミュレーションする?
      • Forward/Backwardの2方向
      • 40くらいのパッケージのリストがある(こちら)
    • なんのために使う?
      • 将来予測、疫学アプローチの成否予測
      • 統計的に過去を推定
      • 統計解析手法のパフォーマンス評価
    • シミュレーションスタディのデザイニング
      • ゴール設定
      • モデル設定
      • パラメタ決定
      • シミュレーション中のモニタリング指標の剪定
      • ForwardにするかBackwardにするか
      • プログラムを選ぶ
      • プログラムを走らせる
      • 結果を読む・解釈する
      • 場合によっては実データとシミュレーション結果とを比べる
      • 結論を出す
  • Repetitive DNA and next-generation sequencing: computational challenges and solutions
    • ヒトゲノムの繰り返し配列
      • Minisatellite, microsatellite, satellite
      • SINE
      • DNA transposon
      • LRT retrotransposon
      • LINE
      • rDNA
      • Segmental duplications and other classes
      • 性染色体と常染色体とで繰り返し配列の存在比率に差がある
    • 次世代シークエンサーのゲノムアラインメント・アセンブリのツールリスト
      • SV/CNV detection
        • BreakDancer
        • CNVnator
        • He et al.
        • PEMer
        • VariationHunter
      • SNP detection
        • GATK
        • SAMtools
        • SOAPsnp
        • Sniper
        • VarScan
      • Short-read alignment
        • Bowtie
        • BFAST
        • Burrows-Wheeler Aligner(BWA)
        • SOAPAligner
      • De novo assembly
        • Allpaths-LG
        • CABOG
        • SGA
        • SOAPdenovo
        • Velvet
    • トランスクリプトーム用
      • Spliced read alignment
        • GSNAP
        • MapSplice
        • RUM
        • SpliceMap
        • TopHat
      • Reference-guided transcript assembly
        • Fufflinks
        • ERANGE
        • G-Mo.R-Se
        • Myrna
        • Scripture
      • De novo transcript assembly
        • Multiple-k
        • Rnnotator
        • Trinity
        • Trans-ABySS
        • Velvet-Oases
    • 繰り返し配列が邪魔をする
    • 読み長が長くなれば、問題は縮小する
    • やっぱ、長いライブラリを作ってそれを読むこととサンガー法等の長いシークエンシングとの併用で乗り越える?
  • Experimental and analytical tools for studying the human microbiome
    • ストラテジー2つ
      • Targeted amplicon アプローチ(16S rDNAとか)
      • Metagenomic analysis(shotgun amplification)
    • Targeted amplicon アプローチ
    • Metagenomic analysis
      • Contigsにアセンブルする
      • データベースと照合する
      • パスウェイ対応を取る
      • 多変量解析・視覚化
    • プライマー選びとその影響
    • サンプリング、コンタミ
  • SGAはNGSデータ圧縮手法