8. 疾患バリアントの検出のためのエクソーム・シークエンシング:ぱらぱらめくる『Deep Sequencing Data Analysis』

  • ステップ
    • サンプル収集・選び(探しものが入っているはずのサンプル)
    • Deep sequencing
    • アラインメント
    • バリアント・コール
    • バリアント・アノテーション
    • バリアントのクラス分け(機能予測)
    • 対応遺伝子確認
    • 意義づけ
  • 公共サイト一覧(検出バリアントが載っているかもしれない/評価に使えるかもしれないサイト)
    • OMIM,NHGRI-GWAS catalog,Genetic Association Database, Phenopedia and Genopedia, Human Phenotype Ontology, Mouse Genome Database, GERP++, PhyloP, PhastCons, Duplicated Genes Database, dbDNV, NHLBI Exome Sequencing Project, dbSNP, Complete Genomics, 1000 Genome Project, miRBase, TargetScan, miRNA.org, Rfam,Biocarta,KEGG< REACROM, BioGRID interaction database, STRING protein functional interactions database, Human protein-protein interaction prediction database, Catalog of Somatic Mutations in Cancer, Annovar, Ensembl SNP effect predictor,Snpeff, VariantClassifier, SNPnexus, MutationAssessor, UCSC genome browser, Genome Analysis Toolkit, SIFT, PolyPhen2, MutationTaster LRT
  • サンプル選び
    • 遺伝形式がわかっていれば、それによって選り分けられるように選ぶ
  • バリアント・コール
    • ここでのコールは、4章の議論と本来は関係するが、素朴なやり方
    • デプスが多いか少ないか
    • 同一配列は重複読みかもしれないので、一つにする
    • その上でレファレンス配列と違う配列が確かにある、というところが「光る」
    • ディテクトされた変異は、リードとその当該塩基コールのクオリティがよいかどうかをチェックする
    • これにより、「よく読めている・質の高い、バリアント」リストができる
  • バリアント・アノテーション
    • コーディング遺伝子、ノン・コーディング遺伝子との対応付け
    • 機能予測(インフォマツール)
    • 機能予測(種間保存)
    • 新規のバリアント?すでに多型登録してある?
  • リストアップされたバリアントに重みをつける
  • 重みのあるバリアントを持つ遺伝子についてさらに手のかかる評価をする
    • パスウェイ、フェノタイプとの関連の報告、gene-gene protein-protein interactions、パラログ・遺伝子ファミリー、体細胞変異での機能性(癌での変異)