Deep Sequencing
パス
ChIP-SeqにはChIP-Seqのデータハンドリング・QCのやり方があって、それをbioconductorのmosaicパッケージでやる話
ツール紹介 PeakSeq,MACS,FindPeaks,QuEST,CSAR ツールの実行は実行条件設定を伴い、結果が変わる 条件設定値をどうやって選ぶか、その最適化に関する話
基本的には、出てきたリードをマップし、そこからAlternative splicingのパターン検出と定量法・差の検定(FDR)の1提案
パス
ステップ サンプル収集・選び(探しものが入っているはずのサンプル) Deep sequencing アラインメント バリアント・コール バリアント・アノテーション バリアントのクラス分け(機能予測) 対応遺伝子確認 意義づけ 公共サイト一覧(検出バリアントが載っている…
この章は、パス
Short readsのマッピングツールは色々ある 大別すると2つ ハッシュテーブルに落とし込む Burrows-Wheeler変換する どれを選んでも「あちらを立てればこちらが立たず」 ツールの入出力特性評価、計算速度・リソース、などの比較は論文化されたりしている が…
どうして難しいか ゲノム上に似た配列が山ほどある 読まれたリードにエラーがある カバレージが不均一 PCR増幅の影響 データ量が莫大 明るい側面 Paired-end(で情報量が多い)と楽 De novo assemblyのツール Edena,CABOG,De Bruijn graph,SOAPdenovo,MetaVelv…
場所によってたくさん読まれるところと少なく読まれるところがある 興味は大きく分けて二つ 読まれた部位に違い(多型とか)があるかもしれないときに、多型があるか、あるならアレルは何か、その割合の推定値はいくつか(ホモとヘテロだけであれば、ホモか、ヘ…
マッピングの基礎知識 マッピングでは読まれたリードの配列がreference配列のある部分の合致する部分を探して、その位置を決める 長ければ長いほど配列の特異性は高く、特異的にマッピングされる(ゲノム上に1箇所だけが合致箇所と想定される)、短ければその…
大量のシークエンスデータが出るので、保管するにも移動するにも配列の圧縮は必須 その圧縮ツールの一つを紹介 算術符号(Arithmetic coding)に基礎を置く手法GReEn(入手はこちら)にある圧縮手法の一覧から 算術符号という手法 "0110"という0/1でできた配列が…
Raw data handling ->"CASAVA(Illumina)" Quality control and read manipulations ->CASAVA,FastQC De-novo Assembly Assemble -> SOAPdenovo, ABySS, Velvet, ALL-PATHS, Resequencing Mapping -> BWA, Bowtie, TopHat Variant calling -> SAMtools, GATK,…
Deep Sequencing Data Analysis (Methods in Molecular Biology)作者: Noam Shomron出版社/メーカー: Humana Press発売日: 2013/07/30メディア: ハードカバーこの商品を含むブログを見る 統計っぽいところを中心に『ぱらぱらめくる』ことにしたい 6章までが…