次世代シークエンサー

RNAseq(スプライスバリアント)処理手法の比較尺度

スプライシング・バリエーションの評価に関して複数の方法をさまざまな尺度で比較しているペイパーこちら その尺度の詳細は、リンク先論文のサプルのさらにサプル・ノートの最後の最後の45ページ目に色々あります。 Alignment yield "We measured the propor…

配列し損ねるとき

論文を紹介していただく機会があった。こちらの論文。 RNA配列上に遺伝子多型があって、そのアレル別の発現量比推定をしたい、というときに、RNA-seqのデータをレファレンスゲノムにマッピングする過程をはさむと、ゲノムレファレンスアレルを持つ配列がうま…

次世代シークエンサーを使ったデータ解析〜オミックス統計学入門2014

ひとまず、次世代データ、Deep sequencing データの資料はこんなもの 「こうすれば、よい」という段階ではないので、コンセプト説明が重くなり、また、いざというときの汎用性重視になった…結局、「入門」としては役に立てにくいのだが… まだ、1度も講義使用…

13. cDNA LigationとMassive Parallel SequencingでReverse Transcriptase Termination Sitesを見つける:ぱらぱらめくる『Deep Sequencing Data Analysis』

パス

12. ChIP-seqデータの統計解析(MOSAiCSで):ぱらぱらめくる『Deep Sequencing Data Analysis』

ChIP-SeqにはChIP-Seqのデータハンドリング・QCのやり方があって、それをbioconductorのmosaicパッケージでやる話

11. ChIP-seqで転写因子結合部位を検出する。その方法の最適化:ぱらぱらめくる『Deep Sequencing Data Analysis』

ツール紹介 PeakSeq,MACS,FindPeaks,QuEST,CSAR ツールの実行は実行条件設定を伴い、結果が変わる 条件設定値をどうやって選ぶか、その最適化に関する話

10. RNA SequencingでAlternative Splicing の起き方を調べる:ぱらぱらめくる『Deep Sequencing Data Analysis』

基本的には、出てきたリードをマップし、そこからAlternative splicingのパターン検出と定量法・差の検定(FDR)の1提案

9. Deep SequencingでmiRNAのRNA editing sitesを見つける:ぱらぱらめくる『Deep Sequencing Data Analysis』

パス

8. 疾患バリアントの検出のためのエクソーム・シークエンシング:ぱらぱらめくる『Deep Sequencing Data Analysis』

ステップ サンプル収集・選び(探しものが入っているはずのサンプル) Deep sequencing アラインメント バリアント・コール バリアント・アノテーション バリアントのクラス分け(機能予測) 対応遺伝子確認 意義づけ 公共サイト一覧(検出バリアントが載っている…

7. Short ReadsからShort Tandem Readsの情報を取る:ぱらぱらめくる『Deep Sequencing Data Analysis』

この章は、パス

6. エクソーム・シークエンシングのためのShort Read Mapping:ぱらぱらめくる『Deep Sequencing Data Analysis』

Short readsのマッピングツールは色々ある 大別すると2つ ハッシュテーブルに落とし込む Burrows-Wheeler変換する どれを選んでも「あちらを立てればこちらが立たず」 ツールの入出力特性評価、計算速度・リソース、などの比較は論文化されたりしている が…

5. Deep Sequenceデータのアセンブル・アルゴリズム。基礎と気をつけるべきこと:ぱらぱらめくる『Deep Sequencing Data Analysis』

どうして難しいか ゲノム上に似た配列が山ほどある 読まれたリードにエラーがある カバレージが不均一 PCR増幅の影響 データ量が莫大 明るい側面 Paired-end(で情報量が多い)と楽 De novo assemblyのツール Edena,CABOG,De Bruijn graph,SOAPdenovo,MetaVelv…

4. ハイ-スループットデータのカバー具合に関する統計モデル:ぱらぱらめくる『Deep Sequencing Data Analysis』

場所によってたくさん読まれるところと少なく読まれるところがある 興味は大きく分けて二つ 読まれた部位に違い(多型とか)があるかもしれないときに、多型があるか、あるならアレルは何か、その割合の推定値はいくつか(ホモとヘテロだけであれば、ホモか、ヘ…

3. Short Read Mapping の正確さ:ぱらぱらめくる『Deep Sequencing Data Analysis』

マッピングの基礎知識 マッピングでは読まれたリードの配列がreference配列のある部分の合致する部分を探して、その位置を決める 長ければ長いほど配列の特異性は高く、特異的にマッピングされる(ゲノム上に1箇所だけが合致箇所と想定される)、短ければその…

2. 配列データを圧縮する(GReEnで):ぱらぱらめくる『Deep Sequencing Data Analysis』

大量のシークエンスデータが出るので、保管するにも移動するにも配列の圧縮は必須 その圧縮ツールの一つを紹介 算術符号(Arithmetic coding)に基礎を置く手法GReEn(入手はこちら)にある圧縮手法の一覧から 算術符号という手法 "0110"という0/1でできた配列が…

1. ハイ-スループット シークエンス実験入門。実験デザインとバイオインフォマティクス解析:ぱらぱらめくる『Deep Sequencing Data Analysis』

Raw data handling ->"CASAVA(Illumina)" Quality control and read manipulations ->CASAVA,FastQC De-novo Assembly Assemble -> SOAPdenovo, ABySS, Velvet, ALL-PATHS, Resequencing Mapping -> BWA, Bowtie, TopHat Variant calling -> SAMtools, GATK,…

目次:ぱらぱらめくる『Deep Sequencing Data Analysis』

Deep Sequencing Data Analysis (Methods in Molecular Biology)作者: Noam Shomron出版社/メーカー: Humana Press発売日: 2013/07/30メディア: ハードカバーこの商品を含むブログを見る 統計っぽいところを中心に『ぱらぱらめくる』ことにしたい 6章までが…

いまどきのゲノム解析

夏も終わり 夏休みの宿題(のようなもの)として「自己免疫疾患のゲノム解析の現状」と題するレポートを書かないといけない さて。 キーワードを決めて、少しレビューの検索をしよう ゲノム・エピゲノム・レアバリアント・シングルセル いずれも次世代シークエ…

発現データの指標

こちらの2013/01/18の記事で次世代シークエンサーを用いた発現量解析の話がある。量的指標としてRPKMについて言及している RPKM Reads Per Kirobase per Million mapped reads こちら 関連して。RPKMとAverage normalized abundanceとその比較 こちら 指標は…

論文の図を読む

Estimation of rearrangement phylogeny for cancer genomesのFigure1では、癌細胞ゲノムに起きる、点突然変異とコピーナンバー変化、逆位などの生成と、諸変化が起きた後に観察できる状態の記載法と、観察から諸変化を逆問題的(こちら)に解くためのグラフ理…

1細胞ゲノム解析

総説 「1細胞ゲノム解析」の手法の特徴を決める尺度 細胞をより分ける方法 処理細胞の数 解析対象となる遺伝子の数 検出に用いる技術 対象となる細胞・組織・条件 色々な手法 FISH(mRNA fluorescent in situ hybridization) 処理細胞数:100 遺伝子数:3-4 技…

検出したいものがマスクされる

見たいアレルがプールされたサンプル中にあるかどうかを調べたい 実験のコールミスがある 標本中の真のアレル別本数がわかっているものとする そこから指定本数を取り出して実験する 取り出された分の真のアレル本数分布が出る それに、さらにコールエラーを…

de novo 変異の検定

こちら("Exome sequencing supports a de novo mutational paradigm for schizophrenia")の論文では、表現型に「機能性の予想される」「de novo 変異」をエクソーム・シークエンスで探している de novo と思われる変異をシークエンシングで見つけて その変異…

メモ

こちらから メチローム 配列手順 メチル化状態特化対応(メチル化屋):Alignment of bisulfite converted reads to the reference genome. 位置決め((マップ屋):Detailed mapping of methylcytosine positions. 違いの検出・検定(統計屋):Discovery of diff…

ぱらぱらめくる『Nature Reviews Genetics 2011』2-3 次世代シークエンサー(ゲノム)

Genotype and SNP calling from next-generation sequencing data. Rasmus Nielsen, Joshua S. Paul, Anders Albrechtsen & Yun S. Song,p443 | doi:10.1038/nrg2986 次世代シークエンサー ジェノタイピング・ソフトウェア SOAP2->SOAP3 realSFS Samtools GA…

ぱらぱらめくる『Nature Reviews Genetics 2011』2-2 次世代シークエンサー(トランスクリプトーム)

次世代forトランスクリプトームのアセンブルについては2011 Octでも Next-generation transcriptome assembly. Jeffrey A. Martin & Zhong Wang,p671 | doi:10.1038/nrg3068

ぱらぱらめくる『Nature Reviews Genetics 2011』3 Microbiome

Experimental and analytical tools for studying the human microbiome.Justin Kuczynski, Christian L. Lauber, William A. Walters, Laura Wegener Parfrey, José C. Clemente, Dirk Gevers & Rob Knight,p47 | doi:10.1038/nrg3129 Microbiomeに次世代シ…

ぱらぱらめくる『Nature Reviews Genetics 2011』2 次世代シークエンサー

Repetitive DNA and next-generation sequencing: computational challenges and solutions.Todd J. Treangen & Steven L. Salzberg,p36 | doi:10.1038/nrg3117 次世代シークエンサー:ゲノムリードのアラインメント・アセンブリ SV/CNV detection BreakDanc…

次世代シークエンサーでジェノタイプコール

レビュー:Genotype and SNP calling from next-generation sequencing data.Nat Rev Genet. 2011 Jun;12(6):443-51. 論文:A framework for variation discovery and genotyping using next-generation DNA sequencing data. Nature Genetics 43, 491–498 (20…

Burrows-Wheeler変換

参考→こちらのPPTはよい Burrows-Wheeler変換の特徴をそのPPTから抜粋 可逆変換 圧縮しやすい(同じ文字が並びやすいから) 元の文書なしで全文検索が可能 部分文字列・部分一致文字列探索に向いている→次世代シークエンサーのマッピングに応用 接尾辞木の節点…