メソッド早読み:実践編

  • Figure 1を見る
    • Fig 1(a)少数サンプル、mRNA/miRNA別、の定量繰り返し実験での、相関の確認。個人細胞株間の相関と、実験ラボ間の相関と、その両方の組合せの相関
      • これはトランスクリプトーム次世代シークエンサー実験のデータQCのこと
      • 気にすること
        • Spearman rank correlation って"correlation相関"の指標らしいけれど、細かいことはわかってないかも→宿題「Spearman rank correlationって何?」
        • マップされたリード総本数に関してのみnormalizeした後の結果→宿題「"リード総本数に関するnormalization"ってどういうこと?」
    • Fig 1(b)
      • これは論文の根幹である(1)トランスクリプトの構造(スプライスバリアントなど)と(2)発現量との多寡を比較している部分らしい→大事
      • 気にすること
        • "The proportion of expression level variation (as opposed to splicing) of the total transcription variation between individuals in each population, measured per gene"とある
          • →宿題「どういうものなのかきちんと知るべき」→本文確認→サプル図Sup Figs 13,14確認必要→Sup Fig 14でさらに"ratio"の説明はSupple Method参照、と→Suppl Methodsの9. mRNA variation in populations
            • "where Vls/Vt =1 impliex that onle gene expression contributes to transcript variablity, and Vls/Vt=0 implies that only transcript usage variation contributes to transcription variability of the gene"とあるので、この比は0-1の値をとって小さければスプライシングバリアント別の比率の違いの寄与分が大きく、比が大きければ、発現量の違いの寄与分が大きいらしい
          • →宿題「個々の遺伝子ごとに出す値らしいけれど、1個の遺伝子についてだったら、手作業で計算できるかな?どうやるの?」
            • 同じくSuppl Methods 9.を読むと、スプライシングバリアントを考慮して、それぞれに空間軸を与えて、個人の発現パターンを空間にプロットし、そのばらつき具合を、総量の軸とそれ以外の軸に「分散分解」するようなものらしい"Briefly, for each gene, the samples are represented in the R^T space using transcription expression levels (T=number of expressed transcripts for this gene), from which we can calculate the total variability (Vt) in this space. Projecting the samples in a model of constant splicing ratios gives us an estimate of expression level variation (Vls). The ratio Vls/Vt estimate the contribution of gene expression in the transcript abundance variability, where Vls/Vt =1 impliex that onle gene expression contributes to transcript variablity, and Vls/Vt=0 implies that only transcript usage variation contributes to transcription variability of the gene"
    • Fig 1(c)
      • Fig 1(b)は遺伝子ごとに、発現の多様性が発現総量によるかトランスクリプトバリアントの振り分けによるかの分布を、民族別にとったが、民族差を民族ペアごとにひかくしてみた図で、(1)トランスクリプトの構造(スプライスバリアントなど)と(2)発現量との多寡の民族差に関する、大事なデータの一部
      • 3群(発現量の多様性優位、トランスクリプトバリアント振り分け優位、その中間)に遺伝子を分けてその比率を示しているし、また、違いのある遺伝子数も示してあるようだ
        • →宿題「違いのある遺伝子」はどうやって決めた?
        • →宿題「ある遺伝子が、○●優位」っていうのはどうやって決めた?
        • ま、何かしら「しかるべき検定・足切り基準」を決めた、という感じだし、深追いしたければしてもよいけど、そんなに複雑なことを盛り込めそうな方法でもないので、放置しておいても問題なさそう
    • Fig 1(d)
      • Figure legendを読んだだけじゃ、なんのことだかわからない…
      • miRNAがmRNAの制御に正に働くか負に働くかを示したいらしいが…、Transcriptome variationという根幹データではなさそうなので、省略、可
  • Table 1を見る
    • eQTLのテーブルらしい
    • TranscriptomeとGenomeとの連携だから根幹データ
    • 何を比較しているかというと
      • 複数のeQTLs(Exon eQTL, Gene eQTL, Transcript ratio QTL,...)
        • →宿題「これらって何?」
        • 本文の"Genetic effects on the transcriptome"にこのあたり書いてあるから、チェックしてメモ
      • 民族別、Union、と集団の群分けごとにも見ている
        • →宿題「Total,Unionって何?」
          • Unionが人種合算らしいことは本文から読み取れる。じゃあ、Totalは該当するカテゴリの母数らしい(説明ないけど、それ以外にはありえなさそう…どこかでついでに気づけばそれでよし、そうでなければ忙しいときは放置、と)
  • Figure 2を見る
    • 以下、同様