遺伝子多型解析を数か月でできるようになるために〜第6回

  • 実施日20110721
  • 今日はFDRにまつわるq値(リンク)
    • 関連してresampling
  • 復習Rの使い方
    • allele freq=a
    • fixatoin index =f
    • 集団のジェノタイプ頻度分布はW(MM)=a^2+a(1-a)f,W(Mm)=2a(1-a)(1-f),W(mm)=(1-a)^2+a(1-a)f
    • 疾患のprevalenceをpとして
    • 3ジェノタイプのGRRをr^2,r,1とする
    • D(MM),D(Mm),D(mm),H(MM),H(Mm),H(mm)を出す
    • D(MM)+D(Mm)+D(mm)=p,H(MM)+H(Mm)+H(mm)=1-p
    • D(ij)+H(ij)=W(ij)
    • D(MM)/W(MM):D(Mm)/W(Mm):D(mm)/W(mm)=r^2:r:1
    • 以上を解くと、この集団のフェノタイプ別・ジェノタイプ別の頻度が出る
  • 今度は、フェノタイプ・ジェノタイプ別頻度を使って、ケースコントロールサンプリングを実施し、トレンドテストのカイ自乗値とp値を出す。
    • サンプリングを10000回行って、カイ自乗値とp値の分布をとって、その基本的な統計量を出すとともに、分布を図示する
    • 関数 runif(), sample(),for() (ループ),hist()
    • これらを使って、GWAS等で、任意の設定で、パワー計算等を可能にすること(課題)