パーミュテーション

離散問題の連続化

こちらで方向統計学をぱらぱらめくっている ここに順列・パーミュテーション(n!)を(n-1)^2次元にある単位球面上に埋め込む話とそれを方向統計学と結び付けて、組み合わせ・離散問題を球面上の連続分布問題に結びつける話がある 状態空間で時間経過を過去の情…

構造化集団データにおけるランダマイゼーションテスト(論文紹介)

論文 A randomization test for controlling population stratification in whole-genome association studies. Kimmel G, Jordan MI, Halperin E, Shamir R, Karp RM. Am J Hum Genet. 2007 Nov;81(5):895-905■ 方法 ●大規模SNPジェノタイプデータをもとに…

価値の高い場合に集中する

マルチプルテスティング補正において頑健な手法としてパーミュテーションテストがある。GWAにおいても形質のラベルシャッフリングの全順列を調べ上げる方法と、全順列は多すぎるので、モンテカルロ・シミュレーションにより、順列を抽出チェックすることで、…

関連SNPの統計量空間の狭さ:ラベルパーミュテーション用エクセル2

昨日、ラベルパーミュテーションをエクセルで簡易に行ってみた。 今日は、相互に独立でない2SNP(連鎖不平衡など)において同様にエクセルでラベルパーミュテーションし、その統計量を比較・プロットしてみた。 これは、2SNPのジェノタイプの近さと、2SNPか…

ラベルパーミュテーション用エクセル

パーミュテーションテストはサンプルの従属変数ラベルの付け替えによって、統計量の分布を得る手法である。従属変数ラベルの付け替えを、とりうるすべてについて行えば正確確率検定と同じ結果になる。今、中規模以上のサンプルについては、ラベルの付け替え…

Label-swapping と Gene-dropping

弧発例を集めたケースコントロール関連解析の場合のパーミュテーションテストにおいては、ケース・コントロールのラベルを付け替える(Label-swappin)ことによって、新たなデータセットを作り、統計量を計算することができる。他方、家系データの場合には、ア…

メモ

大規模データ・複雑データを一括してシンプルに扱うことを念頭に置いたメモ。 パーミュテーションテストについては、こちら、FDRについては、こちら、のそれぞれ、前掲記事と関連している。 SNP data の処理 0 データ構成 マーカー数 M サンプル数 N(ケース…