連鎖不平衡のLODと尤度比検定



※ この記事の本体部分(Arlequinを用いた遺伝解析実習はこちら)

ペアワイズLDの算出はLDブロックの基本である。論文等でもっともよく用いられるLD指標はr^2,D'である。また、Haploviewにては、それらに加えて、LODが用いられている。D',r^2については、比較的説明が豊富であるがLODについては基本的すぎる嫌いもあり、説明がごく少ない。以下に若干、説明する。

ある2SNPのdiplotypic データについて、そこに『連鎖平衡がある、という仮説を帰無仮説とし、連鎖不平衡がある、という仮説を対立仮説として、両仮説の比較』と尤度比を用いて行ったものである。

ペアワイズSNPにつきEMアルゴリズムで4ハプロタイプ頻度を推定する。一方、2SNPのアレル頻度に基づき、連鎖平衡仮説における4ハプロタイプ頻度も推定する。今、2SNPが作る9ジェノタイプの観測人数と、2つの仮説(連鎖不平衡仮説と連鎖平衡仮説)におけるハプロタイプ頻度推定値が得られたことになる。

今、2つの仮説の対数尤度が計算できる

  • 9ジェノタイプの観測数N_obs =({I_1,_I_2,I_3,¥cdots,I_9)
  • ハプロタイプの推定頻度Freq_haps=(q_{11},q_{12},q_{21},q_{22})
  • このときの対数尤度は
    •  LogLikelihood ¥propto I_1 ¥times log(q_{11}^2) + I_2 ¥times log(2 ¥times q_{11} ¥times q_{12}) + I_3 ¥times log(q_{12}^2) + I_4 ¥times log(2 ¥times q_{11} ¥times q_{21}) + I_5 ¥times log(2 ¥times (q_{11} ¥times q_{22} + q_{12} ¥times q_{21})) + I_6 ¥times log(2 ¥times q_{12} ¥times q_{22})  + I_7 ¥times log(q_{21}^2) + I_8 ¥times log(2 ¥times q_{21} ¥times q_{22}) + I_9 ¥times log(q_{22}^2)
  • Haploviewの場合
    • 常用対数(底を10)で計算して、不平衡仮説の対数尤度から平衡仮説の対数尤度を引いた値が、連鎖不平衡のLODであり、Haploviewの出力として得られるものである。
  • Arlequinの場合
    • 自然対数(底をe)で計算して、不平衡仮説の対数尤度(LnLHood LD)と平衡仮説のそれ(LnHood LE)とを示し、
    • さらに自然対数の対数尤度の差の2倍の値は、自由度1のカイ自乗分布に従うことから、差の2倍をChi-square test valueとして示し、それに対して自由度1でのp値が示されている。また、Arlequinでは、対数尤度を用いる方法のほかに、Permutation testも実行しており、その結果がExact Pとして示されている
    • Arlequinの出力

Pair(0, 1)
LnLHood LD : -102.78139 LnLHood LE : -115.99814
Exact P= 0.00000 + 0.00000 (100172 permutations done) Chi-square test value=26.43349 (P = 0.00000, 1 d.f.)

    • なお、Arlequinの計算はPermutaionベースであり、また、ここでは示さないが、diploidデータではなく、haploidデータを直接入力すると、正確検定を行うこともあり、Haploviewのそれよりも正確な値が得られるが、計算時間がHaploviewと比べて勝負にならないくらい遅いので、原理の確認用と思っていればよい。
  • なお、AABB 50(人),AABb 20,AAbb 10,AaBB 5, AaBb 5, Aabb 4,aaBB 3,aaBb 2,aabb 1の場合における、haploviewのLODは5.74、Arlequinの結果は上に示したとおり。また、これらを計算させたエクセルファイルはこちら
  • 文献はSlatkin M, Excoffier L. Testing for linkage disequilibrium in genotypic data using the Expectation-Maximization algorithm. Heredity 1996;76:377-383. など
  • 末尾にArlequin用のファイルと、Haploview用のファイル(xxx.pedファイルとxxx.infoファイル)をつける
    • Arlequin用

[Profile]
Title="Gen1"
NbSamples=1
GenotypicData=1
GameticPhase=0
MissingData="N"
DataType=DNA
LocusSeparator=NONE


[Data]
[[Samples]]
SampleName="SampleA"
SampleSize=100
SampleData={
A1 50 AA
AA
A2 20 AA
AC
A3 10 AC
AC
A4 5 AA
CA
A5 5 AC
CA
A6 4 AC
CC
A7 3 CA
CA
A8 2 CA
CC
A9 1 CC
CC
}

Haploview用(xxx.ped)


6341 6341 0 0 2 0 1 1 1 1
6342 6342 0 0 2 0 1 1 1 1
6343 6343 0 0 2 0 1 1 1 1
6344 6344 0 0 2 0 1 1 1 1
6345 6345 0 0 2 0 1 1 1 1
6346 6346 0 0 2 0 1 1 1 1
6347 6347 0 0 2 0 1 1 1 1
6348 6348 0 0 2 0 1 1 1 1
6349 6349 0 0 2 0 1 1 1 1
6324 6324 0 0 2 0 1 1 1 1
6323 6323 0 0 2 0 1 1 1 1
6322 6322 0 0 2 0 1 1 1 1
6321 6321 0 0 2 0 1 1 1 1
6328 6328 0 0 2 0 1 1 1 1
6327 6327 0 0 2 0 1 1 1 1
6326 6326 0 0 2 0 1 1 1 1
6325 6325 0 0 2 0 1 1 1 1
6330 6330 0 0 2 0 1 1 1 1
6329 6329 0 0 2 0 1 1 1 1
6238 6238 0 0 2 0 1 1 1 1
6239 6239 0 0 2 0 1 1 1 1
6236 6236 0 0 2 0 1 1 1 1
6237 6237 0 0 2 0 1 1 1 1
6242 6242 0 0 2 0 1 1 1 1
6243 6243 0 0 2 0 1 1 1 1
6240 6240 0 0 2 0 1 1 1 1
6241 6241 0 0 2 0 1 1 1 1
6234 6234 0 0 2 0 1 1 1 1
6235 6235 0 0 2 0 1 1 1 1
6221 6221 0 0 2 0 1 1 1 1
6220 6220 0 0 2 0 1 1 1 1
6223 6223 0 0 2 0 1 1 1 1
6222 6222 0 0 2 0 1 1 1 1
6217 6217 0 0 2 0 1 1 1 1
6216 6216 0 0 2 0 1 1 1 1
6219 6219 0 0 2 0 1 1 1 1
6218 6218 0 0 2 0 1 1 1 1
6215 6215 0 0 2 0 1 1 1 1
6214 6214 0 0 2 0 1 1 1 1
6250 6250 0 0 2 0 1 1 1 1
6251 6251 0 0 2 0 1 1 1 1
6252 6252 0 0 2 0 1 1 1 1
6253 6253 0 0 2 0 1 1 1 1
6246 6246 0 0 2 0 1 1 1 1
6247 6247 0 0 2 0 1 1 1 1
6248 6248 0 0 2 0 1 1 1 1
6249 6249 0 0 2 0 1 1 1 1
6244 6244 0 0 2 0 1 1 1 1
6245 6245 0 0 2 0 1 1 1 1
6233 6233 0 0 2 0 1 1 1 1
6232 6232 0 0 2 0 1 1 1 1
6231 6231 0 0 2 0 1 1 1 1
6230 6230 0 0 2 0 1 1 1 1
6229 6229 0 0 2 0 1 1 1 1
6228 6228 0 0 2 0 1 1 1 1
6227 6227 0 0 2 0 1 1 1 1
6226 6226 0 0 2 0 1 1 1 1
6225 6225 0 0 2 0 1 1 1 1
6224 6224 0 0 2 0 1 1 1 1
6292 6292 0 0 2 0 1 1 1 1
6293 6293 0 0 2 0 1 1 1 1
6290 6290 0 0 2 0 1 1 1 1
6291 6291 0 0 2 0 1 1 1 1
6288 6288 0 0 2 0 1 1 1 1
6289 6289 0 0 2 0 1 1 1 1
6286 6286 0 0 2 0 1 1 1 1
6287 6287 0 0 2 0 1 1 1 1
6299 6299 0 0 2 0 1 1 1 1
6300 6300 0 0 2 0 1 1 1 1
6267 6267 0 0 2 0 1 1 1 1
6266 6266 0 0 2 0 1 1 1 1
6269 6269 0 0 2 0 1 1 1 1
6268 6268 0 0 2 0 1 1 1 1
6271 6271 0 0 2 0 1 1 1 1
6270 6270 0 0 2 0 1 1 1 1
6273 6273 0 0 2 0 1 1 1 1
6272 6272 0 0 2 0 1 1 1 1
6265 6265 0 0 2 0 1 1 1 1
6264 6264 0 0 2 0 1 1 1 1
6313 6313 0 0 2 0 1 1 1 1
6314 6314 0 0 2 0 1 2 1 1
6315 6315 0 0 2 0 1 2 1 1
6316 6316 0 0 2 0 1 2 1 1
6317 6317 0 0 2 0 1 2 1 1
6318 6318 0 0 2 0 1 2 1 1
6319 6319 0 0 2 0 1 2 1 2
6320 6320 0 0 2 0 1 2 1 2
6311 6311 0 0 2 0 1 2 1 2
6312 6312 0 0 2 0 1 2 1 2
6281 6281 0 0 2 0 1 2 1 2
6280 6280 0 0 2 0 1 2 2 2
6279 6279 0 0 2 0 1 2 2 2
6278 6278 0 0 2 0 1 2 2 2
6285 6285 0 0 2 0 1 2 2 2
6284 6284 0 0 2 0 2 2 1 1
6283 6283 0 0 2 0 2 2 1 1
6282 6282 0 0 2 0 2 2 1 1
6277 6277 0 0 2 0 2 2 1 2
6276 6276 0 0 2 0 2 2 1 2
6207 6207 0 0 2 0 2 2 1 1

Haploview用(xxx.info)


marker1 111111
marker2 222222