SNPデータ解析の場合のトレンドテストとHWEの関係覚書
SNPジェノタイプのケースコントロール2x3分割表を考える。
AA | AB | BB | sum | |
---|---|---|---|---|
case | g10 | g11 | g12 | P_1 |
case | g20 | g21 | g22 | P_2 |
ではとはどういう関係かというと、この式変形をすることでなる関係を満たしている場合であることが得られ、これは、なるが存在するときのことであり、HWEが成立しているときに他ならない。
total | G_0 | G_1 | G_2 | N |
なる2x3分割表がある。
これから、アレル本数を比べた2x2分割表を作ると
A | B | sum | |
---|---|---|---|
case | A_1 | B_1 | 2P_1 |
case | A_2 | B_2 | 2P_2 |
total | A_0 | B_0 | 2N |
となる。ただし、であるっものとする。
今、トレンドカイ自乗統計量は
と書き表される。これは、6月1日の記事(こちら)の変数表記を上掲の表に合わせたものである。
これを適当に式変形することで次のような式が得られる。
一方、上掲の2x2分割表におけるカイ自乗統計量は
となる(参考サイトはこちら)
ここでであることに注意すると
が得られる。
の式とを比較することで
なる関係が得られる。
この式から、であるとき、なる関係にあることがわかる。
この関係式の検算に用いた(まったくのメモ)のエクセルはこちら
補足
書き方を変えると
さらに式変形すると
この式の分数部分の分母は正であるかとなる。
分数部分の正負は、HWEからヘテロが増える方向へのずれの場合が正、ヘテロが減る方向へのずれの場合が負である。したがって、HWEからヘテロ増大側へのずれのとき、、ヘテロ減少側へのずれのとき、。階層化等の影響があるときはヘテロ減少側へずれるので、トレンドテストを用いることで、関連検定においてはより保守的な方向で正確な検定結果が得られることがわかる。