線形回帰をエクセルで
量的形質と遺伝子マーカー(SNP)との間の関係を検定するとする。
以前、正規分布近似ができない場合として、Jonckheereに関する記事を書いた(こちら)。
今回は、正規分布近似ができるものとする。対数変換によって、正規分布近似が可能となる場合も含める。
概略。
形質が量的従属変数で、ジェノタイプが説明変数である。SNPの場合には、3つのジェノタイプの順序のある変量として0,1,2という値を対応づけるものとする。
形質の平均を、ジェノタイプの平均をとする。
,,,,などの基本量を計算する。
線形回帰式について,
である。
今、,,と書くことにする。
であり、はいわゆる(ピアソンの積率)相関係数である。、ただし、Nはレコード数。ここでF統計量はである。
この統計量は、自由度の組にて評価されるべきF統計量である。
これを実行するエクセルはこちら。
※ 対数変換の場合の計算に一部誤りがあったので、11月22日に訂正しました。