線形混合モデル、そのための制限付き最尤法

  • 説明ページ
  • 混合効果とは「固定効果」と「変量効果」との2つの効果の混合、ということ
    • 固定効果とはすべてのサンプルで同じ様式で指定する効果
    • 変動効果とは、サンプルごとにどれくらいばらつくかが変わるのでそれのこと。群効果とかいろいろなものを入れられる。GWAS/heritabilityでは、全サンプルの遺伝的遠近に基づく分散共分散行列に基づくサンプル数次元正規乱数として指定する
  • y=X\beta + Zb + \epsilon
    • X\betaは遺伝座位のジェノタイプ行列Xと、各座位の寄与係数
    • 混合効果モデルで言うところの固定効果の項
    • Xは与えられ、\betaは推定する
  • \epsilonは各サンプルへの正規エラー。環境要因が個人間で独立な要素として組み込まれていることになる。正規分布の分散が推定対象
  • Zbはサンプルの値が何かの要因で説明されるばらつきの程度を表す項。Zは与え、bは推定する。bはサンプル数次元の正規乱数。ただし、それの構成は、分散共分散行列の形を定めるパラメタと、行列の形を守りつつばらつきの大小を決めるスカラーとからなる。GWAS/heritabilityの場合には、分散共分散行列は与え、大小決定スカラーのみが推定対象
  • さて推定対象を推定したい
    • ぱっと一発で推定できないので工夫がいる
    • 最尤推定と制限付き最尤推定とがある
    • 変量効果の方がしりたいときに、固定効果を推定してから、それを使って変量効果を推定すると不偏推定量からずれる
    • これは、1変数のサンプルから平均と分散を推定するときに、平均を出して、その平均を使ってサンプル分散を計算するとそれは母分散の不偏推定値からずれるという話になぞらえることができる
    • 不偏分散の場合はNの代わりにN-1を使う言う便法があったが、そういう風にもできないらしい。また、分散の推定値が結構ずれるらしい
    • したがって変量効果の推定に興味があるときは制限付き最尤推定を使うらしい。歴史的経緯はこちら