DNA鑑定を表した分割表

  • こちらでDNA鑑定の話しをしている
  • 一部の標本について情報が得られたという条件を与えて、条件付き確率を計算して、それを尤度に持ち込んでいる
  • 「統計」らしく、分割表の枠組みで考えることにしよう
    • ただし、多次元
    • 多次元分割表の話しはこちら
    • 雰囲気としてはHardy-Weinberg平衡検定の正確確率検定的(セルに入る数字が0,1に限定された部分がある表という意味で)(こちら)
  • 遺留DNAの保有者を特定するためのDNA鑑定
    • この世には、ヒトがN
    • DNAを遺した人が1人(Pさん)
    • DNAを遺したのではないかと思われ、DNAを採取された人が1人(Qさん)
    • QさんのDNA型(A型)と同一のDNA型を持つ人がこの世にN_A
      • QさんのDNA型と異なるDNA型(a型)を持つ人がこの世にN_a=N-N_A
    • DNAを遺したのではないかと思われている人が全部でN_B人。これをタイプBと呼ぶことにする
      • N_B人は等しい程度に「疑われて」いるとする
      • DNAを遺したのではないと思われている人が全部でN_b=N-N_B人。これをタイプbと呼ぶことにする
    • 4つの尺度
      • 第1の尺度、DNAの型 (A/a)(犯人型、非犯人型)
      • 第2の尺度、疑い (B/b)(候補者、非候補者)
      • 第3の尺度、Pさんであるか、そうでないか (P/p)(犯人、非犯人)
      • 第4の尺度、Qさんであるか、そうでないか (Q/q)(被疑者、非被疑者)
    • 4つの尺度が2カテゴリなので2^4のカテゴリがある
      • (A,B,P,Q):犯人であって、被疑者であり、犯人型を持ち、候補者である。このような人は、0人か1人
      • (A,B,P,q):犯人であって、被疑者ではなく、犯人型を持ち、候補者である。このような人は、0人か1人
      • (A,B,p,Q):犯人ではなく、被疑者であり、犯人型を持ち、候補者である。このような人は0人か1人
      • (A,B,p,q):犯人ではなく、被疑者でもなく、犯人型を持ち、候補者である。このような人はそれなりの人数、いてもよい
      • (A,b,P,Q):犯人であって、被疑者であり、犯人型を持ち、候補者ではない。今、犯人は候補者の中に必ず含まれると仮定しているので、このような人は0人
      • (A,b,P,q):犯人であって、被疑者ではなく、犯人型を持ち、候補者ではない。上と同じ理由で0人
      • (A,b,p,Q):犯人ではなく、被疑者であり、犯人型を持ち、候補者ではない。被疑者は候補者であるから、このような人は0人
      • (A,b,p,q):犯人ではなく、被疑者でもなく、犯人型を持ち、候補者ではない。犯人型の集団頻度に応じて存在する
      • (a,B,P,Q):犯人であって、被疑者であり、犯人型ではなく、候補者である。犯人は犯人型を持つから(被疑者も犯人型を持つから)、0人
      • (a,B,P,q):犯人であって、被疑者ではなく、犯人型を持たず、候補者である。犯人は犯人型を持つから、0人
      • (a,B,p,Q):犯人ではなく、被疑者であり、犯人型を持たず、候補者である。被疑者は犯人型を持つから、0人
      • (a,B,p,q):犯人ではなく、被疑者でもなく、犯人型を持たず、候補者である。大多数の候補者はこの複合カテゴリに属する
      • (a,b,P,Q):犯人であって、被疑者であり、犯人型を持たないことはありえないから0人
      • (a,b,P,q):犯人であって、犯人型を持たないことはありえないから0人
      • (a,b,p,Q):被疑者であって、犯人型を持たないことはありえないので0人
      • (a,b,p,q):犯人ではなく、被疑者でもなく、犯人型を持たず、候補者でもない。大多数の人はこの複合カテゴリに属する
    • 16複合カテゴリ人数を2変数で表す(自由度2)
      • 全人数x
      • A/aの人数をそれぞれx_A+x_a=xとする
      • B/bの人数をそれぞれx_B+x_b=xとする
      • P/pの人数は1,x-1というごく限定された制約を持つ
      • Q/qの人数も同様に1,x-1という制約を持つ
      • 今、Pである1人は(A,B,P,Q),(A,B,P,q)のどちらかに入り
      • Qである1人は(A,B,P,Q),(A,B,p,Q)のどちらかに入る
      • これらの制約を考慮すると、以下のようにs,tの2変数で全場合を網羅できる
      • (A,B,P,Q): s = (0,1)
      • (A,B,P,q): 1-s
      • (A,B,p,Q): 1-s
      • (A,B,p,q): t+s-2 ここでt=(A,B,*,*)
      • (A,b,p,q): x_A-t
      • (a,B,p,q): x_B-t
      • (a,b,p,q): x-(x_A+x_B)+t
      • これ以外の複合カテゴリは0
    • 割り当て方を考える
      • x人いて、それは容疑者かどうかで1,(x-1)人に分けられる。この分け方は一通り(容疑者が確定しているから)
      • (A,B),(A,b),(a,B),(a,b)の4パターンへの分け方は\frac{x!}{t!(x_A-t)!(x_B-t)!(x-(x_A+x_B)+t)!}通りある
        • この分け方を網羅するものの、t=0は数え上げのときに排除する(犯人が(A,B)なのでt \ge 1)
      • (A,B,P,Q)に1人のとき(s=1のとき)は、これで分け方は確定する
      • (A,B,P,Q)に0人のとき(s=0のとき)は、容疑者以外の候補者t-1人を1,t-2に分ける分け方(t-1通りがある)
    • 割り当て方その2
      • ここで(A,B,P,*)の割り当ては\frac{1!}{s!(1-s)!}通り
      • (A,B,p,*)の割り当ては\frac{(t-1)!}{(1-s)!(t+s-2)!}通り
      • (A,B),(A,b),(a,B),(a,b)への割り当ては\frac{x!}{t!(x_A-t)!(x_B-t)!(x-(x_A+x_B)+t)!}通り
      • これらを併せて\frac{1!(t-1)!x!}{s!(1-s)!(1-s)!(t+s-2)!t!(x_A-t)!(x_B-t)!(x-(x_A+x_B)+t)!}通りを考慮することになる(?)
        • ここで\frac{x!}{t!(x_A-t)!(x_B-t)!(x-(x_A+x_B)+t)!}x,x_A,x_Bが与えられたときに(A,B)に割り当てられるtの確率
        • \frac{(t-1)!}{(1-s)!(t+s-2)!}s=0,1の二通りしかないからs=0の場合(被疑者が犯人ではなく、被疑者以外の候補者が犯人である場合)とs=1の場合(被疑者が犯人である場合との2通りを考える
        • s=0のとき\frac{(t-1)!}{(1-s)!(t+s-2)!}=t-1通り(被疑者以外の候補者t-1人の誰かが犯人であって、その場合の数はt-1)
        • s=1のとき\frac{(t-1)!}{(1-s)!(t+s-2)!}=1通り
        • s=0,1の場合を併せると(t-1)+1でt通りある。これは、(A,B)の人数がt人のとき、その誰かがDNAを残す確率は、tに比例して高くなることに相当する場合の数
      • 以下、一部を保留。
--この分割表は尺度数4(4次元)の分割表であって、[tex:1,x-1]の尺度が2つあるという点で制約がきつく、また、(A,B,P,Q),(A,B,P,q)の2セルのみ、(A,B,P,Q),(A,B,p,Q)の2セルのみしか入れないという制約があり、それとも関連するが、9/16セルは必ず0であるという制約があるので、4次元とは言え、セル数7の自由度2の表であって、自由な変数2つの可動範囲もごく狭い
--したがって、全場合を網羅することは容易である
--実際、[tex:\frac{x!}{x_A! x_a!}  \frac{x!}{x_B! x_b!}\frac{x!}{1! (x-1)!}\frac{x!}{1! (x-1)!}]という場合の数や
--[tex:\frac{x_A!x_a!x_B!x_b!}{ t! (x_A-t)!(x_B-t)!(x-(x_A+x_B)+t)!}]という場合の数
--[tex:\frac{1!(x-1)!1!(x-1)!}{s!(1-s)!(1-s)!(x+s-2)!}]という場合の数
--[tex:\frac{t!t!}{(s+(1-s))!((1-s)+(t+s-2))!(s+(1-s))!((1-s)+(t+s-2))!}=\frac{t!t!}{1!(t-1)!1!(t-1)!}]という場合の数
--[tex:\frac{(s+(1-s))!((1-s)+(t+s-2))!(s+(1-s))!((1-s)+(t+s-2))!}{s!(1-s)!(1-s)!(t+s-2)!}=\frac{1!1!(t-1)!(t-1)!}{s!(1-s)!(1-s)!(t+s-2)!}]という割合から、結局