- こちらでDNA鑑定の話しをしている
- 一部の標本について情報が得られたという条件を与えて、条件付き確率を計算して、それを尤度に持ち込んでいる
- 「統計」らしく、分割表の枠組みで考えることにしよう
- ただし、多次元
- 多次元分割表の話しはこちら
- 雰囲気としてはHardy-Weinberg平衡検定の正確確率検定的(セルに入る数字が0,1に限定された部分がある表という意味で)(こちら)
- 遺留DNAの保有者を特定するためのDNA鑑定
- この世には、ヒトが人
- DNAを遺した人が1人(Pさん)
- DNAを遺したのではないかと思われ、DNAを採取された人が1人(Qさん)
- QさんのDNA型(A型)と同一のDNA型を持つ人がこの世に人
- QさんのDNA型と異なるDNA型(a型)を持つ人がこの世に人
- DNAを遺したのではないかと思われている人が全部で人。これをタイプBと呼ぶことにする
- 人は等しい程度に「疑われて」いるとする
- DNAを遺したのではないと思われている人が全部で人。これをタイプbと呼ぶことにする
- 4つの尺度
- 第1の尺度、DNAの型 (A/a)(犯人型、非犯人型)
- 第2の尺度、疑い (B/b)(候補者、非候補者)
- 第3の尺度、Pさんであるか、そうでないか (P/p)(犯人、非犯人)
- 第4の尺度、Qさんであるか、そうでないか (Q/q)(被疑者、非被疑者)
- 4つの尺度が2カテゴリなのでのカテゴリがある
- (A,B,P,Q):犯人であって、被疑者であり、犯人型を持ち、候補者である。このような人は、0人か1人
- (A,B,P,q):犯人であって、被疑者ではなく、犯人型を持ち、候補者である。このような人は、0人か1人
- (A,B,p,Q):犯人ではなく、被疑者であり、犯人型を持ち、候補者である。このような人は0人か1人
- (A,B,p,q):犯人ではなく、被疑者でもなく、犯人型を持ち、候補者である。このような人はそれなりの人数、いてもよい
- (A,b,P,Q):犯人であって、被疑者であり、犯人型を持ち、候補者ではない。今、犯人は候補者の中に必ず含まれると仮定しているので、このような人は0人
- (A,b,P,q):犯人であって、被疑者ではなく、犯人型を持ち、候補者ではない。上と同じ理由で0人
- (A,b,p,Q):犯人ではなく、被疑者であり、犯人型を持ち、候補者ではない。被疑者は候補者であるから、このような人は0人
- (A,b,p,q):犯人ではなく、被疑者でもなく、犯人型を持ち、候補者ではない。犯人型の集団頻度に応じて存在する
- (a,B,P,Q):犯人であって、被疑者であり、犯人型ではなく、候補者である。犯人は犯人型を持つから(被疑者も犯人型を持つから)、0人
- (a,B,P,q):犯人であって、被疑者ではなく、犯人型を持たず、候補者である。犯人は犯人型を持つから、0人
- (a,B,p,Q):犯人ではなく、被疑者であり、犯人型を持たず、候補者である。被疑者は犯人型を持つから、0人
- (a,B,p,q):犯人ではなく、被疑者でもなく、犯人型を持たず、候補者である。大多数の候補者はこの複合カテゴリに属する
- (a,b,P,Q):犯人であって、被疑者であり、犯人型を持たないことはありえないから0人
- (a,b,P,q):犯人であって、犯人型を持たないことはありえないから0人
- (a,b,p,Q):被疑者であって、犯人型を持たないことはありえないので0人
- (a,b,p,q):犯人ではなく、被疑者でもなく、犯人型を持たず、候補者でもない。大多数の人はこの複合カテゴリに属する
- 16複合カテゴリ人数を2変数で表す(自由度2)
- 全人数
- A/aの人数をそれぞれとする
- B/bの人数をそれぞれとする
- P/pの人数はというごく限定された制約を持つ
- Q/qの人数も同様にという制約を持つ
- 今、Pである1人は(A,B,P,Q),(A,B,P,q)のどちらかに入り
- Qである1人は(A,B,P,Q),(A,B,p,Q)のどちらかに入る
- これらの制約を考慮すると、以下のようにs,tの2変数で全場合を網羅できる
- (A,B,P,Q): s = (0,1)
- (A,B,P,q): 1-s
- (A,B,p,Q): 1-s
- (A,B,p,q): t+s-2 ここでt=(A,B,*,*)
- (A,b,p,q):
- (a,B,p,q):
- (a,b,p,q):
- これ以外の複合カテゴリは0
- 割り当て方を考える
- 人いて、それは容疑者かどうかで人に分けられる。この分け方は一通り(容疑者が確定しているから)
- (A,B),(A,b),(a,B),(a,b)の4パターンへの分け方は通りある
- この分け方を網羅するものの、は数え上げのときに排除する(犯人が(A,B)なので)
- (A,B,P,Q)に1人のとき(のとき)は、これで分け方は確定する
- (A,B,P,Q)に0人のとき(のとき)は、容疑者以外の候補者人をに分ける分け方(通りがある)
- 割り当て方その2
- ここで(A,B,P,*)の割り当ては通り
- (A,B,p,*)の割り当ては通り
- (A,B),(A,b),(a,B),(a,b)への割り当ては通り
- これらを併せて通りを考慮することになる(?)
- ここではが与えられたときに(A,B)に割り当てられるの確率
- はの二通りしかないからの場合(被疑者が犯人ではなく、被疑者以外の候補者が犯人である場合)との場合(被疑者が犯人である場合との2通りを考える
- のとき通り(被疑者以外の候補者t-1人の誰かが犯人であって、その場合の数はt-1)
- のとき通り
- の場合を併せるとでt通りある。これは、(A,B)の人数が人のとき、その誰かがDNAを残す確率は、に比例して高くなることに相当する場合の数
- 以下、一部を保留。
--この分割表は尺度数4(4次元)の分割表であって、[tex:1,x-1]の尺度が2つあるという点で制約がきつく、また、(A,B,P,Q),(A,B,P,q)の2セルのみ、(A,B,P,Q),(A,B,p,Q)の2セルのみしか入れないという制約があり、それとも関連するが、9/16セルは必ず0であるという制約があるので、4次元とは言え、セル数7の自由度2の表であって、自由な変数2つの可動範囲もごく狭い
--したがって、全場合を網羅することは容易である
--実際、[tex:\frac{x!}{x_A! x_a!} \frac{x!}{x_B! x_b!}\frac{x!}{1! (x-1)!}\frac{x!}{1! (x-1)!}]という場合の数や
--[tex:\frac{x_A!x_a!x_B!x_b!}{ t! (x_A-t)!(x_B-t)!(x-(x_A+x_B)+t)!}]という場合の数
--[tex:\frac{1!(x-1)!1!(x-1)!}{s!(1-s)!(1-s)!(x+s-2)!}]という場合の数
--[tex:\frac{t!t!}{(s+(1-s))!((1-s)+(t+s-2))!(s+(1-s))!((1-s)+(t+s-2))!}=\frac{t!t!}{1!(t-1)!1!(t-1)!}]という場合の数
--[tex:\frac{(s+(1-s))!((1-s)+(t+s-2))!(s+(1-s))!((1-s)+(t+s-2))!}{s!(1-s)!(1-s)!(t+s-2)!}=\frac{1!1!(t-1)!(t-1)!}{s!(1-s)!(1-s)!(t+s-2)!}]という割合から、結局