証拠を突き合わせること

# 証拠を突き合わせること〜あいいれない証拠〜法数学勉強会20140426のメモ

## はじめに
いくつかの証拠を突きあわせて判断する場合に、すべての証拠がある仮説をそろって支持する場合と、そうでない場合とを比較して、どんなときに、どんな確率や尤度が気になるのかを、考えてみます。
目的は、複数の証拠を併せるための枠組みを確認することです。

##  『数さんの家のマンガ本』事件」

数 法子(かず のりこ)さんは中学生。家族は、お父さん・お母さん(数 好子さん)・お兄さん(数 学(まなぶ)さん)との4人家族です。犬も飼っています。

法子さんはあるマンガ本を大切にしていました。

ある日、学校から帰宅し、なんとはなしに本棚に目をやると、「大切なマンガ本」がいつも置いているところにありません。

> あれ、(大切なマンガ本が)ないな

と思いました。

そのとき、法子さんは

> 誰かがあのマンガをどこかに持って行ったから、今、ここに「ない」

> 自分の記憶『あのマンガはここにあった』が間違いで、そもそもここに「ない」

という2つの可能性をちらりと考えました。

考えたと言っても、別に、すべての可能性を列挙して、その中からこの2つを取り立てたわけでもないですし、事前確率がいくつか、などということはもちろん考えたりしていません。

あえて言うなら、

> この2つの可能性については頭をよぎった

そんな感じです。

ですが、今日は、たくさんの宿題が出ていたので、マンガ本がないことは忘れて、宿題に取り掛かりました。

## お兄さんの帰宅

しばらくすると、お兄さんの学(まなぶ)さんが

> ただいま〜

と言いながら帰ってきたようです。

法子さんは

> おかえりぃ

と法子さんは机についたまま大きな声で応えました。

このとき法子さんは

> そういえば、あのマンガ本、お兄ちゃんは何か知っているかしら?

と宿題を初めてから、初めて、マンガ本のことを考え直しました。

> おにいちゃん、あのマンガ、知らない?

数(かず)さんの家では、「あのマンガ」と言えば、法子さんのお気に入りのマンガ本であることはみんなすぐにわかるのです。

さて、この「質問」はどんな意図があるのでしょうか。

> 学さんがマンガを移動したと判明することの期待

> 学さんはマンガを移動しないが、そのマンガについての情報が得られることの期待

の2つがありそうです。
他にもあるかもしれませんが、ここではこの2つにしておきます。

法子さんは

> 誰かがあのマンガをどこかに持って行ったから今、ここに「ない」

> 自分の記憶『あのマンガはここにあった』が間違いで、そもそもここに「ない」

という「初めに頭によぎった2つの仮説」に優劣をつける情報が欲しいと思っていたので、それを、情報提供してくれるかもしれない初めての登場人物に尋ねたのです。

もし帰宅したのが別の人だったら、お兄さんに尋ねる代わりに、その人に尋ねたことでしょう。

## 情報の「歴史問題」

どんな情報をどんな順序で得ることになるか、というのは、「歴史」と同じで、起きてみないとわからないし、起きてしまえばそれ以外の「歴史」はあり得ないことになります。

この「歴史問題」も証拠の突き合わせ問題には何か、大事な役割をしている臭いがしますが、今回は、これには触れないことにします。

## 学さんは知っていた

さて、学さんに話を戻します。

> あのマンガは『もう捨てるわ!』とお母さんが昨日言っていたよ

との重大発言が得られました。

さて、仮説への影響はどうなっているでしょう?

> 誰かがあのマンガをどこかに持って行ったから今、ここに「ない」

> 自分の記憶『あのマンガはここにあった』が間違いで、そもそもここに「ない」

というぼんやりとした2つの仮説への影響のことです。

> 誰かが…

の仮説の方が

> お母さんが…

という「部分」の仮説に特化して、「大きく」なったと感じます。

ですが、法子さんは、別に、『尤度比』がどうした、とか、

> 誰かが…

という仮説を

> お母さんが…

と

> お母さん以外の誰かが…

との排他的な2仮説に分離して、その上で、どちらがどんな事後確率になって、

> お母さんもしくはそれ以外の誰かが…

という2仮説の合算の事後確率はどうなったか…というようなことは、全く気にしていません。

ただ、「大きくなった」と感じていると思います。

また、

> 自分の記憶『あのマンガはここにあった』が間違いで、そもそもここに「ない」

の方は、相対的に「小さく」なっていますが、それ以外の第3の仮説などが新たに気になっている、ということもないでしょう。

## 第2の証拠〜ゴミ箱〜

法子さんは、色々なことを考えたりせずに、すぐに、ゴミ箱を覗きこみました。
するとそこには、くだんのマンガ本があるではありませんか!

さて、この第2の証拠が得られた今、2つの仮説

> 誰かがあのマンガをどこかに持って行ったから今、ここに「ない」

> 自分の記憶『あのマンガはここにあった』が間違いで、そもそもここに「ない」

はどうなってくるでしょうか。

もはや「ぼんやりした仮説」ではなくて、「むくむくと形を持った仮説」と言った感じもしてきましたが、その「ぼんやり」と「むくむく形」とは、数学表現ができたとしたら、いったいどんなことなのか、ということは課題です。

> 誰かが「ゴミ箱に入れた〜捨てた」っぽい

> 誰が、と言ったら、お母さん、かな

と言うのが具体性を持った「むくむく」の中身と言えるでしょうか。

その上で

> 『お母さんが、「捨てる」という意思の下、本棚からマンガをとってゴミ箱に捨てた』

とでも言う仮説が立ち上がってきているようです。

## 秘密の(怪しげな)DNA鑑定キットを使う

実は、法子さんは「触れると法子さん以外の生物のDNAを吸い取る」という「秘密の塗料」をマンガ本に塗っていたのです。

なんという都合のよい道具があるのでしょう。

さっそくマンガ本はDNA鑑定に回されました。

ただし、このDNA鑑定がどれくらい信用できるかの情報は不明です。
結果や、いかに?!

## 状況の整理

さて、証拠を整理してみます。

> 証拠1 証言「お母さんが捨てるって」

> 証拠2 「マンガ本」の発見、その発見場所

> 証拠3 「マンガ本」に触れた生物のDNA型」

です。

その他の情報も整理してみます。

> 仮定1 「マンガ本は誰にも触らせていなかった」

では、仮説はどうなっているでしょうか。

> 仮説1 誰かがあのマンガ本をどこかに持って行ったから今、ここに「ない」

> 仮説2 自分の記憶『あのマンガ本はここにあった』が間違いで、そもそもここに「ない」
> その他の仮説

に大別されます。

## DNA鑑定結果、得られる

では、DNA鑑定結果の開示です。

> 「お母さんのDNA型に一致したよ!」

ここへきて

> 『お母さんが、「捨てる」という意思の下、本棚からマンガをとってゴミ箱に捨てた』

というストーリがいかにも『それらしく』感じられます。

どうして『それらしく』感じられるのでしょうか。

> 証拠1 証言「お母さんが捨てるって」

> 証拠2 「マンガ」の発見、その発見場所

> 証拠3 「マンガに触れた生物のDNA型」

> 仮定1 「マンガは誰にも触らせていなかった」

の4条件です。

ここで証拠と仮定とが仮説とどういう関係か、というと

| 仮説 | 証拠1|証拠2|証拠3|仮定1|
|------|------|------|------|------|
|仮説1 誰かが…|||||
|仮説2 そもそもなかった…|-|×|×|×|

となっています。

仮説2で「どこかに置き忘れた」とするとゴミ箱に置き忘れるわけはないですし、「法子さんしか触っていなければ、DNA鑑定」でお母さんのDNAが検出されないはずですから、そんな理由から仮説2には×がつきます。

結局、仮説1は〇ばかり、仮説2は×ばかり、です。

〇、×は4個ありますが、ここで4という数もそれほど厳密には考えていないかもしれません。

「いい感じの数(少なすぎず、多すぎない)」の代表が4です。

今、頭の中では

> 2つの仮説は ○ vs.  ×

> 仮説1を信じるとして、確かに、仮説1が起きたことが信じられる。

> その他の仮説については、証拠に照らしていちいち考えない。

もちろん、尤度比などの計算もしていません。

さて、
> 『お母さんが、「捨てる」という意思の下、本棚からマンガをとってゴミ箱に捨てた』
のでしょうか!?

## お母さん、帰宅する

そこへ、お母さんの好子さんが、帰ってきました。

法子さんは、一応宿題をしてはいましたが、マンガ本のことを気にかけながら、していました。

お兄さんの帰宅時とは少し事情が違います。

> おかえりなさい。あのさー、私のあのマンガがないんだけど、お母さん、知らない?

と尋ねるでしょうか。

> おかえり。ねぇ、私のあのマンガ、捨てたの、お母さん?

と尋ねるでしょうか。

この尋ね方には、情報抽出上の感度や特異度という問題が絡んでいそうですが、これも今回は扱わないことにします。

## お母さんの返事

### 場合1

『法子さんは、お母さんにマンガ本のことを尋ねました』とでも小説では曖昧に書くかもしれません。

その返事です。

> 私が捨てたわ

ここへきて

> お母さんが捨てた

と言うただ1つの仮説を信じることにするか否かの決断を迫られていると言えるでしょうか。

どうしてそう感じるのでしょうか。

> 私が捨てたわ

という証拠が、「誰かが持って行った」という仮説のうち、「誰か=お母さん」の尤度が非常に高くなっているからなのでしょう。
その他の仮説の尤度は上がりも下がりもしていないでしょう。

「誰か=お母さんが持って行った」仮説の他のすべての仮説に対する尤度比が非常に高くなったのです。

とは言うものの、これまでにも「尤度比」を考えていたわけではないですから

「有力と思っていた(〇が4)仮説」があり、「次に有力と思っていた仮説(×が3)」には、かなり落差があると感じていて、その他の仮説は、考えるにも値しない、と思っていたところで、「有力仮説」をさらに押し上げる証拠が得られたので、「決定」と思える、と言うのが、気持ちの動きのように思えます。

少し整理してみます。

> ありそうな仮説があった

> いくつかの証拠が次から次へとありそうな仮説の1つを支持し、それ以外のありそうな仮説では否定的であった

> 「強い」証拠が最後に支持を決定づけた

という流れです。

この流れに沿っているとき、尤度や尤度比の細かい計算はしていない…ように思える、と言えるでしょうか。

## 「私はやっていない」

ここからが本題です。

お母さんは

> 私は捨ててない

と答えました。

最後にダメ押しで決めようと思っていた仮説1ですが

| 仮説 | 証拠1|証拠2|証拠3|bgcolor(#FF00FF):証拠4仮定1|
|------|------|------|------|------|------|
|仮説1 誰かが…||||bgcolor(#FF00FF):×|〇|

となりました。

ここへきて、初めて〇と×とが混在を始めます。

こうなってくると「全部合っているから、仮説1で安心」という、穏やかな世界は終了です。

正確に計算するかどうかは別にして、

> 本当に起きうるのか(生起確率)

> 他の仮説に比べて本当に信じるに足るのか(尤度比)

に関する確認が必要です。

そして、それを考えるために、考えるべきことが大幅に増えます。

## 考えることが増える

### 仮説が変容する

> お母さんが捨てた

と言う仮説自体も、変容してきます。
個の仮説の中身は

> お母さんがやった上に、お母さんは嘘をついている

という2つのことが同時に成り立っていることを要求します。

これに対立する仮説

> お母さんはやっていない

の方も

> お母さんはやっていない

> お兄さんの証言は嘘で

> DNA鑑定結果は誤りで

> 「誰にも触らせていない」という仮定は正しい

と長くなっているかもしれません。

どちらの仮説も、尤度は下がります。

合わない証拠があるので、その証拠に合うような尤度を下げるような条件がつくからです。

尤度自体はどちらも下がりますが、尤度比がどうなるかは、よく考える必要があります。

### 考えるべき仮説が増える

考えていた仮説の中身が変容し、その尤度が下がったわけですが、それだけではありません。

尤度が下がったために、それに匹敵する尤度を持つかもしれない仮説、始めのうちは「あり得ない」として「その他の考えるに足りない仮説」として意識に上らせなかった仮説も、「勝利の可能性」が出てくるからです。

たとえば

> 寝ぼけて自分でゴミ箱に落とした

> 兄が母を陥れようとした

> ワンコがいたずらした

など、初めてマンガ本がないことに気づいたときには、想定しなかったような仮説の数々も、可能性が出てきます。

## 証拠を増やそう〜信じきれなくなったときの対応

信じようかと思っていた仮説の尤度が下がってしまいました。

この後、どんなに証拠を積み上げても、尤度自体は上がりません。
必ず、1より小さい値を掛けることになるからです。

その代り、他の仮説の尤度をもっと下げて、尤度比を上げ、結果として、この仮説しかない、という状況を作り上げる方向で頑張ることになるのです。

## 新たな証拠1〜100万個の証拠

新たな証拠が必要だ、ということになったので、法子さんはちょっと考えてみました。

> そういえばDNA鑑定キットって、100万マーカー、調べられるって書いてあったわ。調べてみましょう

いきなり、100万マーカーです(はじめのDNA鑑定、というのがどんなマーカーをいくつ使ったのかもわからないわけですが)、どんなキットなのでしょうか。

すると

> マンガのDNAとお母さんのDNAの型が、100万マーカーのすべてで一致しました!

なんと素晴らしいこと…、なのでしょうか。

> 一致しすぎ

> 一致しなさすぎ

> 程よく一致する

の3通りに照らして、「一致しすぎ」疑惑が持ち上がりそうです。

### 合致数がちょうどよい場合

この場合には

> 当該仮説の尤度比が上がる

> 対立仮説の尤度比が下がる

> 当該仮説の生起確率は下がるが、その他の仮説の生起確率の下がり方よりひどいわけではない

となって、結果として、「お母さん仮説」らしさが高まります。

### 合致数が少なすぎる場合

この場合には


> 当該仮説の尤度比が下がる

> 対立仮説の尤度比が上がる

> 当該仮説の生起確率は下がる。対立仮説の生起確率も下がりはするが、対立仮説の下がり方は圧倒的に小さいので、対立仮説の尤度比が上がる

> その他の仮説の生起確率の下がり方はせいぜい、対立仮説のそれに過ぎない

となります。
「お母さん仮説」はますます信用がおけなくなります。

### 合致数が多すぎる場合

この場合は

> 当該仮説の尤度比が下がる

> 対立仮説の尤度比が上がる

> 当該仮説の生起確率は下がる。対立仮説の生起確率はもっと下がる。したがって、当該仮説の対立仮説に対する尤度比は上がる

> 当該仮説の生起確率が下がるので、『合致数が多いこと』を説明する仮説に対して尤度比が圧倒的に下がる

となります。

「お母さん」仮説は相対的に浮上したようにも見えますが、実は、
「その他のこれまでは無視できていた仮説」を考慮する必要が出てきます。

## 新たな証拠2〜兄の陰謀説

法子さんが悩んでいると、お兄さんがわざわざ法子さんの部屋に来て言いました。


> そういえば、お母さんが法子の部屋に入るのを見たよ

> そういえば、秘密のDNA鑑定キットって、間違いがないって、雑誌に書いてあったよ

と。

なんて親切なお兄さんでしょう…。

本当にそうなのでしょうか。

この新情報は

> 「母 実行犯」説の尤度を上げているのか?

> 「兄 陰謀」説の尤度を上げているのか?

のどちらの可能性もあります。

さて、この後、次から次へと、お兄さんが「母、実行犯説」を支持する証拠を出してきたとします。

ですが、「兄 陰謀説」が頭をよぎってしまった法子さんには、いくら、その手の証拠が積み重なっても、「母 実行犯説」を信じる方向には進みません。

なぜなのでしょうか。

> 証拠の多様性が低い

> 同一軸上の証拠を積み上げても、上界がある

という表現ができそうです。

では、 DNAのマーカー数を増やすことは、「同一試料」に関する証拠の積み上げという意味で、「兄の囁き」と共通しているのでしょうか。

共通しているとすれば、DNAマーカー数増加に対する「兄 陰謀説」とは何なのでしょうか。

## まとめ

### あいいれない証拠の存在

> 尤度の低い仮説を採用することを要求する

> 考慮するべき仮説の裾野が広がる

> 列挙できているかどうかの不安も伴う

> 証拠を否定的に解釈する確率の取り込みを要求する

> 証拠の数の増加を要求する

> 肯定的・否定的な証拠の組み合わせ項の考慮を要求する

> 必ずしも、肯定的な証拠の数が多い方が尤度が高いわけではない、という事実の考慮を要求する

### 証拠の多様性とは

> 多様性の低い証拠は「強」くても、単一の対立仮説に対して、脆弱

> 多様性の低い証拠の脆さを定量する方法が必要らしい

### 起きにくそうな仮説を選ぶときの決断力

情報収集の歴史問題ということに少し触れました。

> 囲碁や将棋で、ある手を選ぶと大敗する確率が高いけれど、一手一手、これしかない、という手を選ぶと、最後には勝てる、という『危険だらけの細道』を信じて手を選ぶことに似ている??

> それを選ぶときの心は??

> それ以外の手はあり得ないことを確信する

> その手を選んだときの「大敗」が本当に回避できることを確信する

### DNA鑑定の「力強さ」はどこなのか

上記に照らして、DNA鑑定の「力強さ」はどこなのか、を表現したいです。