不確実な情報の提供
- 遺伝的バリアントについて調べてそれを伝えるとき、不確実性が問題になるわけだが、ここにあるように、analytic validity(実験は正確なの?) とclinical validity(見つけたバリアントは本物なの?)とについてうまく伝えることが必要。実際には、これに従来からの遺伝的validityを組み合わせて説明しないといけないわけです。
- 従来から遺伝カウンセリングというのは必要であって、それは、たとえば、第1子に遺伝性疾患が疑われるとき、第2子も罹患するかどうかについての相談などであった
- その場合の計算の枠組みには段階があって
- で出来ていた
- (1)は計算自体は小難しいけれど、悩むことのない計算であるし(血縁関係が怪しくなってくるとここも確率的)、(2)は単純
- (3)は浸透率、phenocopy率について、点推定値があるわけだけれど、その真の値はうすらぼんやりしているし、個人がもつ遺伝的背景によるばらつきもありえれば、環境要因によるばらつきもあり、かなり説明が難しい。通常の臨床における予後予測で「余命xx」と言うのがかなり曖昧なことと相通じる。わかるのはある分布を取っているということだけである。
- さて。ここまでは、遺伝バリアントの実験結果が正しいことを仮定した話であるが
- NGSによるエクソーム・ゲノム シークエンシングだと、
- 当該遺伝子のどこがどれくらいきちんと読めたのか
- 逆にどこがどれくらいきちんと読めなかったのか
- 検出されたバリアントが責任バリアントであるかどうかについて
- 未報告のバリアントであれば、推定するしかないし
- 既報告のバリアントであっても、それがどれほど本当に責任バリアントであるのかは不確かである
- ここで言う、「推定」「不確か」というのは、「責任バリアントである」とみなせる確率が、点推定値で言えば、これくらいだし、区間推定(分布推定)もしないといけない。
- まとめると
- (A)遺伝的 validity
- (A-1) 血縁関係からくる、1/2を組み合わせた計算:確定的(ただし、血縁関係情報が怪しい場合には、確率的要素が入る)
- (A-2) 遺伝形式:確定的(ただし、優性・劣性の場合のみ。相加モデルを含めた中間的な寄与の仕方などの場合は確率的に説明される)
- (A-3) 発現のバラツキ:推定値・推定分布。浸透率、phenocoyなど、いずれもどのくらいの値なのかは分布でしかわからない
- (B)analytic validity
- 感度・特異度がばらつく。その結果、感度・特異度が確率的になる
- 塩基位置ごとのばらつき
- 解析ツール・オプションごとのばらつき
- 感度・特異度がばらつく。その結果、感度・特異度が確率的になる
- (C) clinical validity
- 機能性・責任バリアントか否かについての推定というばらつき
- 既報バリアントの場合には、本当に責任バリアントなのか、それがfalse positiveなのかの0/1が確率分布
- 未報告バリアントの場合には、機能性があって責任バリアントとみなすべきなのか、が既存知識に基づいて推定されるが、その推定結果も確率分布
- 機能性・責任バリアントか否かについての推定というばらつき
- (A)遺伝的 validity