素のデータで解析する

  • Electrical Health Record(EHR)を使ってゲノム疫学(EDGR(EHR-driven Genomic Research))をすることと、Electrical Health Recordにゲノム情報を持ち込んで医療をする/その医療の追跡をすること(EDGM:EHR-driven Genome Medicine)との異同を考える
  • データのあらまし
    • EDGRの場合
      • 個人
      • 観察項目
        • 観察項目の複合体としての診断
    • EDGMの場合
      • 個人
      • 観察項目
        • 観察項目の複合体としての診断
      • 介入(治療)
  • データ解析のあらまし
    • EDGRの場合
      • 観察項目のうち、結果となる(なりそうな)因子と、その原因となる(なりそうな)因子・結果を予測する(しそうな)因子との関係の抽出
    • EDGMの場合
      • 観察項目のうち、判断(診断・治療の選択)と、その判断の根拠となる(なりそうな)因子との関係の抽出
      • 観察項目のうち、結果(病像の進展・治療反応性・副反応を含めて)と、その原因となる(なりそうな)因子(介入)・結果を予測する(しそうな)因子(診断・観察項目)との関係の抽出
  • データの構造
      • 個人x項目x時刻(開始と終止)とからなる
    • 項目の時刻による分類
      • 開始・終了時刻が個人の一生全体に渡ることを原則とするもの
        • 開始:出生時、終止:死亡時
        • ゲノム情報・性別などは通常、これにあたる
          • 改変の可能性が0ではないので、開始:出生時、終了時は開放しておくことになる
      • 開始・終了時刻が、一生ではない期間を持つもの
        • 複数回の登録もあり得る
        • 治療継続中の場合などは、終了時は開放
        • 期間のある項目であっても、その期間を時刻とみなして解析することもある
      • ある時刻に関するもの(開始時刻と終了時刻が同時であるもの)
        • 複数回の登録もあり得る
        • 状態の観察項目(診察情報・検査など)はこれに属する
        • 経時的変化を追跡するものはこれに属する
    • 項目の性状による分類
      • 観察項目
        • 観察項目は、個体の状態を表す
        • フェノタイプ
      • 介入項目
        • 介入項目は、個体が外部から受ける影響
        • 環境要因はこれに属する
          • 居住地の情報はこれに属する
        • 人為的な環境要因として、治療介入がある