ぱらぱらめくる『医学的研究のデザイン』

医学的研究のデザイン -研究の質を高める疫学的アプローチ- 第3版

医学的研究のデザイン -研究の質を高める疫学的アプローチ- 第3版

  • 目次
  • 第I部 基本的要素 1
    • 1 さあ、始めよう:医学的研究の「解剖学」と「生理学」
    • 2 研究のテーマを考える
    • 3 研究対象者を選ぶ:対象者の定義とサンプリングと集め方
    • 4 測定方法を計画する:PrecisionとAccuracy
    • 5 サンプルサイズを見積もるための準備:仮説と基本事項
    • 6 サンプルサイズとパワーの推定:その応用と実例
  • 第II部 研究デザイン
    • 7 コホート研究をデザインする
    • 8 横断研究とケースコントロール研究をデザインする
    • 9 観察的研究における因果推論を強めるために
    • 10 盲検的ランダム化臨床試験をデザインする
    • 11 その他の臨床試験のデザインと実施上の問題
    • 12 医学検査に関する研究をデザインする
    • 13 既存のデータを利用する
  • 第III部 研究の実施
    • 14 倫理の問題
    • 15 質問調査をデザインする
    • 16 データ管理
    • 17 研究の実施と質管理
    • 18 コミュニティ研究と国際共同研究
    • 19 研究申請書の作成と研究助成
  • とにかく用語を列挙してみよう
  • 解剖学(構造)、生理学(機能)、研究プロトコール、「そう、それで?」テスト、FINER(feasibility 実施可能性、interesting 面白さ、novel 新規性、ethical 倫理性、relevant 意義)、観察的研究、臨床試験、実験的研究、コホート研究、横断研究、前向き、後ろ向き、ケースコントロール研究、ランダム化臨床試験、記述的研究、分析的研究、関連、包含基準、除外基準、変数、予測因子、アウトカム、介入、交絡因子、仮説、サンプルサイズ、パワー、推論、内的妥当性、外的妥当性、目的母集団、サンプル、目的とする現象、誤差、偶然誤差、精度、系統誤差、バイアス、サンプリングに伴う偶然誤差、測定に伴う偶然誤差、研究テーマ、アウトライン、実施マニュアル
  • 研究テーマ、研究計画、臨床研究、トランスレーショナルリサーチ、学識、系統的レビュー、情報収集、疑う、新規技術導入、創造性、根気、メンター、実施可能性、対象者数、必要とされる専門性、コスト(時間・経費)、研究テーマの範囲、問題と解決策、主要テーマ・副次的テーマ、トランスレーショナルリサーチ (T1、T2)、新規知見、T1研究(基礎研究から臨床へ)、T2研究(臨床研究から社会へ)
  • 母集団、サンプル、一般化、定義、サンプリング、リクルート、目的母集団、研究対象集団、研究サンプル、地理・時間、選択基準、包含基準、交互作用、科学性と現実性とのバランス、除外基準、臨床サンプル、一般集団サンプル、簡易サンプリング、連続サンプル、確率的サンプリング、単純ランダムサンプリング、系統的サンプリング、層化ランダムサンプリング、クラスターサンプリング、代表性、必要なサンプル数、不参加、参加率、公正な姿勢
  • 尺度(スケール)、精度precision(偶然誤差の少なさ)・再現性・一致度、正確性accuracy(系統誤差の少なさ)、統計的情報量、連続変数、離散変数、カテゴリー変数、2区分変数、名義変数、順序変数、Precision、測定者による誤差、測定集団による誤差、対象者による誤差、再現性、対象者内標準偏差、変動係数、パーセント一致率、カッパ係数、測定方法の標準化、測定者のトレーニング、技能チェック、測定集団の改善、測定集団の自動化、測定の反復、Accuracy、妥当性、バイアス、測定者バイアス、測定集団バイアス、対象者バイアス、ゴールドスタンダード、妥当性、内容妥当性、表現妥当性、構成概念妥当性、基準関連妥当性、予測妥当性、測定方法の標準化、測定者のトレーニング、技能知節句、測定集団の改善、測定集団の自動化、ブラインド、測定機器のキャリブレーション、盲検化、感度、特異度、データの適切な分布、客観性、保存検体、保存資料
  • サンプルサイズ、仮説、有意差検定、比較、簡潔、的確、事後仮説、差なし仮説、差あり仮説、片側仮説、両側仮説、推論、判決、統計学有意水準、αエラー、βエラー、偶然、バイアス、効果量、パワー、統計学的パワー、P値、信頼区間、片側検定、両側検定、データの変動度、多仮説検定、事後仮説、ボンフェローニ、ベイジアン統計学、主仮説、副次仮説、
  • t検定、カイ二乗検定、リスク比、オッズ比、相関係数、脱落、カテゴリー変数。生存解析、クラスターサンプル、マッチング、多変量解析、補正、コックスの比例ハザードモデル、同等性研究、信頼区間、感度、特異度、ペア測定、不均等サンプル比、パイロット研究、欠測値
  • 発生率、前向きコホート研究、後ろ向きコホート研究、コホート内ケースコントロール研究、ケースコホート研究、多重コホート研究、コホートリテンション、インセプションコホート、交絡、効果修飾、盲検的に
  • 横断研yく、ケースコントロール研究、発生率、存在率、存在率比、累積発生率、ケースシリーズ、オッズ比、頻度マッチング、住民母集団、リコールバイアス、臨床検査、ケースクロスオーバー研究
  • 原因、結果、偽の関連、真の関連、交絡、オポチュニスティック研究、交互作用、マッチング、ペアマッチング、頻度マッチング、属性因子、介在因子、オーバーマッチング、「自然の実験」、メンデリアンランダム化、インスツルメント因子(メンデリアン・ランダマイゼーション出てきましたね)、層化、交互作用、効果修飾、統計学的補正、数学的なモデル、多変量解析、傾向スコア、因果関係の過小評価、抑制効果、関連の一致性、関連の強さ、量-反応関係、生物学的妥当性
  • 治療、介入、アウトカム、ランダム割り付け、盲検化、盲検定ランダム化臨床試験、群間比較デザイン、効果と安全性のバランス、最大許容量、最低効果量、複数の用量、単一の治療による介入、投薬量を加減する、積極治療、プレゼボ、共介入、割り付け重視の原則、副次的分析、同等性試験、待機コントロール、タイムシリーズ、クロスオーバーデザイン、臨床的アウトカム、中間的指標、代替指標、副作用、スクリーニングバイアス、ボランティアバイアス、ベースライン因子、保護個人健康情報、サブグループ、検体バンク、封筒法、割り付けセンター、ブロックランダム割り付け法、層化ブロックランダム割り付け法、均等割り付け、マッチトペアのランダム割り付け、盲検化
  • ランダム化臨床試験の変法、要因デザイン、クラスターランダム割り付け、同等性試験、ランダム化されていない群間比較デザイン、準ランダム化、均衡、群内比較デザイン、前後比較試験、学習効果、平均値への回帰現象、時期効果、「N=1」研究、クロスオーバー試験、持ち越し効果、回復期、遅延介入、FDAの承認を取るための臨床試験GCP(Good Clinical Practice)、前臨床期、第I相、第II相、第III相、第IV相、パイロット臨床試験、適格基準、スクリーニングバイアス、フォローアップ、プロトコールへのアドヒアランス、試し受診、試走期間、プラセボ試走、実薬試走、モニタリング、治療効果、条件付きパワー、中間解析、中間モニタリング、独立データモニタリング委員会、早期中止、中間解析、アダプティブデザイン、割り付け重視の分析、サブグループ解析、クロスオーバープロトコール重視の解析、治療重視の解析
  • 感度、特異度、尤度比、精度、再現性、正確性、実施可能性、臨床判断、アウトカムに及ぼす効果、診断のゴールドスタンダード、定義上のゴールドスタンダード、スペクトルバイアス、変動の原因、一般化可能性、サンプリング法、検査の再現性、観察者内変動、観察者間変動、デザイン、カテゴリー変数、全一致率、カッパ係数、連続変数、変動係数、予測力、事後確率、横断研究、タンデム試験、予測因子、予後判定研究、感度、特異度、PPV、NPV、ROC曲線、尤度比、リスク比、リスク差、実効研究、臨床判断の前後比較研究、確証バイアス・精査バイアス・参照バイアス、二重ゴールドスタンダードバイアス、施設固有性、境界例、解釈不能
  • 2次データ分析、副次的研究、系統的レビュー、癌登録、死亡登録、集団データ、生態学的研究、生態学的誤差、併合効果、信頼区間、非一様性、出版バイアス、感度分析
  • 倫理の一般原則、人権尊重、インフォームドコンセント、最善の原則、公正の原則、人を対象とした研究、研究参加者、研究対象者、個人情報、倫理審査委員会、迅速審査、最低リスク、健康個人情報規則、研究の性格、研究の手順、研究に伴うと予想されるリスクと利益及び研究に参加しない場合に受けられる治療、同意の形式、同意書、共通倫理指針、開示情報、同意の自発性、同意の例外、決定能力を欠く対象者、リスクと利益、個人情報の守秘、追加的保護措置、脆弱性(知的、力関係、社会経済的)、科学的違反行為、捏造、改ざん、剽窃、オーサー湿布、利益相反、ピアレビュー、生データの利用や統計解析を自由にできる権利、結果を出版できる権利、謝礼
  • 質問紙法、面接法、測定手段、自由回答、質的方法、コードシステム、網羅的、排他的、視覚的アナログスケール、フォーマッティング、枝分かれ質問、スキャナー、言葉づかい、明快さ、平易さ、中立性、デリケートな問題、タイムフレーム設定、2連質問、無意識の前提、質問と選択肢の不一致、多項目尺度、リッカートスケール、内的一貫性、クロンバックのアルファ係数、個人面接、フォーカスグループインタビュー、質問票の作成プロセス、予備調査、妥当性検証、表現妥当性、内容妥当性、構成概念妥当性、予測妥当性、反応性、社会的に望ましい回答、探査質問、、コンピュータを用いた電話面接法、自動応答装置
  • データベース、スプレッドシート、入力システム、モニタリング、クエリー、行、列、ID、リレーショナルデータベース、1対1、1対多、参照整合性、ドメイン、変数名、外れ値、二重入力、読み取りソフト、他施設での入力、コンピュータを用いた入力、網羅的、排他的、バックエンド方式、フロントエンド方式、データの抽出、クエリー、欠測値、外れ値、フィールド間チェック、バックアップ、アーカイブ保存
  • 研究スペース、研究チーム、リーダーシップ、スタートアップ、倫理審査委員会、実施マニュアル、データ収集票、作業定義、データベースデザイン、予備調査、パイロット研究、疑似被験者、完了、GCP、標準作業手順書(SOP:Standard operating procedure)、質管理コーディネータ、トレーニング、技能チェック、実施状況の点検、チェックリスト、ピアレビュ、定期報告、ラべリング、取り違え、バーコード、盲検化、盲検二重サンプル、標準プールサンプル、欠測データ
  • コミュニティ研究、一般性、単純化トップダウンボトムアップ、研究的搾取
  • 研究申請書、プロトコール、研究助成組織、ガイドライン、スケジュール

Mendelian Randomization/Instrumental Variable法

  • こちらにもあるように、ゲノム疫学分野で中間フェノタイプと最終フェノタイプ(疾患)との因果関係についての解析にMendelian Randomizationと呼ばれる手法があり、それを用いた論文が見られるようになっている
  • このMendelian Randomizationという呼び方はゲノム疫学・遺伝学特有の呼び方で、より、一般的にはInstrumental Variable Methodと言う(「(因果関係を解析する上で)有用な(instrumental)変数を持ち込んだ方法」)

  • オオマカニ言うと次のようになる(この部分の説明はこちらのイントロから)
    • XがYを引き起こしているかどうかが知りたいとする
    • しかしながらUがあるために、Uの役割を除いた/考慮した上での/Uでconditionした上での、XとYの関係がわからなくなっている
    • そのときにXには関係するが、Uには関係しない「有用な変数Z」を持ち込んで「X→Y」についての情報を引き出そう
    • 臨床治験のように計画的にデザインするようなときに「有用な変数Z」を入れる方法は「サンプルをrandom group assignment」することによって達成する
    • どうしてこれをゲノム疫学では"Mendelian Randomization"と呼ぶか、と言えば、Zに遺伝子多型を持ってくること、Zは遺伝因子だから「Uとは」「メンデルの(独立の)法則によりRandomized」されているから
  • その他、関連する要点
    • このInstrumental variable methodは、関係する因子について制御できているスタディデザインではなく、制御できずにただ因子が与えられるがままになっている状況(ゲノム疫学での遺伝因子はこれに相当する)に用いられる
    • 解析手法の中身(たとえばこちらの記事)に目を走らせれば、行列演算による手法→線形関係を過程していることがわかる。線形関係ということは基本的には二値変数も苦手でX,Y,Z,Uのすべてが量的変数であることも、能力を発揮するには大切でありそうなことも想定される(ちなみに、上でもリンクを張ったPLoS Oneのペイパーは、Y(疾患とか)が二値変数のときに、どういう風に工夫をしましょうか、という論文)
  • Rでは:

トリソミーの疫学指標

  • こちらで論文の勉強会があった
    • Aneuploidyと発現との関連を扱った論文だった
    • ヒトの個体レベルでのAneuploidyとしてトリソミーがある
  • ヒトのトリソミーを含む遺伝子疾患については東京医大の沼部先生のサイト(こちら)が詳し
  • トリソミーのうち頻度が高いものに21番染色体トリソミーであるダウン症がある
  • ここでいう「頻度」というのは「生存して産まれてくる」トリソミーの中でこう割合を占める、という意味合いで考えることが多いように思うが、「生存して産まれてくる」という表現を気にし始めると、「死産」は、「流産」は、とかの扱いをどうするのか、ということも気になってくる。胎性致死のトリソミー(大きい染色体などの多数の染色体では胎性致死とされる)の「頻度」は高いのか低いのかも気になる
  • では、公衆衛生・疫学的にこのあたりをどう扱っているのかを確認してみることにする
  • こちらの論文(Twenty-year trends in the prevalence of Down syndrome and other trisomies in Europe: impact of maternal age and prenatal screening)での扱いをなぞってみよう
  • そもそも流産・死産は医学定義と法的定義があって、国別の違いもあり(週数基準だったり体重基準だったりも違う→参照)
  • 大きく2つに分ける
    • Live birth(LB)
    • Still birth
      • Still birthの中には
        • Late fetal death(FD):20週以降
        • Termination of pregnancy for fetal anomaly (TOPFA): 週数によらず
      • が含まれるようで、このどちらにも含まれないのは、「流産」とよく言われるものの大半が入る…という感じ
  • トリソミーの有無はLBとLate fetal death(FD)とTOPFAについて確認できるので
  • トリソミーのprevalenceは
    • \frac{\text{LB(i.tri)}+\text{FD(i.tri)}+\text{TOPFA(i.tri)}}{\text{total LB}+\text{Still birth}}\times 10000
      • ただしi.triは第i番染色体のトリソミーを表す
  • トリソミーのLive birth当たりprevalenceは
    • \frac{\text{LB(i.tri)}}{\text{total LB}}
  • その他の指標
    • perinatal mortalityについては生後1週間以内の死亡を考慮する
    • TOPFAの一部はFDの基準である20週に満たなかったかもしれない亜群を含むのでそれについての補正を入れた指標もある

疫学のためのR

基礎知識

  • ゲノムやオミックス・バイオマーカーなどを用いた経時的情報収集・疫学の遂行のための専門員が学ぶことになるだろう内容・範囲は何かと考えた
  • 思いつくままに挙げてみる
  • ▲は自分が教えたり資料を作ったりしたことが「ゼロではない」内容
  • ■は大学・大学院で正規のカリキュラムとしてあまり成立していなさそうな内容
  • 「遺伝学」
  • 実験手法学・臨床検査学的には
  • 電子情報的には
    • ■「電子カルテ基礎(利用法を含む)」
    • 「情報の基礎的ハンドリング」
    • 「データベース」
    • ▲「統計解析ソフト」
  • 統計学的には
  • 「生物統計」
  • ▲「遺伝統計」
  • ■「オミックス統計」
  • 疫学的には