GWAS

この先へ

二値表現型の場合の分散分解はまだ改善の余地がありそうなので、それについては調べる必要があるだろう(めぼしい資料が見つからないので、もしかしたら、これから誰かがやらないといけないのかもしれない) やるとしたら、混合モデルを引き継ぎつつ、線形では…

Rでの実践編〜線形混合モデル(REML)

linear mixed modelのためのRパッケージはいくつかあるようで、lme4パッケージなどが有名なようだが linear mixed modelの頻繁な利用対象は、サンプルをいくつかの群にわけてそれぞれでことなるバラツキを想定したりするものらしく、すべてのサンプルに関す…

ゲノムワイド情報を使って未検出座位の代用をする

前の記事では既知のリスク座位に加えて未知のリスク座位を想定した 未知のリスク座位があって、それに関する情報が皆無であれば、なすすべもない しかしながら、個人のジェノタイプの遠近関係はゲノムワイド情報があれば定量できる 個人間の遺伝的遠近が、フ…

全座位が明らかでないときにはどうするか:未検出座位

一部の座位はわかっていてジェノタイプが得られる 一部の座位はわかっいないとする ## 一部のリスク座位はわかっている ## 多数の座位は不明で、その一部はリスク座位 # No. loci n.marker <- 10 # population size N <- 10^5 # Genotype matrix g <- matrix…

標準化ジェノタイプ

0,1,2のジェノタイプデータは平均はアレル頻度に依存するし、分散もアレル頻度に依存する 今、遺伝率を計算するときには、全座位のもたらす「分散」の和が欲しいので、すべての座位を分散的に同じように扱えるとよい そうすると、線形回帰してやったとき、遺…

二値形質の狭義遺伝率

二値形質の場合には、上述の量的形質の場合に算出した、遺伝因子と環境因子との和であるphenoをそのまま表現型にするわけにはいかないので工夫が必要である 一つのモデルは、閾値を設定しそれより大きいと発病(値 1)、そうでなければ非発病(値0)とするもので…

GCTA

GCTAホームページ GREMLと称する手法 Genome-wide (chromosome-wide) REML(REstricted Maximum Likelihood) 遺伝要因については、全サンプルについてペアワイズに「遺伝的な遠近関係〜分散共分散」行列Gを作り、そのGに「遺伝的分散係数」を掛けた行列を考え…

線形混合モデル、そのための制限付き最尤法

説明ページ 混合効果とは「固定効果」と「変量効果」との2つの効果の混合、ということ 固定効果とはすべてのサンプルで同じ様式で指定する効果 変動効果とは、サンプルごとにどれくらいばらつくかが変わるのでそれのこと。群効果とかいろいろなものを入れら…

狭義遺伝率は線形回帰

狭義遺伝率を観測データから考えるのであれば、単純な多座位の線形回帰をして、全座位の分散の和から計算できる Rでやってみる # No. loci n.marker <- 100 # population size N <- 10^5 # Genotype matrix g <- matrix(0,N,n.marker) # allele freq of mark…

遺伝率用データをシミュレーションする(量的形質)

座位数、その強さ、環境要因の強さなどを定めて、データをシミュレーション作成する 狭義遺伝率は各座位の相加モデルでの寄与分を考え、また、座位間の相互作用を考えず、すべての座位について相加モデルを仮定した場合の、「座位が相加的に説明する分散」で…

遺伝率

遺伝率は表現型の決定に占める遺伝要因の強さの指標であり 元来、量的表現型が血縁関係者間でどれくらい似ているかが、血縁者の遺伝的近さから推定される遺伝要因の共有具合に照らして算出された 最近のGWAS等によるリスク座位を網羅しようとするアプローチ…

関節リウマチ論文

こちらの再掲になりますが、SNSは時間軸に埋もれがちで検索もしにくいので・・・ 論文はこちら 成果はかいつまむとこんな感じです。 - 関節リウマチNature論文 # 規模 総人数 103,638(>10万) (ケース29,880,コントロール73,758)人 民族構成 ヨーロッパ系 (67…

ゲノム疫学解析が伸ばす触手

GWASでほとんど成果の上がっていない病的過程について考える その病的過程はエンティティとしての疾患の一部という意味で「サブ・最終フェノタイプ」 その「サブ・最終フェノタイプ」は最終フェノタイプとしての疾患x複数に共有されている このようなサブ・…

GWASのステップ

JMP genomicsソフトウェアのマニュアル記事が使いやすい こちらがマニュアル あえてリストを抜き出せば *Check Data Contents *Verify Gender of Samples *Subset and Reorder Genetic Data *Recode Genotypes *Recode Missing Genotypes *Flip Strand *SNP …

データファイルをRの外側に持ってアクセス

Rのこんなパッケージシリーズがある。「XxxABEL」(ホームページ) その中のGenABELが『ノートでGWAS』の関数群らしい それを支えているのがDatABEL 巨大な行列形式のデータをRで効率的・高速に扱うための仕組み ファイルとして持っている行列形式のテキストフ…

近縁関係

Plinkで近縁関係(参考記事:こちら)

電子カルテの活用、ゲノム疫学

電子化された臨床情報(Electrical Health Record)を用いた研究(EHR-driven genomic research)についてはこちらを eMERGE グループ(米国 Venderbilt、BROADその他)のページはこちら マルチ施設のphenotype集約・登録用のウェブインターフェースについてはこ…

ぱらぱらめくる『Nature Reviews Genetics 2011』8 GWASの結果を使う

結果のインパクト Assessing and managing risk when sharing aggregate genetic variant data. David W. Craig, Robert M. Goor, Zhenyuan Wang, Justin Paschall, Jim Ostell, Michael Feolo, Stephen T. Sherry & Teri A. Manolio,p730 | doi:10.1038/nrg…

GWAS速効

GWASとは何か:こちらのイントロ GWASのプロセス 実験 実験データQC 単マーカー単位の関連評価 全マーカーの結果の分布評価 全マーカーの結果の分布評価に基づく補正 plinkチュートリアル(こちら)をなぞってみる(ただし、QC論としては、こちらとはニュアンス…

GWASのドライの丁稚になるとき

ゼロから始めて6週間で手伝えるようになることを目標にする たとえばのシチュエーション 近未来に短期間の予定でGWASドライ解析の現場見学・実習をすることになったとき ステップ・マイナス1:始める前に 具体的な自分のための目標をタイムテーブル付きで…

量的疾患の解析手法のメモ

複合遺伝性(疾患) 1ローカスによるメンデルの法則によって説明できず、複数の(通常は多数の)ローカスの影響によって決まる遺伝形質(疾患) 遺伝形質 量的形質 質的形質(疾病など) 多遺伝子性(Polygenic) 身長の遺伝子論文 Hundreds of variants clustered in…

GWASデータの活用

一般論としてGWASデータをどう確たるものにするか、についての、おさらい

KGWAST (Kyoto Genome Wide Association Study Tool kit)

京大(医)ゲノム医学センター 疾患ゲノム疫学分野のツールが公開になってます。こちら

講義で教える、『お手軽マンハッタンプロット』

ゲノムワイドの関連検定データが出たとする。DNA上の物理位置を横軸に、関連検定統計量を縦軸にプロットするのはルーチン。 ルーチンはだれでもできることが望ましい(できれば自分でやらずにだれかにやって欲しい…) 次のようなファイルがテキストファイル…

Taxonomy3

Taxonomy3なる商業ベースの多変量遺伝因子解析ツールがあるそうです。 サイト記事を読んだ限りでの感想は以下の通り。 ケースやコントロールにも「遺伝要素の色が濃いことによって、ケースやコントロールになっている人」と、「非遺伝要素の色が濃いことによ…

時間配分

1 遺伝概論(遺伝・遺伝子・染色体・DNA・変異・多型・交差・組み換え) 2 集団遺伝学概論(集団・中立・Infinite site model・遺伝的多様性の評価・変異率・組み換え率・有効集団サイズ・Coalescent・ARG・Fixation・集団構造化・HWE/HWD・LE/LD・選択・歴史…

11 結語(自分のデータといかに向き合うか)

スライド

10 CNV(データ構造と解析手法)

CNVジェノタイプデータ 関連検定 Heterogeneity検定 マン・ホイットニー・ウィルコクソン 2群わけ ロジスティック回帰 トレンド検定 HWE検定 ハンドアウト

9 SNP-LD mapping、上記ルーチンのその先(フェノタイプネットワーク、パスウェイ解析、遺伝子組み合わせ、前向き)

8 リスク多型の機能性・因果関係評価(分子遺伝学的側面)

分子遺伝学おさらい 多型と分子遺伝学・分子レベルのアレル特異性 関連と因果 スライド