GWAS
二値表現型の場合の分散分解はまだ改善の余地がありそうなので、それについては調べる必要があるだろう(めぼしい資料が見つからないので、もしかしたら、これから誰かがやらないといけないのかもしれない) やるとしたら、混合モデルを引き継ぎつつ、線形では…
linear mixed modelのためのRパッケージはいくつかあるようで、lme4パッケージなどが有名なようだが linear mixed modelの頻繁な利用対象は、サンプルをいくつかの群にわけてそれぞれでことなるバラツキを想定したりするものらしく、すべてのサンプルに関す…
前の記事では既知のリスク座位に加えて未知のリスク座位を想定した 未知のリスク座位があって、それに関する情報が皆無であれば、なすすべもない しかしながら、個人のジェノタイプの遠近関係はゲノムワイド情報があれば定量できる 個人間の遺伝的遠近が、フ…
一部の座位はわかっていてジェノタイプが得られる 一部の座位はわかっいないとする ## 一部のリスク座位はわかっている ## 多数の座位は不明で、その一部はリスク座位 # No. loci n.marker <- 10 # population size N <- 10^5 # Genotype matrix g <- matrix…
0,1,2のジェノタイプデータは平均はアレル頻度に依存するし、分散もアレル頻度に依存する 今、遺伝率を計算するときには、全座位のもたらす「分散」の和が欲しいので、すべての座位を分散的に同じように扱えるとよい そうすると、線形回帰してやったとき、遺…
二値形質の場合には、上述の量的形質の場合に算出した、遺伝因子と環境因子との和であるphenoをそのまま表現型にするわけにはいかないので工夫が必要である 一つのモデルは、閾値を設定しそれより大きいと発病(値 1)、そうでなければ非発病(値0)とするもので…
GCTAホームページ GREMLと称する手法 Genome-wide (chromosome-wide) REML(REstricted Maximum Likelihood) 遺伝要因については、全サンプルについてペアワイズに「遺伝的な遠近関係〜分散共分散」行列Gを作り、そのGに「遺伝的分散係数」を掛けた行列を考え…
説明ページ 混合効果とは「固定効果」と「変量効果」との2つの効果の混合、ということ 固定効果とはすべてのサンプルで同じ様式で指定する効果 変動効果とは、サンプルごとにどれくらいばらつくかが変わるのでそれのこと。群効果とかいろいろなものを入れら…
狭義遺伝率を観測データから考えるのであれば、単純な多座位の線形回帰をして、全座位の分散の和から計算できる Rでやってみる # No. loci n.marker <- 100 # population size N <- 10^5 # Genotype matrix g <- matrix(0,N,n.marker) # allele freq of mark…
座位数、その強さ、環境要因の強さなどを定めて、データをシミュレーション作成する 狭義遺伝率は各座位の相加モデルでの寄与分を考え、また、座位間の相互作用を考えず、すべての座位について相加モデルを仮定した場合の、「座位が相加的に説明する分散」で…
遺伝率は表現型の決定に占める遺伝要因の強さの指標であり 元来、量的表現型が血縁関係者間でどれくらい似ているかが、血縁者の遺伝的近さから推定される遺伝要因の共有具合に照らして算出された 最近のGWAS等によるリスク座位を網羅しようとするアプローチ…
こちらの再掲になりますが、SNSは時間軸に埋もれがちで検索もしにくいので・・・ 論文はこちら 成果はかいつまむとこんな感じです。 - 関節リウマチNature論文 # 規模 総人数 103,638(>10万) (ケース29,880,コントロール73,758)人 民族構成 ヨーロッパ系 (67…
GWASでほとんど成果の上がっていない病的過程について考える その病的過程はエンティティとしての疾患の一部という意味で「サブ・最終フェノタイプ」 その「サブ・最終フェノタイプ」は最終フェノタイプとしての疾患x複数に共有されている このようなサブ・…
JMP genomicsソフトウェアのマニュアル記事が使いやすい こちらがマニュアル あえてリストを抜き出せば *Check Data Contents *Verify Gender of Samples *Subset and Reorder Genetic Data *Recode Genotypes *Recode Missing Genotypes *Flip Strand *SNP …
Rのこんなパッケージシリーズがある。「XxxABEL」(ホームページ) その中のGenABELが『ノートでGWAS』の関数群らしい それを支えているのがDatABEL 巨大な行列形式のデータをRで効率的・高速に扱うための仕組み ファイルとして持っている行列形式のテキストフ…
Plinkで近縁関係(参考記事:こちら)
電子化された臨床情報(Electrical Health Record)を用いた研究(EHR-driven genomic research)についてはこちらを eMERGE グループ(米国 Venderbilt、BROADその他)のページはこちら マルチ施設のphenotype集約・登録用のウェブインターフェースについてはこ…
結果のインパクト Assessing and managing risk when sharing aggregate genetic variant data. David W. Craig, Robert M. Goor, Zhenyuan Wang, Justin Paschall, Jim Ostell, Michael Feolo, Stephen T. Sherry & Teri A. Manolio,p730 | doi:10.1038/nrg…
GWASとは何か:こちらのイントロ GWASのプロセス 実験 実験データQC 単マーカー単位の関連評価 全マーカーの結果の分布評価 全マーカーの結果の分布評価に基づく補正 plinkチュートリアル(こちら)をなぞってみる(ただし、QC論としては、こちらとはニュアンス…
ゼロから始めて6週間で手伝えるようになることを目標にする たとえばのシチュエーション 近未来に短期間の予定でGWASドライ解析の現場見学・実習をすることになったとき ステップ・マイナス1:始める前に 具体的な自分のための目標をタイムテーブル付きで…
複合遺伝性(疾患) 1ローカスによるメンデルの法則によって説明できず、複数の(通常は多数の)ローカスの影響によって決まる遺伝形質(疾患) 遺伝形質 量的形質 質的形質(疾病など) 多遺伝子性(Polygenic) 身長の遺伝子論文 Hundreds of variants clustered in…
一般論としてGWASデータをどう確たるものにするか、についての、おさらい
京大(医)ゲノム医学センター 疾患ゲノム疫学分野のツールが公開になってます。こちら
ゲノムワイドの関連検定データが出たとする。DNA上の物理位置を横軸に、関連検定統計量を縦軸にプロットするのはルーチン。 ルーチンはだれでもできることが望ましい(できれば自分でやらずにだれかにやって欲しい…) 次のようなファイルがテキストファイル…
Taxonomy3なる商業ベースの多変量遺伝因子解析ツールがあるそうです。 サイト記事を読んだ限りでの感想は以下の通り。 ケースやコントロールにも「遺伝要素の色が濃いことによって、ケースやコントロールになっている人」と、「非遺伝要素の色が濃いことによ…
1 遺伝概論(遺伝・遺伝子・染色体・DNA・変異・多型・交差・組み換え) 2 集団遺伝学概論(集団・中立・Infinite site model・遺伝的多様性の評価・変異率・組み換え率・有効集団サイズ・Coalescent・ARG・Fixation・集団構造化・HWE/HWD・LE/LD・選択・歴史…
スライド
CNVジェノタイプデータ 関連検定 Heterogeneity検定 マン・ホイットニー・ウィルコクソン 2群わけ ロジスティック回帰 トレンド検定 HWE検定 ハンドアウト
分子遺伝学おさらい 多型と分子遺伝学・分子レベルのアレル特異性 関連と因果 スライド