SNP
Sum-of-Chi-square統計量と言うのがあって、それを遺伝子ごとの関連シグナル検出に使う、という話がある(こちら journals.plos.org ) ちょっと主旨は変わるが、1SNPの2x3テーブルに対して、優性・劣性・相加の3検定を実施してそのカイ二乗統計量の和…
二値表現型の場合の分散分解はまだ改善の余地がありそうなので、それについては調べる必要があるだろう(めぼしい資料が見つからないので、もしかしたら、これから誰かがやらないといけないのかもしれない) やるとしたら、混合モデルを引き継ぎつつ、線形では…
linear mixed modelのためのRパッケージはいくつかあるようで、lme4パッケージなどが有名なようだが linear mixed modelの頻繁な利用対象は、サンプルをいくつかの群にわけてそれぞれでことなるバラツキを想定したりするものらしく、すべてのサンプルに関す…
前の記事では既知のリスク座位に加えて未知のリスク座位を想定した 未知のリスク座位があって、それに関する情報が皆無であれば、なすすべもない しかしながら、個人のジェノタイプの遠近関係はゲノムワイド情報があれば定量できる 個人間の遺伝的遠近が、フ…
一部の座位はわかっていてジェノタイプが得られる 一部の座位はわかっいないとする ## 一部のリスク座位はわかっている ## 多数の座位は不明で、その一部はリスク座位 # No. loci n.marker <- 10 # population size N <- 10^5 # Genotype matrix g <- matrix…
0,1,2のジェノタイプデータは平均はアレル頻度に依存するし、分散もアレル頻度に依存する 今、遺伝率を計算するときには、全座位のもたらす「分散」の和が欲しいので、すべての座位を分散的に同じように扱えるとよい そうすると、線形回帰してやったとき、遺…
二値形質の場合には、上述の量的形質の場合に算出した、遺伝因子と環境因子との和であるphenoをそのまま表現型にするわけにはいかないので工夫が必要である 一つのモデルは、閾値を設定しそれより大きいと発病(値 1)、そうでなければ非発病(値0)とするもので…
GCTAホームページ GREMLと称する手法 Genome-wide (chromosome-wide) REML(REstricted Maximum Likelihood) 遺伝要因については、全サンプルについてペアワイズに「遺伝的な遠近関係〜分散共分散」行列Gを作り、そのGに「遺伝的分散係数」を掛けた行列を考え…
説明ページ 混合効果とは「固定効果」と「変量効果」との2つの効果の混合、ということ 固定効果とはすべてのサンプルで同じ様式で指定する効果 変動効果とは、サンプルごとにどれくらいばらつくかが変わるのでそれのこと。群効果とかいろいろなものを入れら…
狭義遺伝率を観測データから考えるのであれば、単純な多座位の線形回帰をして、全座位の分散の和から計算できる Rでやってみる # No. loci n.marker <- 100 # population size N <- 10^5 # Genotype matrix g <- matrix(0,N,n.marker) # allele freq of mark…
座位数、その強さ、環境要因の強さなどを定めて、データをシミュレーション作成する 狭義遺伝率は各座位の相加モデルでの寄与分を考え、また、座位間の相互作用を考えず、すべての座位について相加モデルを仮定した場合の、「座位が相加的に説明する分散」で…
遺伝率は表現型の決定に占める遺伝要因の強さの指標であり 元来、量的表現型が血縁関係者間でどれくらい似ているかが、血縁者の遺伝的近さから推定される遺伝要因の共有具合に照らして算出された 最近のGWAS等によるリスク座位を網羅しようとするアプローチ…
これがペイパー 個人のSNPフェーズ不明データから、個人ペアごとに処理してIBD範囲を推定する方法は多いが(Relate,PLINK,BEAGLE,GERMLINEとか(詳細は知らないのですが、MCMC_IBDfinderのペイパーの記載によれば、ということで))、MCMC_IBDfinderは3人以上い…
以下のRmdに書いていないこと トレンド検定は、いわゆる「トレンドカイ二乗検定」と「Cockran-Armitage検定」とが使えて、それは(nは総サンプル数)で相互の統計量を換算し合う関係の、自由度1のカイ二乗分布に基づく検定であること Rmdファイルの処理の仕方…
アディティブモデル用のトレンドカイ二乗統計量とロジスティック回帰との関係を見たい それが見えやすいように、分割表を表す文字・添え字を以下のように工夫する 分割表 ロジスティック回帰では、アレル本数に関しての確率で表現型が1,0にわかれるとし、を…
ハプロイド・ディプロイド あるマーカーのアレル数がkのとき、アレル頻度に関する情報はk個の値で(も)与えられる。ただし、総和が1という制約があるので、自由度はk-1 この自由度k-1の情報を幾何的にどう配置するか、はいくつかやり方がある 例えば、アレル…
関係するRのパッケージはこちら This is something on the two types of test for 2x3 tables. When we do case-control association test for a SNP, we get a 2x3 table. For a 2x3 table from an autosomal SNP, we cat perform (1) 2x3 genotypic test w…
Understanding the contribution of synonymous mutations to human disease.Zuben E. Sauna & Chava Kimchi-Sarfaty,p683 | doi:10.1038/nrg3051 影響の出し方 スプライシング RNAの立体構造 翻訳効率 RSCU(Relative Synonymous Codon Usage)を含む その他 …
こちらの講義に出席してみる RのGenetics関係のパッケージのページ(こちら) RでHWE library(HardyWeinberg) x <- c(100, 50, 10) HW.test <- HWChisq(x, verbose = TRUE) HW.lrtest <- HWLratio(x, verbose = TRUE) HW.exacttest <- HWExact(x, verbose = TR…
こちらから べき集合の要素数、、SNP、ハプロタイプ・LD(これ)、ヘテロ…とどこかで何かしらつながるとすれば、入れ替え可能を想定している点 ヘテロ接合体のジェノタイプは父母の由来別を気にしないことにする SNPの並び方について問題にしない(SNPA, SNPBが…
血縁関係があるとき、アレルがシェアされる そのアレルの由来が「同祖」であることがIBD IBDであることは、家系情報を使って、そのアレルが確かに伝達されたと言えるときには、それと知れる GWASデータのときなどは、「アレルシェア」が染色体位置として途切…
今、ある遺伝子があって、N個の一塩基多型があるとする すべての一塩基多型は2アレル型であるとする 個々の一塩基多型のジェノタイプ(ディプロタイプ)は3タイプある 個々の一塩基多型の3つのジェノタイプは、2アレルのうちの1アレルに関して保有本数を…
ゼロから始めて6週間で手伝えるようになることを目標にする たとえばのシチュエーション 近未来に短期間の予定でGWASドライ解析の現場見学・実習をすることになったとき ステップ・マイナス1:始める前に 具体的な自分のための目標をタイムテーブル付きで…
2x3表の周辺度数が取らせうるテーブルを2次元空間に配置する方法 総サンプル数Nに対する割合として、標準化する 群1(ケース)がp,群2(コントロール)がq=1-p 3ディプロタイプの頻度が、 とする 期待テーブルを原点とする 観測テーブル{{n11,n12,n13…
組み換えなしに無限サイトモデルにてSNPが発生するとする。 多型箇所の数=変異の数 ハプロタイプ数について、多型の発生樹のパターン数は、カタラン数 WikiPedia Wikipedia(英語版)の記載 (ベル数, free cumulants, Wigner semicircle distribution, free p…
2008/08/15にアレル特異的リスクの表現についてメモした(こちら)。 少し変える。変えると、2アレルのリスクの差がアレル頻度に依存しなくなる。 集団に0,1型の形質がある。そのprevalence をとする SNPがあり、0,1のアレルを持つ。それぞれのアレル頻度をと…
集団に0,1型の形質がある。そのprevalence をとする SNPがあり、0,1のアレルを持つ。それぞれのアレル頻度をとする。 集団での平均的リスクは、prevalence,で定まっており、SNPのアレル特異的リスクは、そこからのずれとして考えることとすると、2アレルの…