2007-07-01から1ヶ月間の記事一覧

自由度2の正確確率を2段階で計算(2)

一昨日の記事のJava版。 2段階処理にすると、サンプルサイズが小さいときは、オーバーヘッドの部分のせいで、かえって遅くなるようだが、10000を越えるあたりから、2段階処理の方が速い(ようだ) /* * 自由度2のフィッシャーは自由度1→2と2段階で…

フリーの数式処理ソフト

新聞の広告欄に、はじめての数式処理ソフト CD-ROM付 (ブル-バックス) はじめての数式処理ソフト CD-ROM付 (ブル-バックス) 作者: 竹内薫 出版社/メーカー: 講談社 発売日: 2007/07/20 メディア: 新書 なる本が出ていた。フリーの数式処理ソフトMaximaのCD-R…

自由度2の正確確率を2段階で計算

自由度2の分割表は2x3テーブル。 XXXxxx合算 ケースabcg コントロールdefh 合計ijkn このテーブルの観測確率は 今、この周辺度数において、である場合を考える。 XXOthers合算 ケースa_xb_x+c_xg コントロールd_xe_x+f_xh 合計ij+kn ,,であるから、その…

ぺらぺらめくるPLoS Computational Biology 2007

A Survey of Genomic Properties for the Detection of Regulatory Polymorphisms Modeling Systems-Level Regulation of Host Immune Responses Binding Site Graphs: A New Graph Theoretical Framework for Prediction of Transcription Factor Binding S…

ぺらぺらめくるPLoS Genetics 2007

Network-Based Analysis of Affected Biological Processes in Type 2 Diabetes Models A Genomic Pathway Approach to a Complex Disease: Axon Guidance and Parkinson Disease Identification of Common Genetic Variation That Modulates Alternative Sp…

ぺらぺらめくるPLoS Biology 2007

Exon Silencing by UAGG Motifs in Response to Neuronal Excitation Sing the Genome Electric: Excited Cells Adjust Their Splicing Splicing and the Evolution of Proteins in Mammals A New Approach for Using Genome Scans to Detect Recent Positiv…

SNP2x3データ分割表検定(漸近近似)まとめ

2x3分割表が得られたとする。 XXXxxx合算 ケースabcg コントロールdefh 合計ijkn 検定方法として漸近近似による方法として次のようなものがある。 カイ自乗検定では、 2x3分割表についてのそれ() アレルについて2x2分割表を作り直して Xx合算 ケース…

カイ自乗検定と正確検定について

HWEの正確検定についてこんな記事(こちら)を書いた。そこでは、N人についての観測を、Nx2分割表として正確確率を計算することを述べた。 このNx2分割表についてのカイ自乗統計量がどのようにHWE検定のカイ自乗統計量と関係しているかを考える。 アレル1アレ…

エクセルで順序カテゴリのトレンドテスト

エクセルはこちら。 添付のエクセルのB1セルには、カテゴリ数を入れる。 第3行がケースのカウント数、第4行がコントロールのカウント数。 第7行には、それぞれのカテゴリに与える重さを入れる。 たとえば、3段階の場合に、今、0,1、2が与えてある。 …

へのフィット(続きの続きの続き)

これに先立つ記事は7月10日(こちら)、14日(こちら)。 そこで登場した、尤度、累積尤度をシミュレートして雰囲気をつかむためのエクセルはこちら。 デフォルトでは、1000個(N)の独立一様乱数(0-1)の最小値を100回サンプリング(計1000x100 乱数)し、その100個…

へのフィット(続きの続き)

最小P値の期待値、 今、N個の独立サンプルの最小P値がk回観測されたとする。その観測のもとでの、Nの最尤推定値は という特別な場合は Nの最尤推定値が1となるのは、 k=1回の観測p値が0.5の場合、N=1の場合の尤度もN=2の場合の尤度も1であるが、それは こ…

へのフィット(続き)

これに先立つ記事は7月10日(こちら) 独立テスト相当数をとしたときにを観測する尤度は、である。 この尤度関数のnに関する不定積分。 メモ書きをとりあえずここへ。となっているがとするべき箇所が散見される ただし、、 は漸化式になっていて、

GWAデータ解析フローの覚書

GWA

ドラフト(のままかも知れない) 日 英

SNP属性の記法のこと

SNP

1 ゲノム地図について ゲノム配列を地図とする。 地図には表表示と裏表示がある(北半球を上にするやりかたと南半球を上にするやりかたのようなもの。ゲノム上の位置は、緯度を極から数えて0度から180度で表すようなもの)。 位置には、「海」「工場地帯」「…

メモ

メモサイト

へのフィット

M回の相互に独立ではないかもしれないテストを行ったときに得られる最小の検定P値について考える。 もしM回の非独立なテストが、N回の独立なテストに相当するとみなせるとする。 このとき、FWERの考え方から、最小のP値の累積確率はで表される。 これを微分…

SNPジェノタイプ2x3テーブルからトレンドテスト

SNPジェノタイプ2x3表があるとする。 アレル本数0,1,2本に関するトレンドテスト。 今、2x3表のケースコントロール合算ジェノタイプカウントについて、ヘテロ人数がH、総人数がN、全体での2アレルの頻度がp1,p2とする。 このとき、。 今、この2x…

関連SNPの統計量空間の狭さ:ラベルパーミュテーション用エクセル2

昨日、ラベルパーミュテーションをエクセルで簡易に行ってみた。 今日は、相互に独立でない2SNP(連鎖不平衡など)において同様にエクセルでラベルパーミュテーションし、その統計量を比較・プロットしてみた。 これは、2SNPのジェノタイプの近さと、2SNPか…

ラベルパーミュテーション用エクセル

パーミュテーションテストはサンプルの従属変数ラベルの付け替えによって、統計量の分布を得る手法である。従属変数ラベルの付け替えを、とりうるすべてについて行えば正確確率検定と同じ結果になる。今、中規模以上のサンプルについては、ラベルの付け替え…

連鎖平衡状態を表すための正四面体の部分体

四面体の持つ4頂点のうち、1つを含む。この1つをもう一つの分体と共有しているので、八分の一()を所有している。 四面体の持つ、「SNP1個に相当する4辺」のうちの1辺の半分を有する。この半分辺は他の分体と共有しておらず、八分の一()を有しているこ…

連鎖平衡曲面

作図アプリケーション シンデレラはこちら

ドリフトのアレル頻度変化のグラフ作成

ごく大雑把なつくりのドリフトシミュレーションソース package popGenet;public class Drift { /** * @param args */ int initpopsize; double mutrate; int numgen; //int popsizepattern;//0 constant, 1 exponential double expcoeff; public static void…

均一確率分布からの最小P値の分布(多面体篇)

2006年12月5日の記事に、この件を書いた。そのときは、FWERの考え方と微分の考え方から、 なる式を示した。 昨日もその別の考え方を書いた。 もうひとつの考え方としては、こう。 N=2のとき、xy平面上の1辺の長さが1の正方形を考える。頂点を{0,0,0},{0,1,…

均一確率分布からの最小P値の分布

2006年12月5日の記事に、この件を書いた。そのときは、FWERの考え方と微分の考え方から、 なる式を示した。 この式の由来を幾何学的に考える。 均一確率分布からの独立なN回のサンプリングは、辺の長さが1のN次元立方体からのサンプリングであると考える。…

マトロイド メモ

Handbook of Discrete and Computational Geometry (Discrete Mathematics and Its Applications)Chapman & Hall発売日:2004-04ブクログでレビューを見る» 駆け足で読む凸多面体の数学の対応講(第6講) Wikipedia Mathworld 有向マトロイド(Mathworld→凸多…