2006-11-01から1ヶ月間の記事一覧

複数の独立な検定のP値のプロットが直線になることについてのメモ

N個の独立な検定を行って、そのP値を昇順にソートし、横軸に1からNまでの自然数を、縦軸にP値をとると、の直線に近似できる。これを組み合わせと、期待値の算出などを使って確かめてみるとすると、どういう風になるか、のメモ。 独立な検定で、帰無仮説が正…

Family-wise error rate

前記事で、未満のP値を持つ検定試行が1回以上起きる確率はで表される。これは、いわゆるFamily-wise error rateと呼ばれるものである。この式の近似が意味するところがBonferroni補正である。の2次以上の項を省略したものになっている。 今、FWERがになるよ…

付け焼刃のCで分配

PCクラスタはある。たくさんの処理がある。複数の処理の間で特にデータのやりとりは必要ない。とにかく、ばらばらとたくさん処理したい。クラスタの設定が甘くて、うまく動かせない。 シェルコマンドとパールなどで細かいところは書いて、クラスタ分配のあた…

Multilocus LDインデックス

個人的な研究テーマに近い話しで少しだけ文献メモ。 the correlation in the haplotypic structure between two subsets of SNPs 複数のSNPを持つ領域につき、SNPを2群に分け、群別のハプロタイプ頻度から算出する 文献はこちら エントロピーの定義式を用い…

線形計画法の用語 3 線形計画法 駆け足で読む B.コルテ/J.フィーゲンの 組合せと最適化-理論とアルゴリズム

3.0 線形計画問題(Linear Programming;LP) においての制約のもとでを最大化せよ、という問題である 意味を書き下すと、m個の1次線形不等式を制約条件とし、その制約条件を満たす、n個の値のセット(ベクトル)の中で、によって定められるスカラー量を最大にす…

マーカーの非独立性を眼で見る

独立でない複数のマーカーについてmultiple testingをすることを考える。大きく2つのマーカー間非独立性がある(連鎖不平衡解析の場合)。ひとつは連鎖不平衡。もうひとつは集団の構造化。眼でみると、掲載図(オリジナルはこちら)。 掲載図では、マーカーがラ…

正準相関係数

同サンプルサイズの2次元行列型の複数のデータ(マイクロアレイデータ)を正準相関係数を使ってつないで、相互の関係についての統計量を引き出していた。 正準相関分析についてはこちらを参照。

多次元データ空間の統計力学的取り扱い International Genetic Epidemiology Society年会(IGES2006)

統計力学 statistical mechanics アンサンブル(確率集団) ensemble ミクロカノニカルアンサンブル microcanonical ensemble カノニカルアンサンブル canonical ensemble グランドカノニカルアンサンブル grand canonical ensemble

統計力学関係 International Genetic Epidemiology Society年会(IGES2006)

SNPはDiallelic であることを特徴とし、数は多くなるが、そのデータ次元構造が単純である。そのあたりを利用していじるときに、統計力学のもろもろを援用している発表もあった。 それに関してすこしでも概要をつかもうとすると、まず、次のような、(はるか・…

集団構造化とエピスタシスIGES2006)

エピスタシスの解析は、相互に遠位のローカス同士のジェノタイプ組合せをケース・コントロール別に比較したとき、が、個別ローカスに認められるケース・コントロール間のジェノタイプ分布差から説明しにくいことから統計的な有意差を求めるもの(が多い)。MDR…

Symbolic discriminant analysis (SDA) (IGES2006)

内容をかいつまんでも了解していないけれど、こちらのサイトの下段の記載によると、組合せ最適化のための手法で、因子とそれをつなぐ演算子とを求めるための方法らしい。最適化にあたりラッパープログラムを通じて任意のアルゴリズムにつなぐなどしている。…

ハプロタイプ関連解析(IGES2006)

系統樹によるプーリング ハプロタイプベースの関連検定を行うとき、ハプロタイプ数が増えてくると厄介なので、なんらかの基準でプールしたい。いくつか方法がある。これらでプーリング問題がすべて解決するわけではないけれど、小セグメントの ALTree TreeSc…

International Genetic Epidemiology Society年会(IGES2006)

11月16日、17日の2日間、フロリダ州タンパにて開催。学会サイトはこちら。日本人がいない・・・。その覚書。

円ボロノイ図

同じく、『形と動きの数理』から。Wikiのボロノイ図は「円ボロノイ図」ではなく、一般のそれだが、解析における意味合いとしては、円ボロノイの原理を使って、円による平面充填問題の探索スペースの次元減少を行っている。前項のふっくら三角形も次元減少に関…

ふっくらした三角形

『形と動きの数理〜工学の道具としての幾何学』 東京大学出版会 形と動きの数理―工学の道具としての幾何学 作者: 杉原厚吉 出版社/メーカー: 東京大学出版会 発売日: 2006/09 メディア: 単行本 リラックスして読む本として10月30日の記事に引いた本だが、そ…

用語の整理、Grammatical evolutionとその周辺

日英の用語のどちらも、用いられている単語が少なく、それらを組み合わせて使っているのでわかりにくい。わかりにくいだけでなく相互にオーバーラップした定義になっていることも多いさらにわかりにくい。すっきり定義するとうそが入ることは承知の上で、自…

Grammatical evolutionを用いたGene x Gene interaction 推定@GAW15

進化的計算(Wikiはこちら)のひとつである、Grammatical evolutionを用いて、クロスバリデーションをしながら、膨大なG x G interactionsの中から、強い関係のそれを見つける手法が新規手法の紹介があった。MDRのDr. Lichieのラボから。 Grammatical evolutio…

投稿内容の分類について Genetic Analysis Workshop 15 @ Tampa, FL, USA. Nov13-15,2006

250を越える投稿(たぶん252)があり、眼を通すだけで大変。 グループに分類してそれなりのまとまりを出すのはかなりの難業であり、オーガナイザーの苦労がしのばれるし、分類に完璧に成功することは期待するべきではないと思うが、それでも、分類のされかたか…

概要 Genetic Analysis Workshop 15 @ Tampa, FL, USA. Nov13-15,2006

フロリダ半島のメキシコ湾側のまち、TampaでGenetic Analysis Workshop 15 (GAW15)が11月13日から15日の日程で開催されている。開催側のサイトはこちら。 クローズドなワークショップで、提示問題の発表者のみが参加できる形式である。今年の問題は3題あり…

n次元球の立体角〜確率密度

多変量が作る多次元空間において確率密度を考えるとき、データは多変量の非直交基底によって位置づけられる。多次元球の点の広がりは、球の立体角で捉えることが可能で、立体角は多次元空間中のベクトルの内積・外積(等)によって算出される。また、立体角は…

支配集合

グラフG=(V,E)がある。今、Vの部分集合Wを考える。Vの要素のすべてがWの要素であるか、もしくは、Wの要素のどれかひとつに隣接しているとき、WをGの支配集合と言う。 グラフGの頂点の数をnとする。n個の頂点の次数(接続する辺の数)の最小数(Gの最低次数)をp …

Rで描図・グラフ

R

こんなページ

0から無限大の有理数

まだ、どう使うかわからないけれど、離散空間での、データ細分化、縮尺付き場合わけ、とかには、ファレイ数列、および、その関連図であるStern-Brocot treeがある・・・。 ファレイ数列の再帰的性質とそのアルゴリズムについては、 アルゴリズム・サイエンス…

構造化集団でのオッズ比

ケース・コントロール標本が、M個の均質亜集団から、非均等にサンプリングされたとする。 それぞれの亜集団のコントロール集団におけるリスクアレルの頻度をとする。 それぞれの亜集団のケース集団におけるリスクアレル頻度をとする。リスクアレルが第i番目…

単体 Simplex

単体は、パスカルの3角形の先にあるような存在で、組み合わせについて考えるときの道具として有用。 Wikiのこちらのページや、こちらのページなど。

指数関数族、十分統計量

共役事前分布なるものが存在し、それによって、事前確率→事後確率→事前確率→事後確率→・・・というプロセスを単純に取り扱うことができることを示した。この事前確率・事後確率はベイズの考え方であるが、このベイズの考え方が、ベータ関数・ディリクレ関数…

多項分布、ディリクレ分布への拡張

多項分布は2項分布を一般化したものである。ディリクレ分布はベータ分布を一般化したものである。2項分布とベータ分布の関係は、多項分布とディリクレ分布にもあてはまる。 多項分布 N回の独立事象により、なる確率分布にて、なる観測度数が得られる確率は…

二項分布とベータ分布

Rでやれば 確率pで起きる事象をn=a+b回実施して、a回起きる確率は dbinom(a,n,p) #もしくは choose(n,a)*p^a*(1-p)^b 他方、n回試行して、a回成功したときの、成功確率をpとみなしたときの尤度は dbeta(p,a+1,b+1)/(n+1) であって、等しい 尤度なので、の範…

2項分布とベータ分布、生起確率と尤度

2項分布 Aかaかのどちらか片方が確率P(A)、P(a)(;P(A)+P(a)=1)で起きるとする。このような事象がN回、独立に起きるときに、Aがn(A)回、aがN(a)回(;N(A)+N(a)=N)、起きる確率(;2項確率)は次の式で与えられる を満たしている。 AがN(A)回おきるので、同様…