2006-08-01から1ヶ月間の記事一覧

データのハンドリングに困難を感じたら、似た状況に学ぶ

幾何で無限遠を扱うために同次座標が導入された。n次元空間を表すのに無限大を用いたくないがために、導入されたのが同次座標。同次座標では、無限大を用いないで済ませるためにn+1個の変数を用いたn+1次元扱いとすることによって有限な値で無限遠を扱うこと…

射影幾何の図

幾何アプリケーションシンデレラで射影幾何の参考図を描く。リンクはこちら。 ブログに提示している参照図は、3次元空間の3軸(x、y、z)について、原点から3軸すべてについて正の方向にある、8分の1象限についての図である。これを、3軸のそれぞれ…

画像の挿入とレイアウト関係

画像を入れたいときは、こちらを参照 レイアウトはこちらを。

知るために

しばらく(数年)前に、ハプロタイプの01表記をその組み換え履歴を反映するべくアミダくじ様に表示することについて考えた(サイトはこちら)。 今、トポロジー→結び目について考えごとをするにあたって、DNA2重鎖の核内折りたたみと分裂に際しての結び目理論…

知るために

系統樹や配列比較関係で一意な距離関係が与えられないことがある。これは距離位相空間で処理しようとしているためであるようだが、neighboringの定義を変えてやることで、相互に矛盾しない関係に持ち込めるのではないか。そのとき系統樹・配列間関係にはどの…

知るために

解析対象を代数で扱う 解析対象は空間を構成する 空間は幾何学表現できる ユークリッド空間から射影空間へ 双対と述語論理 空間内の曲線・曲面の助変数表現→曲線そのものに属性を変数とすることで、座標のくびきから脱却する いわゆる空間から位相空間へ一般…

知るために、過ぎたるは及ばざるがごとし、お釈迦様のてのひら、恒常性用統計量

ユークリッド2次元空間(平面)の座標を、原点と2つの直行ベクトルを定め、その2ベクトル成分に分けてと表したり、原点を定め、そこからの距離と1軸を定め、と表したりできる。 の場合には、2変数は、を取る の場合には、変数はを取るのに対し、はのよう…

知るために

ときには、何しようとしているのかな、と振り返る。 何かしら、隠れているものを見つけたい なぜ隠れている? だれが隠している? 隠れているものの姿はどれくらい多様か知っている? 隠れているものの姿を知っていなければ、探しようもない? Center for th…

行列

ちょっと計算したい行列式と逆行列 いつもながらありがたい青木先生の電卓シリーズ(行列式、逆行列)。ネットにつながればいつでも計算できる。 こちらはeclipseを用いてJavaサンプルソースを丁寧な注釈とともに公開しているページ。そちらの逆行列用クラスを…

知るために

ときには、何してたのかな、と振り返る。 哲学入門 (ちくま学芸文庫) 作者: バートランドラッセル, Bertrand Russell, 高村夏輝 出版社/メーカー: 筑摩書房 発売日: 2005/03 メディア: 文庫 第1章 現象と実在 第2章 物質は存在するか 第3章 物質の本性 第…

コレスキー分解

先日、FDRに関する記事を書き、そこで、BH法とAdaptive BH法とBY法をシミュレーションで比較する記事を引用した(日記はこちら)。その中に、正規分布に従うデータセットを複数作成し、セット同士が一定の相関を持たせる必要があり、そのメソッドの記載があっ…

False Discovery Rate

多数の仮説検定を行っている。ある棄却水準を与え、多数の仮説のどれが棄却されどれは棄却されないかを判定する方法のひとつ。 基本となる考え方はこう。 具体的に。 100個の仮説を検定しているとする。100個の仮説のそれぞれに、個別仮説検定P値を得る。独…

集合・べき集合・べき集合から作る組み合わせ

要素数k個の集合がある そのべき集合はの要素を持つ。 べき集合の要素であるサブセットは、i=0,...,k個の要素を持つ。i=pなるサブセットの数は通りある 一方、要素数iの集合(サブセット)を、q=2,3,...,i個の更なるサブセットの組に分けるわけ方は、http://d.…

第12章 アプリケーション

著者のホームページ(こちら)

第11章 繰り返し観測の取り扱い

観測データは、系列になっていて、ある値はその系列の前の値(もしくは後の値、前後両方など)の影響を受けた値であるとする。このようなとき、個々の測定系列の増減に着目しないと違いがあるのにみつからないこととなる。たとえば、身長の経時変化など。系列…

第10章 The Berrens-Fisher Permutation Problem

おそらく、このシリーズでは扱わない

第9章 Missing dataの取り扱い

Missing dataとは Missing at random (MAR), Observed at random (OAR), missing completely at random (MCAR) MCARは一番簡単だが、MCARでなくても、観測データの分布の仕方と無関係にMissingしていれば、ignorableなmissing dataといえる Missin dataの対…

第8章 Factorial designs

多変量は組み合わせ項を調べたい 観測がカテゴリカルな群に分かれている。その群間に違いがないことの検定をするにあたり、群を分ける尺度が1つであれば、one-way ANOVA、複数であれば、two-way ANOVA。こちらのサイトを参照 カテゴリ 今、観測ユニット(サ…

第7章 ノンパラメトリック組み合わせ解析の例 7.5 SNP genotypeの場合(Isotonic inference)

7.5 SNP genotypeの場合(Isotonic inference) 特徴 観測ユニットはAA Aa aaという2アレルの複合情報でできていること Aが優位かaが優位かはわからないこと(A aは相互に対等) もしくはが成り立つとみなした解析をすることが多いこと(ヘテロ接合体に突出した…

モーメント

Wikipediaの記事はこちら 平均は、データ列の0を中心とした1次のモーメント 分散は、データ列の平均を中心とした2次のモーメント(2次のcentral moment) 3次のモーメントは歪度、尖度などに対応 平均を中心にしたn次モーメントは、さらに標準偏差のn乗で…

浮動小数点とパーミュテーションテストプログラミング・一致試行

パーミュテーションテストでは、多数回パーミュテーション試行ごとの統計量・確率分布の計算を行い、その値の大小関係を解析の基本とする。特に、パーミュテーションの値空間が離散的で限定的である場合には、パーミュテーション試行ごとに統計量が同一であ…

第7章 ノンパラメトリック組み合わせ解析の例 7.4 Goodness-of-fit 検定

単変量のGoodness-of-fitが4.4で扱われた。この記事 に記載したとおり、そのカテゴリの扱いにより、適当な統計量がいくつかあった。 これを多変量に展開することは、単変量のときに検討した適当な統計量を多変量の枠組みに組み込むこと(だけ)である Goodnes…

第7章 ノンパラメトリック組み合わせ解析の例 7.3 MANOVA with Mixed Data

7.3 MANOVA相当 単変量one-way ANOVAのパーミュテーションテストは4章であつかった。その記事はこちら。そこで確認した統計量を以下の要領でMANOVAのフレームで量的変数にの個別統計量として用い、それを多変量の枠組みで補正のステップに進めばよい。 デー…

第7章 ノンパラメトリック組み合わせ解析の例 7.2 Multivariate paired Observation

7.2 Multivariate paired Observation 2群に属するn個体についてq種類の変数をk時刻に観測する、というようなデータ構造 各時刻において、2群の値に大小の傾向がないことを検定 教科書に記載されている個別時刻のP値が少しずれているように思えるので少々…

第6章 ノンパラメトリック組み合わせ方法

補助記事はこちらとこちら 6.1 イントロダクション q個の変数があって(q-次元)、それについて検定するとき、適当なスカラー統計量を算出し、その値にもとづいての検定が可能。たとえば、カイ自乗値や*1がある。パーミュテーションテストにおいても、このよう…