2012-07-01から1ヶ月間の記事一覧

ただのメモ

こちらで、球をばらして2つの等しい球を作る話をしている それに関して、今はできないので、少ししたら帰ってくるためのメモ コピーが可能な条件は何? コピーするものと、コピーする空間の次元の関係は? 写して・写す 対称にして分割する 対称性と群論

わかりにくい

こんなコメントを、このブログからできた本にいただいた 関連事項を調べながら、本のRのソースの中身を変えながら、読まれたそうだ 端的に言うと、「わかりにくい」ということだ 「わかった気にはなる」ともコメントされている それが意図だったから、最高の…

EHRの臨床活用

レビュー(Mining electronic health records: towards better research applications and clinical care) EHR-driven genomic researchはこちら EHRに含まれるもの "Administrative data": 病院事務関係のデータ 保険等のシステムと「直結」 "Ancillary clin…

2 Dynamical systems and time series ぱらぱらめくる『DIstance-based analysis of dynamical systems and time series by optimal transport』

Abstract Wasserstein distance を使う、Wasserstein distance はOptimal transportation problemの量的コストである、それを使うと、非線形現象をロバストに解析することができる 2.1 Introduction 時系列解析 線形時系列解析 非線形時系列解析 断続アリ、…

1 General introduction ぱらぱらめくる『DIstance-based analysis of dynamical systems and time series by optimal transport』

1.1 Distance-based analysisを構成するもの 測定とは、測定を実施する空間とは、測定値の間の距離とは(この論文では距離としてWasserstein distanceを使う)、距離情報を(慣れた)空間上の配置として表すこと、ユークリッド空間におきたいということ、(ユーク…

ぱらぱらめくる『Distance-based analysis of dynamical systems and time series by optimal transport』目次

論文はこちら 目次 1 General introduction 2 Dynamical systems and time series Applications 3 Lung diseases 4 Structural brain diseases 5 Deformation morphometry 6 Electrophysiology of the brain Appendices

逆問題

システム生物学の逆問題 特徴 要素が多くて複雑 データが取れる→背景ルールが知りたい→典型的な逆問題 何が課題か 安定した状態・定常な状態でのパラメタ数が妥当な(に少ない)モデルを見つけたい 急変化の質的な仕組みを知りたい 以下、それに関するpdfなど…

ぱらぱらめくる『Inverse Problems in Systems Biology』システム生

非独立な確率変数が2つ

あらすじ 独立な2確率変数がガンマ分布に従っているとき、その和もガンマ分布に従うこと、また、和の分布のパラメタは元の2変数のパラメタから計算できることを書いた また、2つの一様分布に従う確率変数が相互に非独立であるその関係は千差万別であるが…

独立な確率変数が2つ

2つのp値を併せることと統計量の和を取ること 2つのp値があったときに、それを総合的に評価したいことがある やり方はいろいろあるだろうけれども、わかりやすいのは、2つのp値の積をとること なぜならば、珍しさと珍しさとが観察されたとき、両方の観察…

検定p値と検定統計量

帰無仮説が成り立つ仮説検定のp値 一様分布。小さいp値も大きいp値も同じくらい頻繁に得られる、同じくらい珍しく得られる p.null <- runif(10000) hist(p.null) p値の独立・非独立と検定統計量の独立・非独立 2つの検定のp値が独立であるということは、片…

p値を併せることととガンマ分布のこと

7月14日から7月18日までの記事でばらばらに書いたことを順序立てて書き直すことにする 検定p値と検定統計量 帰無仮説が成り立つ仮説検定のp値 p値の独立・非独立と検定統計量の独立・非独立 独立な確率変数が2つ 2つのp値を併せることと統計量の和を取るこ…

独立な確率変数の和の分散

2つの独立な確率変数の和を考えるとき、期待値も和、分散も和(こちら) 2つの独立なガンマ分布の和の期待値と分散を考えよう ガンマ分布の期待値と分散はだから 2つのガンマ分布の和については が成り立つから Rで確かめてみる t1 <- runif(1) * 5 t2 <- r…

指数分布とガンマ分布

昨日からの続き ガンマ分布の2つのパラメタを使うと、パラメタが1の指数分布のそれはと表される こちらにあるように、互いに独立で同一な指数分布に従う確率変数を個合わせるとになるという これは、ガンマ分布の2変数としてが個合わさって、になった、と…

ガンマ分布のパラメタと非独立の程度の関係

こちらとその前の日にとある論文での「2つの非独立統計量の和をガンマ分布でp値化する話」にまつわることをやっている 自由度2の観察空間を考える 2つの自由度1の検定を単位ベクトルで表現する 2つの検定の非独立の程度は、単位ベクトルのなす角で表す…

余弦の二乗の和

という統計量を考える のときには以下のようになる theta <- seq(from=0, to=1,length=100)*2*pi phi <- pi/6 x <- cos(theta+phi)^2 + cos(theta-phi)^2 plot(theta,x) という関係らしい 角度によって、値が増減するから、に応じての値を変えて、同じ値を取…

カイ二乗分布と指数分布の交叉

こちらなどで、2つの相互に非独立な検定を組合すときにガンマ分布を持ち込む話をしている ガンマ分布とカイ二乗分布・指数分布との関係などのメモも残しておくことにする ガンマ分布の確率密度分布 カイ二乗分布の確率密度分布 ただし自由度は これは、,の…

ガンマ分布とカイ二乗分布と指数分布

Fisher's combined probability test

昨日の記事でp値を併せる話しをした というフィッシャーの方法についても書いた そのときというのは、p値(が一様分布であるとして)に対応する自由度2のカイ二乗統計量にしているんだ、ということも書いた それでは、「どうして自由度2」なの?となる 自由…

ケースだけ検査してある

こちらから 状況 ケース・コントロールサンプルがあって、発病SNPに興味がある ケースには、その重症度を表す(かのような)量的検査がある 具体的には、関節リウマチとその自己抗体検査であるACPA、とか 特徴的なのは ケースにはACPAが(ほぼ)もれなく検査さ…

メモ

こちらで、種の諸々の特徴はパレート最適化されているとみなして、フェノタイプの評価を空間配置としてとらえてみよう、という勉強をした パレート最適化(日本語Wiki,英語Wiki) 関連事項としてMulti object optimization ここでもちらりと出てきていました …

Pareto 最適化

Earth Mover's distance

Wasserstein metricは分布の差異を表す指標(Wikiの記事) 1st Mallows and Wasserstein distancesとしてEarth Mover's distance(EMD)がある(Wikiの記事) EMDの計算はRでは、emdistパッケージ EMDはTransportation problem(Wiki記事)を解くことで求められると…

分布を比べる 2

カルバック・ライブラー情報量

2つの分布p,qがある pという分布は、いろいろな観察のそれぞれについて、どれくらいの確率で発生するかを決めている qが観察された それぞれの観察についてpが尤度を決めている 大雑把に言うと、という観察値について、尤度は 対数尤度にすると すべてのに…

バースデイ・パラドクス その後の続き

こちらなどでDNA鑑定にまつわるバースデイ・パラドクスの記事に端を発した話題を書いている 個々の事象の生起確率が等しいときの計算がバースデイ・パラドクスの計算 個々の事象の生起確率が等しくないときに、条件「同じ誕生日のペアがいる・いない」という…

条件を満たす場合のみ

全部でN種類の事象がある そのうちn種類はある条件を見たし、残りのN-n種類はその条件を満たさないという 生起確率をとしてであり、とする 今、N種類の事象を等確率でサンプリングすることができるという その上でサンプリングされた事象の生起確率は計算で…

条件を満たす事象の確率

場合の数

こちらでバースデイ・パラドクスのことを書いた 少し整理すると N日ある 誕生日は1/Nの確率でいずれかである k人いる k人の誕生日の選び方は通りある(重複順列) 個々の順列の生起確率は このうち、同じ誕生日がいないというのは、重複を許さない順列通りある…

DNA鑑定と幾何平均

こちらでDNA鑑定とバースデイ・パラドクスの話を書いた その延長線上で、同時確率の「期待値」を考えたいのだが、「期待値」が算術平均なのに対して、幾何平均なら簡単に計算できるのだが、幾何平均を持って、「代表値」とすることの意義はあるのか、あると…