2013-08-01から1ヶ月間の記事一覧

信頼区間

正規分布のパラメタを推定する

ベルヌーイ乱数から平均と分散を推定することと、ベルヌーイ乱数からベルヌーイ分布のパラメタを(最尤)推定することが違っていたので 正規乱数の場合にはどうなるかを見てみる 正規分布は2変数分布なので、標本から母分布の平均と分散とを推定してやれば、…

ベルヌーイ分布のパラメタを推定する

前の記事で二項乱数から平均と分散を推定する話を書いた たとえば、ある生起確率pでn=20のサンプリングをしたとすれば p <- pi/4 n <- 20 X <- sample(0:1,n,replace=TRUE,prob=c(1-p,p)) mean(X) var(X) sum((X-mean(X))^2)/n > mean(X) [1] 0.8 > var(X) […

ベルヌーイ分布の分散を推定する

前の記事では母分布が正規分布だった 母分布がベルヌーイ分布のときはどうなるだろうか ベルヌーイ分布の場合には、n数の影響が離散的に大きく効くので、n数を変化させながら、母分布の分散とのずれの平均値・分散、母分布の分散に近いのは2方法(標本分散と…

(正規分布の)分散を推定する

母分布が平均m、分散s^2の正規分布であるとき、そこからのランダムサンプルn個を取り、母分布のパラメタを推定する m <- pi s2 <- exp(1) n <- 20 n.trial <- 10000 sample.mean <- sample.var <- sample.ub.var <- rep(0,n.trial) for(i in 1:n.trial){ X <…

ペアの数

分散はばらつき:をペア数で割ったもの(の半分の値)が知りたい 有限個の要素のときペア数はなので… X <- c(rnorm(10),runif(10)) var(X) sum((outer(X,X,"-"))^2) sum((outer(X,X,"-"))^2)/(n*(n-1))/2

分散の推定

1次元射影としての試験

昨日の続き こちらで一問あたりの得点が異なる問題の合算で合格が決まるという試験の対策の話をしている 禁忌選択肢を有する問題などもあるという 試験理論とかマルチプルチョイス理論のようなものがあるかと思ったら、あまりこれと言ったものがない。想像し…

効率的に勉強する

こちらで一問あたりの得点が異なる問題の合算で合格が決まるという試験の対策の話をしている 努力には頭打ちがあるので、どうするのがよいか…と対策を立てる この対策はあくまでも「効率的」対策であって、「勉強」は効率では測れないので、すべてをわかるつ…

努力の頭打ち

量子もつれ

量子もつれに関する新聞記事がありました 量子コンピュータの実現への話題として取り上げられていました 量子生物学というのもあります 量子もつれが影響している生物現象に関する学問です 情報リンク Wiki(日)量子生物学 Natureの量子生物学紹介記事とBBCの…

指数型分布族その2

こちらで指数型分布族について勉強している 確率分布関数・尤度関数の対数をとったものを と書くとした これをさらに縮めて(ただの書き換え) ただし,としてある ともできるだろう これがどうした、というところがわからないけれど、たとえば、がともに1変数…

指数型分布族その2

指数型表現の利点の確認(4)Kullback-Leibler divergence

KL divergence は この式も指数型表現で扱うとハンドリングが楽であり、この差を残差と捉えて残差の最小化などの扱いが楽になる

指数型表現の利点の確認(6)情報幾何

情報幾何では分布をパラメタを使って空間の点に対応づける そしてその空間にどういう座標系を置くかがパラメタセットの取り方になる また情報幾何では、「計量」と「接続」の2つが大事 (ちょっと怪しいのだが)フィッシャー情報行列は「計量」であるので、そ…

指数型表現の利点の確認(5)尤度関数、スコア関数と最尤推定とフィッシャー情報行列

ある事象が何件起きて・・・という観察データに関して尤度関数が指数型分布族で表される 一般に、確率密度分布がと表されている時、ある観察のもとでのの尤度であって、形が変わらない(気にするのは、どちらを動かすか、だけ) 一般に、指数型分布族の場合の…

指数型表現の利点の確認(3)の2次微分と分散共分散行列/Hessianと半正定置と凸関数

上の例では、を単変数っぽく扱っていたが、多変数の場合も であるし は分散共分散行列の成分になる この2次の微分が作る行列はHessianだが、それが半正定値なので、は凸関数となる

指数型表現の利点の確認(1)指数分布族の掛け合わせは指数分布族

掛け合わせが指数分布族の関数の形の変化だけで処理できることはハンドリングを楽にする 以下、その確認 の同時分布は ここで次のようにする とタンデムにつなぐ とタンデムにつなぐ ならば、をタンデムにつながずに

指数型分布族

イントロ 式を確認 正規分布を例に 指数型分布族の便利な点(1)指数分布族の掛け合わせは指数分布族 指数型分布族の便利な点(2)とモーメント 指数型分布族の便利な点(3)の2次微分と分散共分散行列/Hessianと半正定値と凸関数のこと 指数型分布族の…

指数型表現の利点の確認(2)とモーメント

とモーメントの関係 がの期待値であることを以下に示す はと表されることからもわかるように(確率分布の台全体の積分が1であることより) であるから という関係にある とおいて微分してやると… となって、さらに、分母分子にの関数ではないをかけてもよいか…

正規分布を例に取る〜指数型分布族

実例で確認する 変数・式を正規分布について確認する(このページの表の"normal distribution"...(known varianceではない方)を参照 確率変数は1変数 『パラメタ』での関数表現(見慣れた式) パラメタと自然パラメタの関係 逆の関係 なんとすら入っていないた…

式を確かめる:指数型分布族

一般式 表記の説明 関数に用いる変数があっちこっちで違うのでページ横断的に式を追いかけるのが大変→Wikiのページのそれで行く(こちら) 何を使うか 確率変数は1変数かもしれないし多変数かもしれない パラメタのセットを2組(『パラメタ(のセット)』と『自…

指数型分布族のイントロ

指数型分布族のイントロ 確率変数の中には、分布をある形式で表せるものが多数あって、そのような形式を「指数型」と呼び、そのような形式で表される一群を「指数型分布族」と言う 指数型で表すことのメリットには次のようなものがある さまざまな分布を同じ…

指数型表現の利点の確認(7)共役事前分布

は観察したり推定したりする確率変数 は確率分布のパラメタ 確率と尤度を行ったり来たりするときに便利なのが共役事前分布 指数型分布族表現を使うと、これを簡単に理解できる 確率の式を確認する 共役事前分布うんぬん、では尤度も必要で、それは、を問題に…

RでFDR

FDR R

こちらでENCODEプロジェクトの駆け足読み記事を書いている そのThread 02 でFDRという用語が出てくる たくさんの検定をやるシチュエーション 「ほぼすべての検定が帰無仮説に従っている」とみなすなら、ボンフェロニとかFWER的なマルチプルテスティング補正…

Appendix B Data Sets and Programs ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

著者のページ

Appendix A Exponential Families ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

この文書の数ページはかいつまんで書いてあるのだけれど、かいつまみ過ぎてついていきにくかったので、この文書の流れではなく再整理→こちら

Chapter 11 Prediction and Effect Size Estimation ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

帰無:対立の比率だけが数字でるだけではやはり足りない どのくらいの強さの因子なの?という話 それを個別に評価するのでなく、全体を使って個別のEffect sizeを。

Chapter 10 Combination, Relevance, and Comparability ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

解析構造が複雑になってきて、階層的にテストしたり…Permutationなどが強い世界 10.1 The Multi-Class Model 10.2 Small Subclasses and Enrichment 10.3 Relevance 10.4 Are Separate Analyses Legitimate? 10.5 Comparability

Chapter 9 Sets of Cases (Enrichment) ぱらぱらめくる『Large-Scale Simultaneous Inference (講義@Stanford)』

遺伝子を束ねてパスウェイ解析 9.1 Randomization and Permutation 9.2 Efficient Choice of a Scoring Function 9.3 A Correlation Model 9.4 Local Averaging