多項分布

疑似1細胞発現データを作る

複数の細胞からのデータがある 細胞数が分かっている リード数を細胞数に分けて、疑似1細胞発現データを作りたい sample()関数を使って疑似作成できることを示し # 検体数 N # ある遺伝子のNGSリード数が Mだった # m1 + ... + mN = M; mi >= 0となるような…

方向分布と球

昨日、方向情報から母分布を、それは方向統計学か、と書いた 多項分布の共役事前分布は正単体(の周と内部)が母分布の台 じゃあ、方向分布のそれは…と考えると、それは球? 球の中心は全方向の一様分布に対応 球の周は、特定方向のみが起こるデルタ関数的分布…

道を選ぶ

今、目の前にn.option本の道がある その道には、それぞれ案内板が立っていて、「この道を進むと、n.type種類の猛獣が必ず1頭出ます。これまでの記録では、虎がa頭、蛇がb頭、蜘蛛がc頭…出ました」という情報が得られる 一方、分岐点に立っている「私」は、…

分布の分布を推定したい

昨日と同じ設定。今日は、各観測点に同じ寄与力を授けたうえで、その寄与力を最大にする1パラメタの最適値推定をする方法でやってみる # 説明変数次元 n.x <- 2 # 被説明変数に影響を及ぼす変数数 n.x.a <- 2 # 被説明変数レベル数 n.y <- 2 Y.level <- 1:n…

分布の分布を推定したい

複数の因子が多項(二項を含む)の生起確率に影響を与えるらしい サンプルについて因子を観察して生起を観察し、それに基づいて、新規サンプルについて因子を測定して、生起を予測したいというような場合 パラメトリックにやるのもありだけれど、高次元化した…

ディリクレ分布とカイ自乗分布とその歪み

総数を固定しなくても… メモ は (スターリングの公式)より であって に注意したり、,に注意したりして変形すると この式の移行関係には、対数尤度比がカイ自乗分布に従うという話がある k <- 5 library(MCMCpack) f <- c(rdirichlet(1,runif(k))) N <- 10000…

メモ

2項分布の連続化:β分布 多項分布の連続化:ディリクレ分布 確率ベクトル、観測度数, 確率 に制約をつけつつ、確率を最大にするようなが知りたいとする Rのoptim()関数で最適化することにする 少し普通ではない変数の置き方をする 長さのベクトルを考える …

検出したいものがマスクされる

見たいアレルがプールされたサンプル中にあるかどうかを調べたい 実験のコールミスがある 標本中の真のアレル別本数がわかっているものとする そこから指定本数を取り出して実験する 取り出された分の真のアレル本数分布が出る それに、さらにコールエラーを…

累積確率密度分布関数の近似

12月11日の記事で、線形近似式が出てきて、その式が、多項展開とその積分の便宜のために、ちょっと複雑になっていた。 また、累積密度関数の近似式を得る作業の途中であり、(0,0),(1,1)を通るような線形近似式を得るためのソースが必要になっている。 準備1…

不均一な集団からのデータ解釈への拡張

ここは部分積分を用いるともっとずっと簡単でした→こちら 12月5日に、均一分布からのN回サンプリングの最小値の期待値についての記事を、12月7日にその拡張である、N回サンプリングのときの第k番目の値の期待値についての記事を書いた。 今日の記事は、不均…