2014-06-01から1ヶ月間の記事一覧

Statistics 110: Probability

Youtubeの34回講義の中身を確かめずにタイトルだけを見てみる(日本語は内容を推測して書いたキーワード) YouTube Lecture 1: sample spaces〜起きうる場合を網羅したもの, naive definition of probability, counting, sampling〜数え上げ Lecture 2: Bose-E…

ぱらぱらめくる『統計的学習の基礎』

統計的学習の基礎 ―データマイニング・推論・予測―作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman,杉山将,井手剛,神嶌敏弘,栗田多喜夫,前田英作,井尻善久,岩田具治,金森敬文,兼村厚範,烏山昌幸,河原吉伸,木村昭悟,小西嘉典,酒井智弥,鈴木大慈,竹内…

ベータ分布の交叉点

ベータ分布が二つあるとする その累積分布を考える。ベータ分布の累積分布は、regularized incomplete beta 関数 2つのベータ分布の累積分布関数の交点を計算してみる # x1は一つ目のベータ分布を決める、二つの成否回数ベクトル # x2は二つ目のベータ分布…

ベータ分布の交叉点

この先、どうなる?

今、N回の観測をして、○がn1,×がn2回だったとする この後、m回繰り返したら、m回のうち、何回成功するんだろう? まず観測データから、○確率pの確率密度関数をベータ関数で表して、ただし、はベータ関数 今、○確率がpのときにm回のうちk回成功するのはなので…

この先、どうなる?

射影変換と複比保存とで考えること〜トンボ・モグラ・ゾウリムシの統計学とは〜

2次元空間で2変量が常微分方程式で定められた変化を状態空間に作るとき、それを、という写像し、単位時間ごとにその写像の座標を記録をするる、複比が保存されるという 何かしらが保存されているとき、そのようなパターンを繰り返しインプットされると、そ…

即効データシミュレーション実習

Rの初心者だけれど、「もう大人」なので、なんとか使えるようになろうという意識は高い人には、「つまらない」例ではなくて、少々わかりにくくても、「できるといいな」という例がよい こちらのJuly15-の週の" Click to download today's text File " こんな…

即効データシミュレーション実習

Dirichlet diffusion trees

先日の記事の続き 昨日の木はDirichlet diffusion treeの分岐プロセスをグラフオブジェクトに乗せて作る話だった 昨日の記事では、分岐確率を時刻の関数とし、さらに、各エッジで同道している「先行者」の数で重みづけすることを述べたが実装は面倒なので省…

Dirichlet Diffusion Treesその3

Dirichlet diffusion trees

先日の記事の続き 作り方 原点から第一の要素がランダムウォークする。単位時間後とすれば、ランダムウォークするので、平均0、分散がある値(1としてもよいだろう)の点(t=1,x)に到達する 第二以降の要素は、原点から出発し、「分離」イベントが起きるまでは…

Dirichlet Diffusion Treesその2

Dirichlet diffusion trees

資料1 資料2 資料3 資料4 データがあって、このモデルに合うか、あのモデルに合うか、この仮説に合うか、あの仮説に合うか、というのを考えるとき「尤度」「尤度比」を使って、事前確率を事後確率に変える このモデル・あのモデルと考えつつ、MCMCで事前…

Objective comparison of particle tracking methods

Nature Methods 11, 281–289 (2014)『Objective comparison of particle tracking methods』 ライブ・セル・イメージングなどにより、光点の動画解析の必要性が出てきた。そのための色々なソフトなどが開発されてきているが、いろいろなもののパフォーマンス…

重版出来『遺伝統計学の基礎』

このブログの内容を本にした平成22年。ほんの少ししか刷られていなかった(ので初めから稀覯本…)のですが、「重版」の運びとなりました 119箇所にも及ぶ初版の誤りの訂正には、出版社さんが「多いですね」とコメントされていましたが、これも、熱心な読者の方…

たくさんの誤植訂正

「先生ならどうしますか?」というベイズ

医療において選択肢があるとき、「インフォームド」して「さあ、選びなさい」という場面を作ることができる 「途方に暮れるヒト」というのは居る 自分自身も決められずに困ることがある そんなときに「先生、決めて下さい」という展開になることもなくはない…

9 機械との闘い〜ぱらぱらめくる『シグナル&ノイズ』

機械が得意な予測と不得意な予測の原則 システムが単純で法則が単純だが、計算量が多い:コンピュータが得意 システム自体がよくわからなくて、データにノイズが多い:コンピュータのうまい使い方がよくわかっていない 不得手な分野に対する取り組み

8 間違いは減っていく〜ギャンブルとベイズ統計〜ぱらぱらめくる『シグナル&ノイズ』

ベイジアンと頻度主義(フィッシャー) 因果と相関 事前確率 ベイジアンってなんだっけ、そしてその位置@21世紀の入り口 事前確率が0/1でないとき、情報はいつかどこかへ収束させる

7 インフルエンザと予測モデル〜ぱらぱらめくる『シグナル&ノイズ』

指数関数的増加、幅付き予測の幅の広すぎること モデルのパラメタが「予測」のために観測できるものになっていないこと 自己成就預言と自己破壊予言 疫学の基本的問題は「予測を前提としたモデル」ではなく、「因果関係確認を前提としたモデル」であること(…

6 経済予測はなぜ当たらないのか?〜ぱらぱらめくる『シグナル&ノイズ』

カオス理論的難しさ 複雑性理論的難しさ データが疎であることからくる難しさ データを集める者、データを解釈する者、データ解釈を受け取る者がすべて当事者であって、中立であり得ないこと、それぞれの者が相互に関係があることからくる難しさ

5 巨大地震のシグナルを探す〜ぱらぱらめくる『シグナル&ノイズ』

いつ、どこでのprediction(予測) いつからいつまでに、どれくらいの確率で、のforecast(予想) モデルへの過剰適合 複雑性理論:単純なものが相互に作用するとき、何がどうおきるかに未知・不可解な動きが出る。カオス理論(初期値に敏感だが決定論的)とは違う…

4 天気予報〜ぱらぱらめくる『シグナル&ノイズ』

スーパーコンピュータ、行列区分、カオス理論 人間の力(視覚)を活用してはずれ値検出 予測の改善を目指すなら、予測の成否の評価尺度もしっかりと。それに沿って確かに改善している 「よい予測にもいろいろ」 予測にバイアスがないかを確認する術 範囲付きの…

2 キツネとハリネズミ〜ぱらぱらめくる『シグナル&ノイズ』

政治評論家も政治学者も「相当、予測が当たっていない」という事実 キツネとハリネズミ ハリネズミ:大きな1つのことを知っている・信じている(マルクスと階級闘争、フロイトと無意識) キツネ:たくさんの小さなことを知っている 予測において、キツネ > …

1 壊滅的な予測の失敗〜ぱらぱらめくる『シグナル&ノイズ』

バブル崩壊とその予見失敗、その後の経済政策のうまくいかなさ 不適切な思い込み、あり得ないことの思い込み リスク予測モデルの不適切さ→「想定外…」 影響の伝わり・広がりは増幅するが、そのことについての想定のなさ ことが起きた後、その影響が経時的に…

嘘ばかりを論文にする医学生命科学界:番外〜ぱらぱらめくる『シグナル&ノイズ』

John P. A. Ioannidisの命題 Why most published research findings are falseから。 "Corollary 1: The smaller the studies conducted in a scientific field, the less likely the research findings are to be true." スタディが小さければ小さいほど、…

序章〜ぱらぱらめくる『シグナル&ノイズ』

情報の人類史 (文字で)記録すること、書物、手コピー、印刷機、産業革命、インターネット、ビッグデータ 情報の広まりと情報管理・情報操作…情報の不正確さと情報の受けての処理の不正確さ 嘘ばかりを論文にする医学生命科学界(Why most published research …

ぱらぱらめくる『シグナル&ノイズ』

少し前のベストセラー(?)。「読み物」なので、コンセプトがわかりたい人向け(?)。ただし、「わかったつもり」になることが、この本で言うところの「危険」の根っこであることには要注意(〜わかったと思ったあなた・私が、「本という情報ソース」から、シグ…

グラフ的ノート

勉強会のトピックをグラフにして視覚化する話を書いた(こちら) 似たような処理にAssociation rule法がある こちらでは、「親用語」に対して複数の「子用語」を与えるという形で入力を作り、それに基づいてグラフ化したが、Association rule法の方では「親子…