統計学
統計学を哲学する [ 大塚 淳 ]価格: 3520 円楽天で詳細を見る データを取って、手法を適用して、その結果を使う(検定する、推定する、予測する、論文に根拠として書く)とき、統計学・データサイエンスは、何をしてくれているのだろうか、と言うことを、い…
Wikipedia英語版のテーブル(こちら)の日本語化したものを、Wikipedia砂場で作成 以下のそれは、Wikiフォーマット。砂場に入れれば表にして見られる {| class="wikitable" align="center" style="text-align:center; border:none; background:transparent;" |…
Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Quality Control of High-Throughput Data Statistical Tests, Statistical Significance, Error Controlling Classification/Clustering Unsupervised Learning Supervis…
Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Challenge 1 Multiple-Comparison Issue Challenge 2 High-Dimensional Biological Data Challenge 3 Small-n and Large-p Problem Challenge 4 Noisy High-Throughput Bi…
対象(医科学修士院生1回生) 資料 Statistical Bioinformatics: For Biomedical and Life Science Researchers(の目次) Beyond the hype: Big data concepts, methods, and analytics Big Data Analysis Using Modern Statistical and Machine Learning Meth…
『統計する』っていうのは、結局、データのすべてを見せても仕方がないから、一部を見せるわけだけれど、『どう見せるか』と『見せられたものをどう読むか』に尽きるのだけれど、これを『教える』となると難しい それに関する本をぱらぱらめくってみる The C…
数学セミナー増刊統計学ガイダンス作者: 日本統計学会+数学セミナー編集部出版社/メーカー: 日本評論社発売日: 2014/07/17メディア: 雑誌この商品を含むブログ (1件) を見る 数学セミナーの2014年8月増刊 目次を眺めたり、用語を拾ったりしよう 目次 第1部 …
Youtubeの34回講義の中身を確かめずにタイトルだけを見てみる(日本語は内容を推測して書いたキーワード) YouTube Lecture 1: sample spaces〜起きうる場合を網羅したもの, naive definition of probability, counting, sampling〜数え上げ Lecture 2: Bose-E…
機械が得意な予測と不得意な予測の原則 システムが単純で法則が単純だが、計算量が多い:コンピュータが得意 システム自体がよくわからなくて、データにノイズが多い:コンピュータのうまい使い方がよくわかっていない 不得手な分野に対する取り組み
ベイジアンと頻度主義(フィッシャー) 因果と相関 事前確率 ベイジアンってなんだっけ、そしてその位置@21世紀の入り口 事前確率が0/1でないとき、情報はいつかどこかへ収束させる
指数関数的増加、幅付き予測の幅の広すぎること モデルのパラメタが「予測」のために観測できるものになっていないこと 自己成就預言と自己破壊予言 疫学の基本的問題は「予測を前提としたモデル」ではなく、「因果関係確認を前提としたモデル」であること(…
カオス理論的難しさ 複雑性理論的難しさ データが疎であることからくる難しさ データを集める者、データを解釈する者、データ解釈を受け取る者がすべて当事者であって、中立であり得ないこと、それぞれの者が相互に関係があることからくる難しさ
いつ、どこでのprediction(予測) いつからいつまでに、どれくらいの確率で、のforecast(予想) モデルへの過剰適合 複雑性理論:単純なものが相互に作用するとき、何がどうおきるかに未知・不可解な動きが出る。カオス理論(初期値に敏感だが決定論的)とは違う…
スーパーコンピュータ、行列区分、カオス理論 人間の力(視覚)を活用してはずれ値検出 予測の改善を目指すなら、予測の成否の評価尺度もしっかりと。それに沿って確かに改善している 「よい予測にもいろいろ」 予測にバイアスがないかを確認する術 範囲付きの…
政治評論家も政治学者も「相当、予測が当たっていない」という事実 キツネとハリネズミ ハリネズミ:大きな1つのことを知っている・信じている(マルクスと階級闘争、フロイトと無意識) キツネ:たくさんの小さなことを知っている 予測において、キツネ > …
バブル崩壊とその予見失敗、その後の経済政策のうまくいかなさ 不適切な思い込み、あり得ないことの思い込み リスク予測モデルの不適切さ→「想定外…」 影響の伝わり・広がりは増幅するが、そのことについての想定のなさ ことが起きた後、その影響が経時的に…
John P. A. Ioannidisの命題 Why most published research findings are falseから。 "Corollary 1: The smaller the studies conducted in a scientific field, the less likely the research findings are to be true." スタディが小さければ小さいほど、…
情報の人類史 (文字で)記録すること、書物、手コピー、印刷機、産業革命、インターネット、ビッグデータ 情報の広まりと情報管理・情報操作…情報の不正確さと情報の受けての処理の不正確さ 嘘ばかりを論文にする医学生命科学界(Why most published research …
少し前のベストセラー(?)。「読み物」なので、コンセプトがわかりたい人向け(?)。ただし、「わかったつもり」になることが、この本で言うところの「危険」の根っこであることには要注意(〜わかったと思ったあなた・私が、「本という情報ソース」から、シグ…
「体系立てずに進める」場合、色々、トピックを挙げながら、その関係をつなぎつつ、頭の整理をしていくことになる そうは言っても、「志あり、基礎なし」からだと、相互連携が見えてこないので、挫折しやすい たとえば、こちらで扱っているトピックを、上記…
分類により示された相互関係はすでにある それ以外の相互関係 概念としての相互関係 手法・アルゴリズムとしての相互関係
概念的周辺 数学的周辺 論理・判断的周辺
分類するには尺度が必要 尺度を列挙する 「解りたい何か」はどんなものか 目的に沿って 棄却 推定 他 時間に沿って 未来に関すること 過去に関すること 現在(の確率過程)に関すること 「データ」はどんなものか 観測可能性に沿って 実観測可能なデータ 実観…
定義は定めるものだけれど、応用範囲が広いので、天下り式に定めるのではなく 『わたし・あなた』が「統計学」に求めているもの、それを(すり合わせて)「統計学」の定義としてみる 求めているものは何か 「よりよく解りたい何か」がある 「その何か」を「直…
目次 1. 定義 2. 分類 2.1 亜分類 3. 相互に関係づける 4. 周辺
「統計学」の講義は「これこれができるようになりたいんです」「これができるのが最低ラインです」というのを基準にして構成しがち なぜなら、需要がそこにあるから。「視聴率」を基準にすると、そこしか狙えない。マスコミ的講義構成は、「視聴率」主義 そ…
# 入力ファイルは、各行の第1列に気になる用語、 # 第2列以降、任意の列数で、第1列と関連する用語を記載 # タブ区切り my.knowledge.graph <- function(file,from=NULL,to=NULL,target.date=NULL,target.node=NULL,max.edge=NULL,alpha=1){ library(igra…
自分がやっていること・やりたいことが何なのかは、わかっているようで、わかりにくい わかり易く説明してみようと試みることで見えることがある これまでの試み(この勉強会の位置づけも同じ) 遺伝学における形質のとらえ方 『似ているかどうかの数学』(こち…
統計学分野の教育課程編成上の参照基準というのがあるそうだ 臨床医学なら医学・薬学分野(こちら)が相当するだろう 基礎医学なら・・・と思ったが、「数理科学分野(こちら)」は、「生命基礎科学」向けではなく、かといって、「医学・薬学分野」で実験関係の…
統計遺伝学の基礎と統計遺伝学以外の数理医学生物学への地ならしを数年がかりでやるとしたらどうするだろうか 教科書の選りすぐり。そしてその順序 - 医学科を卒業するときに、数理解析を念頭においた医学生物学を行う素地を作っておくために、計画を立てる…