統計学

モーメント

Wikipediaの記事はこちら 平均は、データ列の0を中心とした1次のモーメント 分散は、データ列の平均を中心とした2次のモーメント(2次のcentral moment) 3次のモーメントは歪度、尖度などに対応 平均を中心にしたn次モーメントは、さらに標準偏差のn乗で…

自由度の幾何学表現

今、n個のカテゴリからなる変数Nがある。m個のカテゴリからなる変数Mもある。この2変数N,Mについて、NxM分割表を作成してすべてのカテゴリが独立であることの検定は、(n-1)x(m-1)であることは、よく知られていることであるが、それは幾何学的にはどういうこ…

Permutationテスト

統計学の2つの作業 集計 推定・検定 集計がすること 多数のデータの指標を定め、指標を算出する 推定・検定 多数のデータから母集団の指標の確からしさをP値で表現すること(もしくは、集団の比較の場合には、母集団指標間の違いの確からしさをP値で表現する…

EMの加速

連鎖解析の構成家系が複数あり、家系ごとにローカスが異なるとき、全家系の原因ローカスの伝達を説明しようとすると、検出が難しくなる(Heterogeneity)。そんなとき、解析複数家系をsubsetに分ける工夫がある たとえばこの記事とかこちらとか プログラムは F…

超幾何分布確率の計算とそれを2項分布で近似すること

超幾何分布 母集団の個体数が 母集団の個体は特性Aの有無で2種類に分けられ、その数はとである 特性Aを有する比率 今、標本をサンプリングし、そのうち、が特性を有し、それ以外が有していないとする( このような標本を得る確率は、超幾何分布になり、次の…

第12限 モデルへのあてはめ 遺伝統計学のための統計学基礎

第11限 検定4 分散分析(推定統計) 遺伝統計学のための統計学基礎

第10限 検定3 平均値の差の検定(推定統計) 遺伝統計学のための統計学基礎

第9限 検定2 モデルと尤度・尤度比検定(推定統計) 遺伝統計学のための統計学基礎

モデルには、変数がある 比較するモデルでそれぞれ用いる相互に独立に変化する(できる)変数の数がそれぞれの仮説の自由度であり、2仮説の変数の数の差が、尤度比検定の自由度である モデルの変数に応じて、観測データの生起確率が計算できるものとする 今、…

第8限 検定1 分割表検定(推定統計) 遺伝統計学のための統計学基礎

Fisher's exact test(2x2分割表用)とそのNxM表への拡張について中心に述べる 分割表とは こんなもの 2行2列で、各行・各列の値の和と、全セルの総和も記載されている。N行M列の場合はNxM分割表と言う 分割表の検定 各行、各列が独立かどうかの検定と、…

第7限 信頼区間と検定(推定統計) 遺伝統計学のための統計学基礎

推定には「絶対正しい」ということはありえない。したがって、推定の結果を示すときには、次の2つの言い方をする。前者が検定。後者が信頼区間 「推定しようとしているものの真の値が○でないと推定されるが、その確からしさは×%である」 「推定しようとし…

第6限 確率・確率密度・尤度・ベイズの定理(推定統計) 遺伝統計学のための統計学基礎

Probability(確率) 何かを観測する場合を想定している 観測するとき、標本とその観測値とが得られる 観測値が離散的(サイコロの目が、1,2,3,4,5,6の6通りであるような場合)な場合には、それぞれの観測値(目の数)について、その目が出る確率がある(きちんと…

第5限 期待値(推定統計) 遺伝統計学のための統計学基礎

やはり「平均値」は一番知りたいこと 要約統計量の記事(こちら)で、分布を特徴づける統計量にはいろいろあることを示したし、平均値のほかにも、最頻値や中央値といった平均値をりもある意味で「代表値」としてふさわしい統計量があることもわかっている。し…

第4限 分布(記述統計) 遺伝統計学のための統計学基礎

記事はこちら

第3限 要約統計量(代表値)(記述統計) 遺伝統計学のための統計学基礎

データ集合の特徴を抽出して数値として表現するとき、それはデータ集合を代表する値であり、「要約統計量」と呼ばれる。データ集合に算術処理をして得られる 1変数のデータ集合の特徴を表す要約統計量、2変数データ集合間の特徴を現すそれ、多変数(3以上)…

第2限 記述統計と推定統計 遺伝統計学のための統計学基礎

記述統計と推定統計 記述統計 記述統計は、ばらつきのあるデータ集合があるときに、そのデータすべてを認識することが(普通の)人には無理なので、そのデータがどのようなものかを、認識可能な抽出情報エッセンスに要約することと、その要約情報を認識しやす…

第1限 はじめに 遺伝統計学のための統計学基礎

統計学は、データの集合・ばらつきのあるデータ、から、数値上の特徴や規則性・不規則性を見いだす学問である。統計学では、ばらつきのあるデータを用いて研究し、得られたデータを提示し解釈する手法が開発されている。統計学を特徴づける概念には、分布・…

目次 遺伝統計学のための統計学基礎

全9限 第1限 はじめに(こちら) 第2限 記述統計と推定統計(こちら) 第3限 要約統計量(代表値)(記述統計)(こちら) 第4限 分布(記述統計)(こちら) 第5限 期待値(推定統計)(こちら) 第6限 確率・確率密度・尤度・ベイズの定理(推定統計)(こちら) 第7限 …

要約統計量の算出式

算術平均値 分散 不偏分散 標準偏差(分散・不偏分散の平方根) または Nx x Ny分割表のカイ自乗値 Nx x Ny分割表の期待分布 観測度数を、期待度数をとする 総標本数 カイ自乗値 係数とクラメール係数(V) 、(,(ただし)) クラメール係数、() ピアソンの積率相関…

平均ベクトル(駆け足で読む統計学のための数学入門30講 30)

第30講 平均ベクトルと分散共分散行列 統計学では多変量を扱い、それぞれの期待値やそれらが作る分散・共分散を扱い、それらをベクトル表現・行列表現することが便利である。この章では、統計多変量をベクトルでそれらが作る組み合わせ(「共」)を行列で表す…

重積分(駆け足で読む統計学のための数学入門30講 28 29)

第28講 重積分 第29講 重積分での変数変換 最尤推定における微分の役割が多変数にしたときの偏微分の役割であることを、第25 26 27講で見たが、確率密度関数の面積を求める作業(=積分)が多変数化して重積分となり、面積が体積(3次元の場合。4次元以上の場…

ベクトル微分と条件付き極値問題(駆け足で読む統計学のための数学入門30講 27)

第27講 ベクトル微分と条件付き極値問題 ベクトル微分 偏微分は多変数にて個別に偏微分をし、また高次の偏微分は変数の順列・組み合わせで偏微分をする。その表記は煩雑になるが、多変数をベクトルとして、また、多変数の組み合わせを行列にて表現することで…

偏微分(駆け足で読む統計学のための数学入門30講 25 26)

第25講 偏微分と微分 第26講 テイラーの公式と極値問題 微分は1変数において定義されている。偏微分はその多変数への拡張である。1変数における「意味」を「2次元空間上への関数のプロットとその傾きと面積」とすれば、『n多変数への拡張』とは「n+1次元…

第3部 多変数関数の微積分 最尤法

なお、この記事は、『統計学のための数学入門30講』シリーズ 科学のことばとしての数学 永田 靖 著 朝倉書店を教科書とし、遺伝統計学を学ぶための基礎を確認するためのものです。3日間の記事。全体の目次はこちら

ガンマ関数とベータ関数(駆け足で読む統計学のための数学入門30講 11)

ガンマ関数とベータ関数は、一見、積分記号と指数関数をひねくって結合したように見えるが、特徴的な性質を持ち、しかもその性質ゆえに、統計学の検定に重要なガンマ分布・カイ自乗分布・ベータ分布・F分布と密接に関係している点で、1講をあてるに足る関数…

順列(permutation)と組み合わせ(combination)、階乗、二項分布・多項分布(駆け足で読む統計学のための数学入門30講 3)

第3講 順列・組合せと二項定理・多項定理 順列 組み合わせ 2項分布 とし、××である確率がとするとn個のうちk個が××である確率はと表される。今、xについて0からkまですべてを足し合わせるととなり、これも総和が1の確率分布であり、このような分布を2項…

積分(駆け足で読む統計学のための数学入門30講 8 9 10 12 13)

第8講 不定積分 第9講 定積分 第10講 定積分の計算 第11講 ガンマ関数とベータ関数 第12講 数値積分 第13講 広義積分 積分の公式のてふ表記 確率変数と確率密度関数と積分 確率変数とは、確率的に決まる値をとる変数のことである。確率変数のうち、連続的…

関数の展開(テイラー展開と漸近展開)(駆け足で読む統計学のための数学入門30講 7)

第7講 関数の展開 テイラー展開は無限回数微分可能な関数を用いて、非多項式を多項式に書き換えることである 漸近展開は、複雑な関数を性質のわかっている簡単な関数の有限個の定数倍の和に近似する手法で、テイラー展開できない微分不可能(な領域を含む)関…

と(駆け足で読む統計学のための数学入門30講 2)

第2講 和と積 和(sum)、 等差数列の和 等比数列の和 その無限和、ただし、公比。 幾何分布:成功する確率、失敗する確率のとき、回目に初めて成功する(回続けて失敗する)確率は。今、が0の場合、1の場合、2の場合、・・・の場合を数え上げると、である。…

高校数学の復習(駆け足で読む統計学のための数学入門30講 1)

第1講 基礎事項とア・ラ・カルト 二次方程式の解 の解。 は判別式。二次方程式が実数解を持つか虚数解を持つかを判別する式 そのテキスト表記 [tex:ax^2+bx+c=0] [tex:\Large x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}] [tex:D=b^2-4ac] 平方完成 二次式を「なんと…