Statistical Methods in Bioinformatics

  • こちら
  • そのAppendixの構成がいい
  • 英単語の復習の意味も込めて
  • Appendix B Mathematical Formulae and Results
    • B.1 Numbers and Intervals (数と区間)
      • Real numbers 実数
      • Integers 整数
        • Positive integers, Natural numbers 自然数
        • Non-negative integers 非負整数(0,1,2,...)
      • Rational numbers 有理数とIrrational numbers 無理数
      • Open intervals (a,b); a< x < b区間
      • Closed intervals [a,b]; a \le x \le b区間
      • Half-open intervals (a,b]; a < x \le b,[a,b); a \le x < b 2つの半開区間
    • B.2 Sets and Set Notation 集合と集合の記法
      • n-dimensional space,n次元空間
      • tuple (double, triple, ..., n-tuple) (x_1,x_2,...,x_n) タプル(値の組)
      •  s \in S 集合Sの要素s
      • Union S_1 \cup S_2 和集合/結び
      • Intersection S_1 \cap S_2 積集合/交わり
      • Subset S_1 \subset S 部分集合
      • Cartesian product S_1 \times S_2 デカルト積/直積
    • B.3 Factorials 階乗
      • n! = n(n-1)(n-2)\dots 3 2 1
      • 0! = 1
    • B.4 Binomial Coefficients 二項係数
      • \begin{pmatrix} r\\k\end{pmatrix} =\frac{r!}{k!(r-k)!}
    • B.5 The Binomial Theorem 二項定理
      • (a+b)^n = \sum_{k=0}^n \begin{pmatrix}n\\k\end{pmatrix} a^k b^{n-k}
        • 特に(x+1)^n = \sum_{k=0}^n \begin{pmatrix}n\\k\end{pmatrix} x^k
    • B.6 Permutations and Combinations 順列と組合せ
      • _n P_k = \frac{n!}{(n-k)!}
      • _n C_k = \begin{pmatrix} n \\ k \end{pmatrix} = \frac{_n P_k}{k!}=\frac{n!}{k!(n-k)!}
    • B.7 Limits 極限
      • Discrete and continuous limits 離散的/連続的極限
      • Sequence a_1,a_2,...,a_n,..., \lim_{n \to \infty} a_n (離散的)数列とその極限
      • \lim_{n\to \infty} (1+\frac{t}{n}) = e^tは例
      • \lim_{x \to 0+} x \log x 右から0への極限
    • B.8 Asymptotics 漸近解析
      • (1a) f = \mathcal{O}(g) at \infty if there are constants C, K \ge 0 such that \frac{f(t)}{g(t)} \le C for all t>K "f is big oh of g as t approaches \infty"
      • (1b) f = \mathcal{O}(g) at a, a<\infty if there are constants C, h \ge 0 such that \frac{f(t)}{g(t)} \le C for all [tex:|t-a|
      • (2) f=\mathcal{o}(g) at a if \lim_{t\to a} \frac{f(t)}{g(t)} =0 "f is little oh of g as t approaches a"
      • (3) f\sim g at a if \lim_{t\to a} \frac{f(t)}{g(t)}=1 "f is asymptotic to g as t approaches a"
      • (4) f \Omega g at a if f=\mathcal{O}(g) and g=\mathcal{O} (f) at a "f is omega of g as t approaches a"
      • (5) f \approx g at a if \lim_{t \to a} (f(t)-g(t)) = 0
      • 漸近的に「多項式関数」なのか「対数関数」なのか「指数関数」なのかが大事
    • B.9 Stirling's Approximation スターリングの近似
      • n! \sim \sqrt{2\pi} n^{n+\frac{1}{2}}e^{-n}
      • \begin{pmatrix} n\\k\end{pmatrix} \sim \frac{1}{\sqrt{2\pi}} \frac{\sqrt{n}}{\sqrt{k(n-k)}} (\frac{k}{n})^{-k} (1-\frac{k}{n})^{-(n-k)}
    • B.10 Entropy as Information エントロピーという情報
      • ○か×かの質問によって、絞り込むことを考えると、たくさんの可能性があるときには、可能性の場合の数を2を底とする対数で表した値が、必要な絞り込み回数に相当する
      • このように底を2とした値には情報的な意味がある
    • B.11 Infinite Series 無限級数
      • \sum_{k=m}^{\infty} a_kが converge 収束するならば、\lim_{k\to \infty} a_k=0
      • diverge 発散する
      • \lim_{n\to \infty} (\sum_{k=1}^n \frac{1}{k}-\log n)オイラー定数\gammaに収束する。極値分布に登場する
      • \sum_{k=1}^n \frac{1}{k} \approx \log n + \gamma
      • Harmonic series \sum_{k=1}^{\infty} \frac{1}{k^p} 調和級数。pが偶数の場合には、調和級数の和には\piが登場する
      • Geometric series \sum_{k=m}^{\infty} r^k=\frac{r^m}{1-r} 幾何級数/等比級数
    • B.12 Taylor Series テイラー級数
      • Analytic functions は無限回微分可能
      • f(x)=\sum_{k=0}^{\infty} \frac{f^{(k)}(0)}{k!}x^k
        • f^{'}(x)=\sum_{k=1}^{\infty} \frac{f^{(k)}(0)}{k!}kx^{k-1}=\sum_{k=1}^{\infty} \frac{f^{(k)}(0)}{(k-1)!}x^{k-1}
      • e^x = \sum_{k=0}^{\infty} \frac{x^k}{k!}
        • e^x = \cong 1+x またはe^x \cong 1 + x + \frac{1}{2}x^2
      • \log(1+x)=\sum_{k=1}^{\infty} (-1)^{k+1} \frac{x^k}{k}
      • (1+x)^{\alpha} = \sum_{k=0}^{\infty}\begin{pmatrix} \alpha\\k \end{pmatrix} x^k
      • f(x)=\sum_{k=0}^{\infty}\frac{f^{(k)}(a)}{k!}(x-a)^k
    • B.13 Uniqueness of Taylor Series テイラー級数の一意性
    • B.14 Laurent Series ローラン級数
      • テイラー級数を一般化したもの
      • \sum_{k=-\infty}^{\infty} a_k (x-b)^k
        • \sum_{k=-\infty}^{\infty} a_k x^k
    • B.15 Numerical Solutions of Equations 方程式の数値解法
      • x_1 \cong a-\frac{f(a)}[f^{'}(a)}
    • B.16 Statistical Differentials 統計量の差分(?)
    • B.17 Gamma Function ガンマ関数
    • B.18 Proof by Induction 帰納法による証明
    • B.19 Linear Algebra and Matrices 線形代数と行列
  • Appendix C Computational Aspects of the Binomial and Generalized Geometric Distribution Functions
  • Appendix D BLAST: Sum of Normalized Scores

Likelihood, Bayesian, and MCMC Methods in Quantitative Genetics

Likelihood, Bayesian, and MCMC Methods in Quantitative Genetics (Statistics for Biology and Health)

Likelihood, Bayesian, and MCMC Methods in Quantitative Genetics (Statistics for Biology and Health)

  • 厚めの本だけれど、ベイズ、事前・事後確率、それを使うための基礎とそれを使ったもろもろについて参照しやすそう
  • I Review of Probability and Distribution Theory
    • 1 Probability and Random Variables
    • 2 Functions of Random Variables
  • II Methods of Inference
    • 3 An Introduction to Likelihood Inference
    • 4 Further Topics in Likelihood Inference
    • 5 An Introduction to Bayesian Inference
    • 6 Bayesian Analysis of Linear Models
    • 7 The Prior Distribution and Bayesian Analysis
    • 8 Bayesian Assessment of Hypotheses and Models
    • 9 Approximate Inference Via the EM Algorithm
  • III Markov Chain Monte Carlo Methods
    • 10 An Overview of Discrete Markov Chains
    • 11 Markov Chain Monte Carlo
    • 12 Implementation and Analysis of MCMC Samples
  • IV Applications in Quantitative Genetics
    • 13 Gaussian and Thick-Tailed Linear Models
    • 14 Threshold Models for Categorical Responses
    • 15 Bayesian Analysis of Longitudinal Data
    • 16 Segregation and Quantitative Trait Loci Analysis

Mathematical and Statistical Methods for Genetic Analysis

Mathematical and Statistical Methods for Genetic Analysis (Statistics for Biology and Health)

Mathematical and Statistical Methods for Genetic Analysis (Statistics for Biology and Health)

  • 少し古いけれど、章立てが良いと思う。基本事項を押さえてあって、これがわかればたいていのことへの応用が可能と思う
  • 1 Basic Principles of Population Genetics
  • 2 Counting Methods and the EM Algorithm
  • 3 Newton's Method and Scoring
  • 4 Hypothesis Testing and Categorical Data
  • 5 Genetic Identity Coefficients
  • 6 Applications of Identiy Coefficients
  • 7 Computation of Mendelian Likelihoods
  • 8 The Polygenic Model
  • 9 Descent Graph Methods
  • 10 Molecular Phylogeny
  • 11 Radiation Hybrid Mapping
  • 12 Models of Recombination
  • 13 Sequence Analysis
  • 14 Poisson Approximation
  • 15 Diffusion Processes

ぱらぱらめくる『Nonuniform Sampling: Theory and Practice (Information Technology: Transmission, Processing, and Storage)』

Nonuniform Sampling: Theory and Practice (Information Technology: Transmission, Processing and Storage)

Nonuniform Sampling: Theory and Practice (Information Technology: Transmission, Processing and Storage)

  • ひとまず目次を眺めてみる
  • 目次
    • 1. イントロダクション
    • 2. Sampling analysis へのイントロダクション
    • 3. ラグランジュ補間サンプリング定理
    • 4. 不均一サンプリングに関するバラバラなトピックス
    • 5. 1次元 Band-limited シグナルにおける、Missing samples のIterative回復、Non-iterative回復
    • 6. Band-limited Images の不均一サンプリングにおける、数値と理論に関すること
    • 7. 不均一離散フーリエ変換
    • 8. ランダムな時刻にサンプルされた定常過程の再構成
    • 9. ランダムな過程のゼロ交差と推測・検出への応用
    • 10. 不規則にサンプリングされたMRIのk-Spaceデータの再構成
    • 11. Exploration Seismology(探査地震学)における不規則かつ疎なサンプリング
    • 12. Randomized Digital 最適制御
    • 13. 過去のサンプルから、Band-limited シグナルを予測することと音声符号化への応用
    • 14. Frames、不規則サンプリング、Wavelet(小さな波)の聴覚モデル
    • 15. ビデオ圧縮のためのmotion compensated prediction(動作補正予測)に不規則サンプリングを応用すること
    • 16. 不規則サンプリングの非線形変調への応用、A/D, D/A テクニック
    • 17. Error correction codesへの応用
    • 18. 不均一サンプリングのエラー隠蔽への応用
    • 19. アレイ処理における疎なサンプリング
    • 20. Fractional(整数ではなく分数の)遅延フィルター、その設計と応用

疎なデータ・不均等サンプリング:時系列解析のメモ

Nonuniform Sampling: Theory and Practice (Information Technology: Transmission, Processing and Storage)

Nonuniform Sampling: Theory and Practice (Information Technology: Transmission, Processing and Storage)

品種改良の世界史

品種改良の世界史・作物編

品種改良の世界史・作物編

品種改良の世界史 家畜編

品種改良の世界史 家畜編

『統計は難しい』

  • データがあったときに、そこに何を見るか。この点に関して複数の人の間で共有しようというのが、データの解釈・データマイニング
  • それを『統計』と言うことも。
  • 『統計は難しい』と言うとき、2つの難しさがあるのかもしれない。
    • (1)データがあって、それを読み取ることが、そもそも、難しい。誰にとっても難しい
    • (2)データがあって、それを読み取るにあたって、読み取り方を他人と共有するこつがわからないから難しい
  • (1)は仕方がない
  • (2)は、「自分と他人は違うもの」と割り切って、「共有できるのはどこか」という視点で考えるとよいのではないだろうか。「統計によってサポートされる学問(たとえば医学・生物学)」は、その内容について一定程度の理解がある人が「つるんで」行うこと。そこでは「言わなくても通じる」ことも多い。「大学院や学会など、均質な構成員での人付き合い」。他方、「サポートする側である、統計」は対象についての理解を前提としないながらも、何かしらについて、コンセンサスを得る『作法』のようなものか。「いろんな人がいる小学校の学級会でコンセンサスを得るために司会をする」ような感じ??臨床医学基礎医学との間の知恵の共有のむずかしさは、「臨床医学が、『多様度の高い』、社会というものに直結した学問」だからか?
  • このあたりの、「ほかの人」はどう考えるか、「ほかの人と共有するため」にはどうするのがコツか、というあたりに関する本をいくつか

推測統計 はじめの一歩―部分から全体像をいかに求めるか? (ブルーバックス)

推測統計 はじめの一歩―部分から全体像をいかに求めるか? (ブルーバックス)

    • この本は絶版らしい

統計学を拓いた異才たち―経験則から科学へ進展した一世紀

統計学を拓いた異才たち―経験則から科学へ進展した一世紀

入門 実験計画法

入門 実験計画法