ブログをまとめる?

このブログも丸5年を越えました。790日分の記事があるそうです。
隔日より少なめな更新頻度ということですね。
こんな風にまとめようかと・・・

図はこんな感じで・・・

        • -

目次
第I 部遺伝子型から表現型まで15
第1 章遺伝 似ていることと似ていないこと17
1.1 形質が遺伝する. . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.1 遺伝. . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1.2 生物の特徴 形質とフェノタイプ(表現型) . . . . . . . 18
1.1.3 同一性と多様性. . . . . . . . . . . . . . . . . . . . . . 18
1.2 遺伝子. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.1 遺伝子とは. . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.2 染色体. . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.3 遺伝子座 アレル ハプロタイプ ディプロタイプ 
フェノタイプ. . . . . . . . . . . . . . . . . . . . . . . 22
1.2.4 2倍体・ホモ接合・ヘテロ接合・ジェノタイプ・フェノ
タイプ・遺伝形式. . . . . . . . . . . . . . . . . . . . . 24
第2 章DNA・RNA・タンパク質・形質27
2.1 DNA 2重鎖. . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.1.1 複製・変異・組み換え. . . . . . . . . . . . . . . . . . 29
2.1.2 起源が同じIBD . . . . . . . . . . . . . . . . . . . . . . 31
2.1.3 1つの数値で表して扱いやすくする IBD の期待値. . 31
2.1.4 同胞のアレルの一致率. . . . . . . . . . . . . . . . . . 34
2.1.5 変異の消長遺伝的浮動. . . . . . . . . . . . . . . . . . 42
2.2 DNA からRNA・タンパク質へ. . . . . . . . . . . . . . . . . 49
2.2.1 DNA からRNA へ 転写. . . . . . . . . . . . . . . . 49
2.2.2 RNA からタンパク質へ 翻訳. . . . . . . . . . . . . . 50
8
第3 章多様性の諸相53
3.1 核酸・タンパク質の多様性. . . . . . . . . . . . . . . . . . . . 53
3.1.1 DNA 配列の多様性 種の違い 遺伝子多型. . . . . . 53
3.1.2 RNA とタンパク質の多様性. . . . . . . . . . . . . . . 56
3.2 多様性と分散. . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.1 分散の分解 分散・共分散. . . . . . . . . . . . . . . . 57
3.2.2 遺伝率と分散. . . . . . . . . . . . . . . . . . . . . . . 61
3.2.3 ハーディワインバーグ平衡(HWE) と分散. . . . . . . 61
3.2.4 アレル関連・連鎖不平衡と分散. . . . . . . . . . . . . 63
3.3 データの取り扱い方と分散・共分散. . . . . . . . . . . . . . . 65
3.3.1 HWE とアレル関連・連鎖平衡を2列のデータで考える65
3.3.2 遺伝形式(優性・劣性) は第3 の列. . . . . . . . . . . . 67
3.4 たくさんの要因多因子遺伝. . . . . . . . . . . . . . . . . . . 69
第II 部データ・サンプル・サンプルの集まり71
第4 章観察して評価すること73
4.1 データの種類と構成. . . . . . . . . . . . . . . . . . . . . . . 73
4.1.1 遺伝子から見たデータの種類 遺伝子型と表現型 最
終形質と中間形質. . . . . . . . . . . . . . . . . . . . . 73
4.1.2 解析対象としてのデータの種類 データ型. . . . . . . 75
4.1.3 一部に順序があること. . . . . . . . . . . . . . . . . . 79
4.1.4 カテゴリの組み合わせ. . . . . . . . . . . . . . . . . . 80
4.1.5 唯一選択、重複選択. . . . . . . . . . . . . . . . . . . 80
4.1.6 2倍体という特殊性 Hardy-Weinberg 平衡(HWE)
の正確検定. . . . . . . . . . . . . . . . . . . . . . . . 82
4.1.7 親項目と子項目. . . . . . . . . . . . . . . . . . . . . . 84
4.1.8 カテゴリの配置 カテゴリ間の非独立性 正単体. . . 85
4.2 データを比較する. . . . . . . . . . . . . . . . . . . . . . . . . 87
4.2.1 2つのデータの関係 対称的な関係と非対称的な関係. 87
4.2.2 非対称な関係を対称にする 距離. . . . . . . . . . . . 88
4.2.3 ユークリッド距離とそれ以外の距離. . . . . . . . . . . 89
4.2.4 配列の違いとマンハッタン距離. . . . . . . . . . . . . 91
9
4.2.5 距離の代わりに角度で表す 相関係数. . . . . . . . . 92
4.3 複数のサンプル、たくさんの比較. . . . . . . . . . . . . . . . 92
4.3.1 1 対N-1 とN 対N . . . . . . . . . . . . . . . . . . . . 92
4.3.2 一部に関係がないとき 半順序. . . . . . . . . . . . . 93
4.3.3 距離行列と木. . . . . . . . . . . . . . . . . . . . . . . 94
第5 章サンプルを個別に捉える97
5.1 グラフとは. . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.1.1 グラフの定義. . . . . . . . . . . . . . . . . . . . . . . 97
5.2 サンプルを並べる数直線というグラフ. . . . . . . . . . . . . 98
5.3 木というグラフ. . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.1 木とは. . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.3.2 木の形状 トポロジー. . . . . . . . . . . . . . . . . . 100
5.4 木構造でのデータの理解階層的クラスタリング. . . . . . . . 101
5.4.1 進化系統樹. . . . . . . . . . . . . . . . . . . . . . . . 101
5.4.2 階層的クラスタリング. . . . . . . . . . . . . . . . . . 102
5.5 行列データを眺める. . . . . . . . . . . . . . . . . . . . . . . 105
5.5.1 要素を並び替えて眺めるヒートマップ. . . . . . . . . 105
5.5.2 要素を並び替えずに眺める連鎖不平衡係数プロット. . 106
5.5.3 片方の軸に着目両方の軸に着目. . . . . . . . . . . . . 106
5.6 個体の家系図・アレルの系図 同一種の中のグラフ. . . . . . 106
5.6.1 個人の関係のグラフと染色体の関係のグラフ. . . . . . 107
5.6.2 染色体の伝達グラフと組換え. . . . . . . . . . . . . . 112
5.6.3 祖先に遡る コアレセント. . . . . . . . . . . . . . . . 112
5.7 ネットワーク. . . . . . . . . . . . . . . . . . . . . . . . . . . 115
第6 章サンプルを集団として捉える117
6.1 分布として捉える. . . . . . . . . . . . . . . . . . . . . . . . . 117
6.1.1 1次元. . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.1.2 2次元. . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.2 非階層的クラスタリング. . . . . . . . . . . . . . . . . . . . . 120
6.3 集団遺伝学. . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.3.1 不均一と不平衡. . . . . . . . . . . . . . . . . . . . . . 120
10
6.3.2 均一な集団とHardy-Weinberg 平衡(HWE)  均一な
集団の混合. . . . . . . . . . . . . . . . . . . . . . . . 121
6.3.3 時間的な変化. . . . . . . . . . . . . . . . . . . . . . . 122
6.3.4 空間の移動. . . . . . . . . . . . . . . . . . . . . . . . 125
6.4 熱力学・統計力学流体力学. . . . . . . . . . . . . . . . . . . 126
6.4.1 時空間、有限と無限. . . . . . . . . . . . . . . . . . . 126
6.4.2 均一・平衡・定常. . . . . . . . . . . . . . . . . . . . . 127
第III 部サンプルの集まりの特徴づけ131
第7 章尺度・変数・自由度・次元133
7.1 データをかいつまんで伝える. . . . . . . . . . . . . . . . . . . 133
7.1.1 分割表の情報をかいつまんで伝える. . . . . . . . . . . 133
7.1.2 量的データをかいつまむ. . . . . . . . . . . . . . . . . 137
7.2 次元と独立と直交. . . . . . . . . . . . . . . . . . . . . . . . . 141
7.2.1 自由度と次元. . . . . . . . . . . . . . . . . . . . . . . 141
7.2.2 分割表の自由度と線形独立行列. . . . . . . . . . . . . 141
7.2.3 確率的独立と直交. . . . . . . . . . . . . . . . . . . . . 144
7.2.4 線形独立と直交基底. . . . . . . . . . . . . . . . . . . 145
7.2.5 正規直行基底を取り出す固有値分解. . . . . . . . . . 145
7.3 変数の構造と意味. . . . . . . . . . . . . . . . . . . . . . . . . 148
7.3.1 変数の構造. . . . . . . . . . . . . . . . . . . . . . . . 148
7.3.2 意味から選ぶ変数 データ構造で決める変数. . . . . . 150
第8 章統計量・指数・確率・尤度151
8.1 確率分布. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.1.1 分布とは. . . . . . . . . . . . . . . . . . . . . . . . . . 151
8.1.2 離散的な確率分布. . . . . . . . . . . . . . . . . . . . . 152
8.1.3 連続的な場合指数分布. . . . . . . . . . . . . . . . . . 152
8.1.4 指数分布と正規分布との違い. . . . . . . . . . . . . . 154
8.1.5 一様分布・指数分布・正規分布・矩形分布 一般正規分布155
8.1.6 正規分布、カイ分布と次元. . . . . . . . . . . . . . . . 156
8.1.7 カイ分布からカイ自乗分布. . . . . . . . . . . . . . . . 159
11
8.1.8 もっとも観察されそうなカイ自乗値. . . . . . . . . . . 159
第9 章確率と尤度161
9.1 確率. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
9.1.1 尤度. . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
9.1.2 確率の和は1 尤度の和は1 ではない. . . . . . . . . . . 166
9.1.3 尤度の指数化 尤度比と事前確率・事後確率. . . . . . 167
9.2 条件付確率、確率、尤度、非独立. . . . . . . . . . . . . . . . 168
9.2.1 量的な軸での条件付き確率. . . . . . . . . . . . . . . . 169
9.2.2 事前確率『当初の予想』と陽性的中率(PPV) と陰性的
中率(NPV) . . . . . . . . . . . . . . . . . . . . . . . . 170
第10 章連鎖解析に見る尤度と変数175
10.1 尤度を使った形質マッピング連鎖解析. . . . . . . . . . . . . 175
10.2 パラメトリック連鎖解析と尤度. . . . . . . . . . . . . . . . . 175
10.2.1 マーカーの伝達木と原因座位の伝達木. . . . . . . . . 175
10.2.2 マーカーと原因座位の間の組み換え. . . . . . . . . . . 181
10.2.3 隠れマルコフモデルと連鎖解析の尤度計算. . . . . . . 184
10.3 ノンパラメトリック連鎖解析罹患同胞対解析. . . . . . . . . 186
10.3.1 相対危険度を変数とする. . . . . . . . . . . . . . . . . 186
10.3.2 IBD 数ごとに場合分けする. . . . . . . . . . . . . . . 187
第11 章指数(インデックス) とは193
11.1 指数は相対的な値. . . . . . . . . . . . . . . . . . . . . . . . . 193
11.2 不平衡の指数. . . . . . . . . . . . . . . . . . . . . . . . . . . 194
11.2.1 ハーディ・ワインバーグ平衡(HWE) . . . . . . . . . . 194
11.2.2 連鎖不平衡. . . . . . . . . . . . . . . . . . . . . . . . 194
11.2.3 P値 確率変数を指数化する. . . . . . . . . . . . . . 195
第IV 部推定・仮説・棄却・関連・因果197
第12 章推定201
12.1 最尤推定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
12.2 信頼区間. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .202
12
12.3 色々な信頼区間. . . . . . . . . . . . . . . . . . . . . . . . . . 204
12.3.1 ベイズ推定観察していないとき. . . . . . . . . . . . . 206
12.3.2 ベイズ推定事前確率共役事前分布. . . . . . . . . . . 208
12.3.3 多項分布とその共役事前分布ディリクレ分布. . . . . 210
12.3.4 最尤推定ハプロタイプ頻度推定 連鎖不平衡係数推定211
12.4 EM アルゴリズム. . . . . . . . . . . . . . . . . . . . . . . . . 215
第13 章棄却と検定219
13.1 信じるのが難しい仮説を棄却する3 カテゴリの観察. . . . . . 219
13.2 分割表検定. . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
13.2.1 ピアソンの独立性検定カイ自乗検定. . . . . . . . . . 224
13.2.2 帰無仮説と最尤仮説を比較して統計量にする 尤度比
検定. . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
13.3 3つの検定方法の比較正確確率検定 ピアソンの独立性検定
 尤度比検定. . . . . . . . . . . . . . . . . . . . . . . . . . . 226
13.3.1 サンプル数が小さいときと大きいとき. . . . . . . . . 227
13.3.2 検定の対称性. . . . . . . . . . . . . . . . . . . . . . . 228
13.3.3 有限な範囲と無限の広がりの違い. . . . . . . . . . . . 230
13.4 仮説に制約を定めて検定する. . . . . . . . . . . . . . . . . . . 231
13.4.1 一つの分割表にいろいろな検定を適用してみる. . . . . 233
13.4.2 離散的な仮説空間での尤度比の比較. . . . . . . . . . . 236
13.4.3 検定同士の非独立な関係. . . . . . . . . . . . . . . . . 237
13.5 表のサイズを変える. . . . . . . . . . . . . . . . . . . . . . . 238
13.5.1 表形式のデータ. . . . . . . . . . . . . . . . . . . . . . 238
13.5.2 順序のありなしと検定手法. . . . . . . . . . . . . . . . 239
13.5.3 複数の手法の挙動の比較. . . . . . . . . . . . . . . . . 240
第14 章関係と因果247
14.1 原因と結果と時間. . . . . . . . . . . . . . . . . . . . . . . . . 247
14.2 原因としてのジェノタイプ. . . . . . . . . . . . . . . . . . . . 248
14.3 有向グラフ・ベイジアンネットワーク. . . . . . . . . . . . . . 249
13
第V 部大規模なこと255
第15 章数え上げる257
15.1 順列・重複順列・分割表の正確生起確率. . . . . . . . . . . . 257
15.1.1 組み合わせ・重複組み合わせ・2倍体ジェノタイプの
種類数. . . . . . . . . . . . . . . . . . . . . . . . . . . 259
15.2 分割の数スターリング数とベル数. . . . . . . . . . . . . . . . 260
15.3 分割とカテゴリの統合. . . . . . . . . . . . . . . . . . . . . . 263
15.3.1 順序のないカテゴリの場合. . . . . . . . . . . . . . . . 263
15.3.2 順序のあるカテゴリの場合. . . . . . . . . . . . . . . . 263
15.4 木の形の数・グラフの数 木・クラスタリングベイジアン
ネットワーク. . . . . . . . . . . . . . . . . . . . . . . . . . . 265
15.4.1 木のパターンの数. . . . . . . . . . . . . . . . . . . . . 265
15.4.2 クラスタリングのパターンの数. . . . . . . . . . . . . 266
15.4.3 無向グラフの数有向グラフの数非循環有向グラフの数267
第16 章省略する271
16.1 ランダムに抽出する・ランダムに巡回する. . . . . . . . . . . 271
16.1.1 既知の分布からのランダムサンプリング. . . . . . . . 271
16.1.2 サンプルを使ってランダムサンプリングリサンプリン
グとパーミュテーションン. . . . . . . . . . . . . . . . 272
16.1.3 ランダムウォーク. . . . . . . . . . . . . . . . . . . . . 275
16.2 主要な部分のみを使う. . . . . . . . . . . . . . . . . . . . . . 276
16.2.1 近似する. . . . . . . . . . . . . . . . . . . . . . . . . . 276
16.3 意義の大きいほうから選ぶ 小さいほうから捨てる. . . . . . 281
第17 章たくさんの検定283
17.1 多重検定. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283
17.1.1 独立な検定の繰り返し. . . . . . . . . . . . . . . . . . 283
17.1.2 多重検定時のp 値の期待値. . . . . . . . . . . . . . . . 283
17.1.3 一番小さいp 値の補正. . . . . . . . . . . . . . . . . . 284
17.1.4 非独立な検定の繰り返し. . . . . . . . . . . . . . . . . 286
17.1.5 モンテカルロ・パーミュテーションによる多重検定補正286
17.1.6 非独立な検定を繰り返したときの一番小さいp値. . . 287
14
17.2 p 値が均一に分布しないとき. . . . . . . . . . . . . . . . . . . 289
17.2.1 p 値が小さめに出るときジェノミックコントロール法. 289
17.2.2 対立仮説が成り立つとき非心カイ自乗分布. . . . . . . 292
17.2.3 検定のパワー. . . . . . . . . . . . . . . . . . . . . . . 294
17.3 たくさんの結果の分布を活用する. . . . . . . . . . . . . . . . 296
17.3.1 主成分分析を使って補正する. . . . . . . . . . . . . . 296
17.3.2 帰無仮説が必ずしも棄却されるべきではないとき. . . 301
17.4 複数の結果を合わせるメタアナリシス. . . . . . . . . . . . . 305
17.4.1 相互に独立な検定を併せる. . . . . . . . . . . . . . . . 305
17.4.2 2表を単純に足し併せる. . . . . . . . . . . . . . . . . 308
17.4.3 メタアナリシス. . . . . . . . . . . . . . . . . . . . . . 311
第VI 部付録315
第18 章R 317
18.1 Rのインストールと起動と終了. . . . . . . . . . . . . . . . . 317
18.2 R のパッケージを使う. . . . . . . . . . . . . . . . . . . . . . 317
18.3 R のヘルプを出す。関数を使ってみる. . . . . . . . . . . . . . 318
18.3.1 Rのソースを確認する. . . . . . . . . . . . . . . . . . 318
18.4 確率分布関数、疑似乱数列の発生. . . . . . . . . . . . . . . . 321
第19 章数式記号323