2006-01-01から1ヶ月間の記事一覧

集団遺伝学講義のサイト紹介

アリゾナ大学分子進化学コース(Dr. Bruce Walsh)のウェブサイトにいくつか、R関係のメモあり。尤度・尤度比検定、MCMC、Gibbsなどに関する諸文書へのリンクもあり。 Dr. Bruce Walsh ホームページトップ Biostatistics関係のトップ Rによる確率分布やP値の計…

論文にみる疾患感受性遺伝子解析

今回、参考にした論文は、The SERPINE2 Gene is Associated with Chronic Obstructive Pulmonary Disease by Dawn L. DeMeo et al. Am J Hum Genet 2996; 78:253-264(URL) イントロダクション Common diseaseの1つであるCOPD(慢性閉塞性肺疾患(まんせいへ…

TeX文書作成

てふの記法をはてなで学んだあとは、実際に配布文書をTeXで作ろう。 こんなサイトと自動インストールツールも公開されていた(URL) kakuto3.exe 0.45をダウンロードして実行すると、たくさんの「もろもろ」をインターネット経由でダウンロードして解凍など、…

Structured AssociationとGenomic Control

Structured Association 複数の互いに位置的に関連のない遺伝マーカーにおける観測データを用いて、個人を複数の亜集団に分類する。それぞれの亜集団は階層化がないものとする。亜集団にわけた上で解析をすることで、個々のマーカー・ローカスにおける統計量…

集団階層化

集団から抽出して行うケース・コントロール関連解析は、そのサンプル収集の容易さからCommon diseases関連遺伝子解析の主流となっている。大規模な連鎖不平衡関連解析では、解析遺伝子・ローカスの数が多いことからくる第1種過誤のインフレーションが問題と…

ハプロタイプによるケースコントロール関連解析の手法

ある領域に複数のハプロタイプが存在する。その中から疾患リスクアレルを検出する方法にはいくつかある。Tzeng, JY et al.による最近の論文がイントロダクションで紹介している系譜についてコメントする 個々のハプロタイプについて解析する方法 分割表検定…

第12限 モデルへのあてはめ 遺伝統計学のための統計学基礎

第11限 検定4 分散分析(推定統計) 遺伝統計学のための統計学基礎

第10限 検定3 平均値の差の検定(推定統計) 遺伝統計学のための統計学基礎

第9限 検定2 モデルと尤度・尤度比検定(推定統計) 遺伝統計学のための統計学基礎

モデルには、変数がある 比較するモデルでそれぞれ用いる相互に独立に変化する(できる)変数の数がそれぞれの仮説の自由度であり、2仮説の変数の数の差が、尤度比検定の自由度である モデルの変数に応じて、観測データの生起確率が計算できるものとする 今、…

第8限 検定1 分割表検定(推定統計) 遺伝統計学のための統計学基礎

Fisher's exact test(2x2分割表用)とそのNxM表への拡張について中心に述べる 分割表とは こんなもの 2行2列で、各行・各列の値の和と、全セルの総和も記載されている。N行M列の場合はNxM分割表と言う 分割表の検定 各行、各列が独立かどうかの検定と、…

第7限 信頼区間と検定(推定統計) 遺伝統計学のための統計学基礎

推定には「絶対正しい」ということはありえない。したがって、推定の結果を示すときには、次の2つの言い方をする。前者が検定。後者が信頼区間 「推定しようとしているものの真の値が○でないと推定されるが、その確からしさは×%である」 「推定しようとし…

第6限 確率・確率密度・尤度・ベイズの定理(推定統計) 遺伝統計学のための統計学基礎

Probability(確率) 何かを観測する場合を想定している 観測するとき、標本とその観測値とが得られる 観測値が離散的(サイコロの目が、1,2,3,4,5,6の6通りであるような場合)な場合には、それぞれの観測値(目の数)について、その目が出る確率がある(きちんと…

第5限 期待値(推定統計) 遺伝統計学のための統計学基礎

やはり「平均値」は一番知りたいこと 要約統計量の記事(こちら)で、分布を特徴づける統計量にはいろいろあることを示したし、平均値のほかにも、最頻値や中央値といった平均値をりもある意味で「代表値」としてふさわしい統計量があることもわかっている。し…

第4限 分布(記述統計) 遺伝統計学のための統計学基礎

記事はこちら

第3限 要約統計量(代表値)(記述統計) 遺伝統計学のための統計学基礎

データ集合の特徴を抽出して数値として表現するとき、それはデータ集合を代表する値であり、「要約統計量」と呼ばれる。データ集合に算術処理をして得られる 1変数のデータ集合の特徴を表す要約統計量、2変数データ集合間の特徴を現すそれ、多変数(3以上)…

第2限 記述統計と推定統計 遺伝統計学のための統計学基礎

記述統計と推定統計 記述統計 記述統計は、ばらつきのあるデータ集合があるときに、そのデータすべてを認識することが(普通の)人には無理なので、そのデータがどのようなものかを、認識可能な抽出情報エッセンスに要約することと、その要約情報を認識しやす…

第1限 はじめに 遺伝統計学のための統計学基礎

統計学は、データの集合・ばらつきのあるデータ、から、数値上の特徴や規則性・不規則性を見いだす学問である。統計学では、ばらつきのあるデータを用いて研究し、得られたデータを提示し解釈する手法が開発されている。統計学を特徴づける概念には、分布・…

目次 遺伝統計学のための統計学基礎

全9限 第1限 はじめに(こちら) 第2限 記述統計と推定統計(こちら) 第3限 要約統計量(代表値)(記述統計)(こちら) 第4限 分布(記述統計)(こちら) 第5限 期待値(推定統計)(こちら) 第6限 確率・確率密度・尤度・ベイズの定理(推定統計)(こちら) 第7限 …

要約統計量の算出式

算術平均値 分散 不偏分散 標準偏差(分散・不偏分散の平方根) または Nx x Ny分割表のカイ自乗値 Nx x Ny分割表の期待分布 観測度数を、期待度数をとする 総標本数 カイ自乗値 係数とクラメール係数(V) 、(,(ただし)) クラメール係数、() ピアソンの積率相関…

MutationString出力概要

VGJというグラフ理論用のアプリケーションが組み込まれており、その図として出力される 図はVGJのメニューバーから"File"→"Save"もしくは"Save As"として保存できる。保存したファイルは"File"→"Open"で再度図表示できる VGJによる図(グラフ) 入力ファイルの…

MutationString入手手順

京都大学大学院医学研究科附属ゲノム医学センターのサイトよりjarファイル(実行可能形式ファイル)にてダウンロードします MutationStringアプリケーションのソースは、オープンソースアプリケーション"VGJ(GNU General Public License, Version 2*1 に基づく…

ARG推定手法の現況

Coalescentモデルを用いてハプロタイプARGを推定しそれを形質ローカスマッピングに応用する方法としては、基本的な統計遺伝学的手法を用いたいくつかの報告がなされている。 これらの手法は、ハプロタイプ伝達関係が形成するグラフの形状によって分類可能で…

MutationString実行手順

jarファイルからアプリケーションを起動(ファイルのダブルクリック)する "Menu"ウィンドウ 5つのボタン 第1ボタン"Start MutationString" 実行ボタン 入力ファイルを指定するための"Select a haplotype file"ウィンドウが立ち上がる 第2ボタン"Demonstrat…

MutationString概要

要旨 SNPでできたハプロタイプの親子関係を、中立仮説に基づいた点突然変異のみでParsimony論理によって決定論的に定められる範囲を定め、図示するツール 目次 入手手順(こちら) 実行手順(こちら) 出力概要(こちら) 概説 本アプリケーションの位置づけ Wrigh…

人類の化石を思い出す

ヒトの化石について初めて習ったのは、中学の歴史の教科書だったような気がする。それ以来(四半世紀)、ほとんどまともにアップデートしたことがない まずは、『社会見学遠足』レベルで、今の事情を垣間見ることにする アメリカPublic Broadcasiting Service…