2013-08-01から1ヶ月間の記事一覧

条件付き確率

bnlearnパッケージはデータから、適切な因果ネットワークをアルゴリズムに基づいて推定するパッケージ(こちら) ベイジアンネットワークを与えて(Directed Acyclic Graphを作り、その各ノードに確率表を与えたもの)、さらにそこにエビデンスを設定し、エビデ…

Fallacyに対峙する

Avoiding Probabilistic Reasoning Fallacies in Legal Practice using Bayesian Networks 抜粋 "Indeed, we believe that for many people – and this includes from our own experience highly intelligent barristers, judges and surgeons, any attempt …

確率利用時の誤謬@法廷

エピローグ 因果関係の芸術と科学 ぱらぱらめくる『統計的因果推論』

第10章 実際の原因 ぱらぱらめくる『統計的因果推論』

第9章 原因の確率:説明と識別 ぱらぱらめくる『統計的因果推論』

因果関係の必要性と十分性 必要性の確率、十分性の確率、必要十分性の確率、無能化の確率、可能化の確率 原因の確率を推定するための条件と条件の違いにより得られる情報の違い

第8章 不完全実験:因果効果の存在範囲と反事実 ぱらぱらめくる『統計的因果推論』

ランダム化していない介入 Intention to treatという考え方も 反事実確率との比較も必要→訴訟・鑑定 ギブス・サンプリングによる反事実確率と因果効果の推定

第7章 構造に基づく反事実の論理 ぱらぱらめくる『統計的因果推論』

「反事実」というのは「仮定法過去『もし●●だったなら』」のようなもの まだ起きていないけれど仮定して、その結果がどうなるかを予測しましょうということ グラフではノードに値を割りつけて、そのノードへの移入エッジをなくすこと 複雑な系について日常的…

第6章 Simpsonのパラドックス、交絡、併合可能性 ぱらぱらめくる『統計的因果推論』

Simpson のパラドクス 男女別に有効性を計算すると男女の両方の群で「有効」となるのに、それらを合算すると、「全体では無効」となるようなデータがある 性別がサンプル数や有効性に影響している。そのように何がしかの影響のあるノードを取り去ったらいか…

第5章 社会科学と経済学における因果関係と構造モデル ぱらぱらめくる『統計的因果推論』

構造方程式モデリング(SEM) グラフを用いた考え方との違い 識別可能性を問題にするかどうかという違い

第4章 行動、計画、直接効果 ぱらぱらめくる『統計的因果推論』

意思(に基づく選択行動)と、結果として起きることの分離 条件付き行動、確率的政策 時間依存性行動、時間依存性交絡因子(time-dependent confounders)を伴う時間依存性治療

第3章 因果ダイアグラムと因果効果の識別可能条件 ぱらぱらめくる『統計的因果推論』

因果関係の仮説を立てる(DAGを作る) データを使って、「その仮説、どうなの?」という問に答える 因果効果の評価は、「こういう介入をしたらどうなる?」という問への答え(予測)も可能にする 逆に言うと、介入の効果は因果関係(のグラフ)が指定されないと測…

第2章 因果関係を推測するための理論 ぱらぱらめくる『統計的因果推論』

大きな枠組み:観察データから因果関係を見出したい、グラフ・ネットワークを用いて機械的計算で見出したい 観測される変数と観測されない変数とがノードとなったモデルを作る 「観察されない変数」をなんでも自由に決めて良ければ、観察を説明するモデルは…

第1章 確率、グラフ、因果モデル入門 ぱらぱらめくる『統計的因果推論』

この章を読むときに:日頃から因果推論ばかりをやっている(臨床医とか)にはとっつきにくい文章かもしれない。「因果モデル」を中心に頭が回っているから。その場合は、「確率・統計」の部分は復習するつもりで読み、「因果」の部分は眼を閉じておいて、先に…

ぱらぱらめくる『統計的因果推論』

統計的因果推論 -モデル・推論・推測-作者: Judea Pearl,黒木学出版社/メーカー: 共立出版発売日: 2009/02/24メディア: 単行本購入: 6人 クリック: 231回この商品を含むブログ (28件) を見る 目次 第1章 確率、グラフ、因果モデル入門 第2章 因果関係を推…

De novo mutations in human genetic disease

De novoの74 SNVsが1個人に CNVs,in/delsは解析精度の問題でまだ不明 遺伝するにはきつすぎるような遺伝子変異性疾患(rare sporadic genetic disease)はde novo変異由来だろうと想像されてきたが、その通りの例が出てきている De novoとモザイクと De novo …

Next-generation sequencing data interpretation: enhancing reproducibility and accessiblity

High-throughput NGS を活用するための課題 プラットフォームの違い、諸ステップの違い Reproduciblityの問題 プロトコールも変化し続けている 大規模データ処理に不慣れな「生物系」という問題 大規模データに不慣れである、というそのこと自体 処理を記載…

Disease-targeted sequencing: a cornerstone in the clinic

コストは下がっているしこれからも下がる 標的遺伝子セットのリシークエンスは臨床レベルでも可能になるだろう 標的ならは解釈もしやすい

Sequencing studies in human genetics: design and interpretation

NGSでは、現状では、探そうとしているものが微細なことと、実験系が大雑把なことと、それを補完するデータ処理戦略がばらついていることから、データの解釈と報告の再現性に問題がある 家系サンプルでないと、「多型」か「レア」か「de novo」かの区別が難し…

Clinical implications of shared genetics and pathogenesis in autoimmune disases

自己免疫として共通なことの遺伝子レベルでの説明 それを実臨床に活かす視点とは?

Genetic disease review (by Illumina)

Pleiotropy in complec traits: challenges and strategies

一つのバリアントが複数のフェノタイプに影響すること 生物学的に本当にPleiotropic フェノタイプ間の因果関係によるもの 偽物 メンデリアン・ランダマイゼーション

Use of next-generation sequencing and other wohle-genome strategirs to dissect neurological disease

いまどきのゲノム解析

夏も終わり 夏休みの宿題(のようなもの)として「自己免疫疾患のゲノム解析の現状」と題するレポートを書かないといけない さて。 キーワードを決めて、少しレビューの検索をしよう ゲノム・エピゲノム・レアバリアント・シングルセル いずれも次世代シークエ…

Rare and functional SIAE variants are not associated with autoimmune disease risk in up to 66,924 individuals of European ancestry

Negligible impact of rare autoimmune-locus coding-region variants on missing heritability

少サンプルでリシークエンスしてそれに基づいて大規模サンプルで疾患関連レアバリアントを探すという戦略は成功していない 絞った25 GWAS risk遺伝子を27982 自己免疫疾患(6疾患)患者 vs. 17019コントロールでレアバリアント探しをした エクソンが標的 (Ill…

マルチプルテスティング:James-Stein推定

こちらから my.JS.estimate <- function(x){ m <- mean(x) A1 <- (length(x)-2)/sum((x-m)^2) y <- (1-A1)*(x-m) +m return(y) } n.iter <- 1000 N <- 1000 A <-pi R.As <- R.Bs <- rep(0,n.iter) for(i in 1:n.iter){ # 変なデータとして、正規分布と指数分…

カーネル密度推定メモ

# [-h,h]の範囲の一様分布をカーネル関数とする my.rect <- function(x,h){ ret <- rep(0,length(x)) ret[which(abs(x)<=1)] <- 1 ret } hs <- c(0.1,0.25,0.5,1) y <- seq(from=-10,to=10,length=1000) x.k <- matrix(0,length(y),length(hs)) for(i in 1:l…

多項式近似メモ

# Function to estimate polynomial coefficients and coordinates estimated # 多項式近似の係数と、推定座標を返す関数 glmPolynomial<-function(y,x,dg,X){# y:dependent values (従属値列),x:descriptive values (説明変数),dg:degrees of polynomials (…

二項

信頼区間というのがある 母分布からデータセットをとって、母分布の平均が知りたいときに、昨日は点推定をしたわけだが、今日は区間推定 確率pで生起するときN回観測して、k回起きたという観測結果を基にpを区間推定する Rのbinomパッケージではそのヘルプ文…