2013-08-01から1ヶ月間の記事一覧
bnlearnパッケージはデータから、適切な因果ネットワークをアルゴリズムに基づいて推定するパッケージ(こちら) ベイジアンネットワークを与えて(Directed Acyclic Graphを作り、その各ノードに確率表を与えたもの)、さらにそこにエビデンスを設定し、エビデ…
Avoiding Probabilistic Reasoning Fallacies in Legal Practice using Bayesian Networks 抜粋 "Indeed, we believe that for many people – and this includes from our own experience highly intelligent barristers, judges and surgeons, any attempt …
因果関係の必要性と十分性 必要性の確率、十分性の確率、必要十分性の確率、無能化の確率、可能化の確率 原因の確率を推定するための条件と条件の違いにより得られる情報の違い
ランダム化していない介入 Intention to treatという考え方も 反事実確率との比較も必要→訴訟・鑑定 ギブス・サンプリングによる反事実確率と因果効果の推定
「反事実」というのは「仮定法過去『もし●●だったなら』」のようなもの まだ起きていないけれど仮定して、その結果がどうなるかを予測しましょうということ グラフではノードに値を割りつけて、そのノードへの移入エッジをなくすこと 複雑な系について日常的…
Simpson のパラドクス 男女別に有効性を計算すると男女の両方の群で「有効」となるのに、それらを合算すると、「全体では無効」となるようなデータがある 性別がサンプル数や有効性に影響している。そのように何がしかの影響のあるノードを取り去ったらいか…
構造方程式モデリング(SEM) グラフを用いた考え方との違い 識別可能性を問題にするかどうかという違い
意思(に基づく選択行動)と、結果として起きることの分離 条件付き行動、確率的政策 時間依存性行動、時間依存性交絡因子(time-dependent confounders)を伴う時間依存性治療
因果関係の仮説を立てる(DAGを作る) データを使って、「その仮説、どうなの?」という問に答える 因果効果の評価は、「こういう介入をしたらどうなる?」という問への答え(予測)も可能にする 逆に言うと、介入の効果は因果関係(のグラフ)が指定されないと測…
大きな枠組み:観察データから因果関係を見出したい、グラフ・ネットワークを用いて機械的計算で見出したい 観測される変数と観測されない変数とがノードとなったモデルを作る 「観察されない変数」をなんでも自由に決めて良ければ、観察を説明するモデルは…
この章を読むときに:日頃から因果推論ばかりをやっている(臨床医とか)にはとっつきにくい文章かもしれない。「因果モデル」を中心に頭が回っているから。その場合は、「確率・統計」の部分は復習するつもりで読み、「因果」の部分は眼を閉じておいて、先に…
統計的因果推論 -モデル・推論・推測-作者: Judea Pearl,黒木学出版社/メーカー: 共立出版発売日: 2009/02/24メディア: 単行本購入: 6人 クリック: 231回この商品を含むブログ (28件) を見る 目次 第1章 確率、グラフ、因果モデル入門 第2章 因果関係を推…
De novoの74 SNVsが1個人に CNVs,in/delsは解析精度の問題でまだ不明 遺伝するにはきつすぎるような遺伝子変異性疾患(rare sporadic genetic disease)はde novo変異由来だろうと想像されてきたが、その通りの例が出てきている De novoとモザイクと De novo …
High-throughput NGS を活用するための課題 プラットフォームの違い、諸ステップの違い Reproduciblityの問題 プロトコールも変化し続けている 大規模データ処理に不慣れな「生物系」という問題 大規模データに不慣れである、というそのこと自体 処理を記載…
コストは下がっているしこれからも下がる 標的遺伝子セットのリシークエンスは臨床レベルでも可能になるだろう 標的ならは解釈もしやすい
NGSでは、現状では、探そうとしているものが微細なことと、実験系が大雑把なことと、それを補完するデータ処理戦略がばらついていることから、データの解釈と報告の再現性に問題がある 家系サンプルでないと、「多型」か「レア」か「de novo」かの区別が難し…
自己免疫として共通なことの遺伝子レベルでの説明 それを実臨床に活かす視点とは?
一つのバリアントが複数のフェノタイプに影響すること 生物学的に本当にPleiotropic フェノタイプ間の因果関係によるもの 偽物 メンデリアン・ランダマイゼーション
夏も終わり 夏休みの宿題(のようなもの)として「自己免疫疾患のゲノム解析の現状」と題するレポートを書かないといけない さて。 キーワードを決めて、少しレビューの検索をしよう ゲノム・エピゲノム・レアバリアント・シングルセル いずれも次世代シークエ…
少サンプルでリシークエンスしてそれに基づいて大規模サンプルで疾患関連レアバリアントを探すという戦略は成功していない 絞った25 GWAS risk遺伝子を27982 自己免疫疾患(6疾患)患者 vs. 17019コントロールでレアバリアント探しをした エクソンが標的 (Ill…
こちらから my.JS.estimate <- function(x){ m <- mean(x) A1 <- (length(x)-2)/sum((x-m)^2) y <- (1-A1)*(x-m) +m return(y) } n.iter <- 1000 N <- 1000 A <-pi R.As <- R.Bs <- rep(0,n.iter) for(i in 1:n.iter){ # 変なデータとして、正規分布と指数分…
# [-h,h]の範囲の一様分布をカーネル関数とする my.rect <- function(x,h){ ret <- rep(0,length(x)) ret[which(abs(x)<=1)] <- 1 ret } hs <- c(0.1,0.25,0.5,1) y <- seq(from=-10,to=10,length=1000) x.k <- matrix(0,length(y),length(hs)) for(i in 1:l…
# Function to estimate polynomial coefficients and coordinates estimated # 多項式近似の係数と、推定座標を返す関数 glmPolynomial<-function(y,x,dg,X){# y:dependent values (従属値列),x:descriptive values (説明変数),dg:degrees of polynomials (…
信頼区間というのがある 母分布からデータセットをとって、母分布の平均が知りたいときに、昨日は点推定をしたわけだが、今日は区間推定 確率pで生起するときN回観測して、k回起きたという観測結果を基にpを区間推定する Rのbinomパッケージではそのヘルプ文…