2012-01-01から1年間の記事一覧
代数統計はデータの構造(グラフや群環体)に注目してデータを把握しようとします 便利なソフトウェアもあります 『Algebraic statistics for computational biology』:Part I(基礎)2計算機科学より 目次はこちら 2.5 ソフトウェア 数学ソフト "4TI2" 非負整…
目次はこちら 4.1 ゲノム 4.2 データ 4.3 問題 4.4 生物学の配列の統計モデル 4.5 変異の統計モデル
目次はこちら 代数統計学では『統計モデルは代数多様体』とする 代数多様体(algebraic varieties)とはこちらにあるように "多変数の連立多項式系の解集合として定義される図形" 例:Hardy-Weinberg Equilibriumが作る3角形内の曲線 表現方法2つ (連立)方程…
目次はこちら 離散アルゴリズムは数値アルゴリズムと並び立つもの。数値アルゴリズムは前章のEMもそうだし、固有値分解もそう。離散データには離散アルゴリズム 2.1 Tropical arithmetic と動的計画法 動的計画法はだんだんに必要なものを積み上げて解に到達…
Algebraic Statistics for Computational Biology作者: L. Pachter,B. Sturmfels出版社/メーカー: Cambridge University Press発売日: 2005/08/22メディア: ハードカバー購入: 1人 クリック: 9回この商品を含むブログを見る 目次はこちら いわゆる統計学の考…
「遺伝統計学トリビア」の実験中(こちらで、年末年始のため、アクセスがほとんどなくなる時期にこっそりと) 科学分野で用いられる術語は一般用語としての意味と区別する必要もあってこんがらがる 「名詞」として使っているのか「形容詞」として使っているの…
CategoryVector<-function (nc = 3){ df <- nc - 1 d <- df + 1 diagval <- 1:d diagval <- sqrt((df + 1)/df) * sqrt((df - diagval + 1)/(df - diagval + 2)) others <- -diagval/(df - (0:(d - 1))) m <- matrix(rep(others, df + 1), nrow = df + 1, byr…
「犯人はたぶん女で背の高さは150−160センチ、年齢は20−40歳、と思います」 自分が「真犯人」だとして、この目撃証言がどのくらい、危険な証言かを定量する 「自分はどれくらい女らしく見えるだろうか?」:他人は自分のことを(その状況で)見て、…
そろそろ入試の季節 入試で「よい学生」を取りたいとの思いがどこの大学も強い 「よい学生」というのも定義が必要だ 個人としての学生の「よさ」 「卒業して、最終的にヒトカドの人物になる」ことをもって「よい」とする? 「入学から卒業までのプロセスで獲…
言語が違えば、世界も違って見えるわけ作者: ガイドイッチャー,Guy Deutscher,椋田直子出版社/メーカー: インターシフト発売日: 2012/11/20メディア: 単行本購入: 3人 クリック: 24回この商品を含むブログ (20件) を見る 生物学的色覚と色を区別すること。区…
こちらで、疾患という表現型を医学部教育でどのように学ぶかについて考えている 表現型が重層的・相互連携的にできているときに、そのどの段階・どの部分・どの関係性と、遺伝要因(こちらの設定も問題になるのだが…)が関係するのかを設定することが、遺伝統…
ここに"Computational tools"として記事をまとめている Text-mining solutions for biomedical research 文字情報ベースの文献から情報を抽出し、データベース化・グラフ化し新たな知を見出すための計算機的処理 情報抽出 情報の分解・パーツ化 Knowledge ba…
年末のぱらぱら総説を眺めるシリーズ(2011年はこちら) Computational tools Human mitochondrial DNA: roles of inherited and somatic mutations ミトコンドリア、親から受け継ぐ変異と体細胞変異 癌細胞のミトコンドリアにおける変異の蓄積、それはアーチ…
こちらはトランスクリプトーム解析の論文発表の内容がデータ・解析上の問題から取り下げとなり、それに基づいた臨床研究が頓挫した話です この問題の再発を防ぐために、オミックスデータにオープン・アクセスを義務付けること、またデータ産生プロセスの再現…
どんな解析が商業化されて「ルーチン扱い」なのかを見てみよう NVIVO 文字情報データの管理・構造化・分析 aabel PLS 外れ値解析 Design-Expert 実験計画法 一般要因試験・応答局面法・混合計画法 SYSTAT MANOVA/ANCOVA パス解析(RAMONA) リッジ回帰 Random …
受精卵から卵割を繰り返してできる2分岐木を四分円域内に描くとしよう 四分扇の片方の露出半径は生殖細胞系列群で、次世代につながっていく # 卵割性代数 k <- 11 # ノードIDを世代別に格納 v.list <- list() v.list[[1]] <- c(1) # エッジは卵割の母-2娘…
オーム社さんが『遺伝統計学の基礎』PDF版を発売していた!(こちら)
免疫系諸分子をコードする遺伝子とその多型 HLA領域とHLA分子 HLA_dictionary(PDF) アレル数 KIR(Killer-cell Immunoglobulin-like Receptors) review KIRデータベース Immuno-polymorphism-databaseの論文(PDF) Adaptive immune systemのImmunogenetics(Rev…
遊び 2x2分割表がある カイ二乗統計量を計算することが多い 群内分散と群間分散とも計算してその比をとったりしてみよう n.iter <- 1000 chis <- ss <- ss2 <- rep(0,n.iter) v <- sample(100:500,4) m <- matrix(v,2,2) a <- apply(m,1,sum) b <- apply(m,2…
n個の標本値があるとき、その標本分散はと表される これはでもあるというのはこちらのメモの通り この式は、すべての値ペアの距離の二乗の平均を2で割ったもの 無限個ある(かもしれない)母集団のすべての値ペアの距離の二乗の平均(それは母集団のすべての値…
選挙の頃 反映したい母集団の意見は複数の軸で定義されている 各軸を単純化して、賛成・反対とするだけで、軸数nに対して通りの意見がある 今、通りの意見パターンごとに1つの「意見代表団体」があれば、その団体の得票数に比例して全体の意見を反映させれ…
こちらで臨床検査の感度特異度の話、そのベイズ的使用のためにきおくするべきことの話が出ている 興味深い 現実医療現場では、「状況(事前確率の高低カテゴリ)」「使用検査」「判断したいこと=確定診断したい・ルールアウトしたい」の組み合わせに対して、…
こちらでZDD/BDDについて書いた その元ネタとしてこちらがある その中に頻出アイテム集合マイニングという話題がある スーパーで、スーパーの全商品リストを全体集合とし、顧客の1回毎の買い物リストを、部分集合としたときのデータハンドリングの話 まず、…
論文(Multilevel Linear Dimensionality Reduction using Hypergraphs for Data Analysis)
GSEA(こちら,ペイパー) GSEA_変法 MA plot(こちら)
こちらで分散・共分散と遺伝率が話題になった 共分散ってなに?と口語で説明したいときに: 「平均は計算したい」 「平均を計算したら、平均を中心としたばらつきは計算したい」→分散 変数が2つあるとき: それぞれの変数に平均は計算できる 2次元空間的な…
バイナリデータの決定木ダイアグラムにBDD/ZDD/seqDD/piDDがある(さんこうこちらやこちら) BDDは2値判断の塊 ZDDは組合せ集合向け seqDDは配列向け piDDは置換集合向け(piDDについて) 置換は異なる染色体上の遺伝子のシャッフリングに対応 組合せ集合はハプ…