2011-07-01から1ヶ月間の記事一覧

データフォーマットや処理ツール

1000genomeのサイト データフォーマットの説明ページ VCF(Variant Call Fromat),VCF formatのページその2 SAM formatとBAM format、SAM formatの説明書 SAM/BAMの処理ツール(の1つ):GATK

ある悩み

W大学の理工系学部での話 「N人の異性と出会うとしたら、三分の一の相手を値踏みした上で、それ以降、出会う人で、値踏み三分の一より良い人を選ぶと、N人の中の最高の人を選んだことになる確率が高い」らしい、と言う。その作戦で生涯の伴侶を選んでみたい…

出会いの確率

Additive Main Effects and Multiplicative Interaction Models

Association schemes -> 実験計画法 -> Rで実験計画法 -> agricolae パッケージ ときて、AMMI解析に出会う AMMIの論文はこちら 環境の違うところで実験をして、着目因子が、特性値にどのような影響力があるかをANOVAの枠組みで解析しようという手法

Rで実験計画法

R記事:"CRAN Task View: Design of Experiments (DoE) & Analysis of Experimental Dat"

多変量の回帰式を作る

R

help(formula) ## Create a formula for a model with a large number of variables: xnam <- paste("x", 1:25, sep="") (fmla <- as.formula(paste("y ~ ", paste(xnam, collapse= "+")))) k<-4 # 例えば xnam <- paste("Fs[,", 1:k, "]",sep="") (fmla <- …

実験計画法メモ2

1元配置 # 1元配置 Ng<-5 Ns<-sample(5:10,Ng,replace=TRUE) Fs<-c() for(i in 1:Ng){ Fs<-c(Fs,rep(i,Ns[i])) } Vs<-rnorm(sum(Ns)) D<-cbind(Fs,Vs) print(D) plot(Vs ~ Fs) myfit <- lm(Vs ~ Fs) anova(myfit) 2元配置 各水準の繰返し数によって「分散の…

実験計画法メモ

実験計画法入門byNAG フィッシャーによる実験計画法 実験計画法では研究を2つに分ける 計画性を持ってデータを集まる段階 集めたデータを解析する段階 実験計画立案時のポイント 目的の確認(目的を表す数値である『特性値』を定める) 因子の選定(因子として…

Association Schemesの周辺

日本語の記事が少ないけれど、こんな文章は参考になる

実験計画法

Association schemesは元々、実験計画法(Wiki)の「要因」のコントロールの配置の仕方から来ている話題 その教科書を2冊 入門 実験計画法作者: 永田靖出版社/メーカー: 日科技連出版社発売日: 2000/06/01メディア: 単行本購入: 8人 クリック: 160回この商品…

Association schemes

こちらの続き Latin squareが作るAssociation schemeの行列表現を作ってみる ラテン方格は『n 行 n 列の表に n 個の異なる記号を、各記号が各行および各列に1回だけ現れるように並べたもの』 今、個の要素について、そのペアをとって関係を考える 「自身」と…

Association schemes2

接写

こちらでモジホコリを撮影している 変形体の分岐や「体」の厚みとか、そういう細かいところまで写したい マクロレンズ・接写リングを追加するか?(参考記事→こちら) マクロレンズとは(こちら) 最短撮影距離とか倍率とか(こちら) クローズアップレンズという…

遺伝子多型解析を数か月でできるようになるために〜第6回

実施日20110721 今日はFDRにまつわるq値(リンク) 関連してresampling 復習Rの使い方 allele freq=a fixatoin index =f 集団のジェノタイプ頻度分布は 疾患のprevalenceをpとして 3ジェノタイプのGRRをr^2,r,1とする D(MM),D(Mm),D(mm),H(MM),H(Mm),…

長方形から、多次元直方体へ

前の記事で、要素間の関係定義を与えるにあたって、要素を「長方形」に納めることでAssociation Schemeを満足させた 行で関係を決め、決まらなかったら、列で決め、それでも決まらなかったら、「残り」という論理だった 「行」「列」が1つずつでなければな…

Association schemes

Association Schemes: Designed Experiments, Algebra and Combinatorics (Cambridge Studies in Advanced Mathematics)作者: R. A. Bailey出版社/メーカー: Cambridge University Press発売日: 2004/02/26メディア: ハードカバー クリック: 1回この商品を含…

Association schemes

Box-cox変換

Box-cox変換が話題になった こんなソースもあるし こんな記事もある 基本的には、このブログの記事に賛成するのだけれど、そうは言っても『常識として、平方根を取る』というその「常識」にも意味があると思う 「こんな分布になるのがふつう」であることを繰…

Box-cox 変換

開放系

Brusselatorがこちらに BrusselatorのWikiはこちら Brusselatorは開放系(外から絶えず供給がある) 閉鎖系〜質量保存?〜化学量論〜化学量論行列(こちらとか、こちらとか) 開放系・閉鎖系、生物は生きる過程でそれを知らない 知らないときには、「与件」を「…

Project-based learning

生き物の基本である親から子への伝達、過去から現在への伝達を、要素と要素間の関係の理論であるグラフで扱うことができる それをProject-based learning的に(こちら)やってみる試み(こちら)

大規模データに対して計算機を使って研究するときの基礎留意点

Goecks, J., A. Nekrutenko, et al. (2010). Genome Biol. 11: R86. 3要素 Accessibility Reproducibility Transparency(これについてはこの記事では扱わない) Accessibilityについて プログラミング・情報学系のスキルが必要 ツールをインストールできなく…

次世代シークエンサーデータにまつわることのメモ(論文3)

Ng, S. (2010). Nat. Genet. 42: 30-35. Exome sequence A rare mendelian disorder Depth Coverage of exons single-end seqs targetted enrichment

次世代シークエンサーデータにまつわることのメモ(論文2)

Guttman, M. (2010). Nat. Biotechnol. 28: 503-510. アプリ:Scripture RNA-seq "Ab initio" アプローチ 既知トランスクリプト・アノテーションは使わない 主な課題 Gapped aligners (スプライス・ジャンクションにショートリードを当てる(TopHatのように) G…

次世代シークエンサーデータにまつわることのメモ(論文1)

Accessibility/Reproducibility/Transparency Goecks, J., A. Nekrutenko, et al. (2010). Genome Biol. 11: R86. 大規模データに対して計算機を使って研究するときの基礎留意点 AccessiblityとReproducibility さらにTransparencyを加えて アプリ:Galaxy A…

次世代シークエンサーデータにまつわることのメモ(論文4)

Trapnell, C. (2010). Nat. Biotechnol 28: 511-515. アプリ:Cufflinks この論文で示している方法のTopHat以降を実装したアプリ アプリ2:TopHat この論文のアプリが使用しているアプリ(アノテーション未知のsplice isoformsを推定・マッピングする) RNA-se…

次世代シークエンサーデータにまつわることのメモ

こちらに、"Next-generation sequence analysis"(Nature Biotechnology 29,45–46(2011))という記事がある 4本の論文が引用されている [http://d.hatena.ne.jp/ryamada22/20110711/1310348323:title=Goecks, J., A. Nekrutenko, et al. (2010). Genome Biol.…

遺伝子多型解析を数か月でできるようになるために〜第5回

『Applied Statistical Genetics With R』の読み会シリーズの目次 2011/07/08 マルチプルテスティング ボンフェロニ、FWER、FDR その基礎 あるデータ(大きなデータ)が取られたとする そのデータを使いまわしてたくさんの検定を行うことを考える 真実の状態と…

一致確率

マーカー数 第iマーカーのアレル数 各マーカーのアレル頻度 各マーカーのディプロタイプ数 各マーカーのディプロタイプ頻度 HWEを仮定すれば、はから導ける あるマーカーでディプロタイプが一致する確率は、 すべてのマーカーでディプロタイプが一致する確率…

鑑別診断

こちらで鑑別診断が記事になっている 鑑別診断とは、ある情報(主訴)が与えられたときに、その情報の原因となりうる疾病のリストのこと 少し整理する 何も情報がないときに、ある人がある疾病であるという確率は、有病率から推定する。これを『基礎事前確率』…