2011-07-01から1ヶ月間の記事一覧

National Toxicology Program(NTP)

NTPのURL NTPのHigh Throughput Screening EPA(US Environment Protection Agency)のURL AcToR (EPAのパブリックデータベース) データのバルクダウンロード先 SMILES code(フォーマット)(化合物の1次配列フォーマット)→Wiki CAS rn(アメリカ化学会が発行し…

(12) 塩基置換

R

#(U,C,A,G)=(1,2,3,4) b<-1:4 #b<-c("T","C","A","G") codons<-as.matrix(expand.grid(b,b,b)) aas<-c( "F","F","L","L","S","S","S","S","Y","Y","X","X","C","C","X","W","L","L","L","L","P","P","P","P","H","H","Q","Q","R","R","R","R","I","I","I","M…

(11) 有害事象

R

# 有害事象 N<-500 # 単位期間にDという有害事象が起きる確率 pD<-0.1 D<-runif(N)/pD # 単位期間にVという有害事象が起きる確率 pV<-1 V<-runif(N,min=0,max=1)/pV t<-seq(from=0,to=1,length=100) xlim<-ylim<-c(0,1) plot(rep(0,length(t)),t,xlim=xlim,y…

(10) ポアソン過程(ランダムに起きること)

R

一定間隔で起きること、まったくでたらめに起きること(どの時点も同じ確率で起きうる〜ポアソン過程、生起間隔が指数分布)、起きるとなったら集中しておきがちなこと # ぽつりぽつりと起きる現象 m<-0.5 Ne<-20 proportionRunif<-0.3 proportionRnorm<-0.4 e…

(9) 2次元の的当て(2次元正規分布)

R

対立仮説が1点 # 2次元の的当て Npt<-50 xlim<-c(-1,1) ylim<-xlim ori<-c(0,0) mx<-0.2 my<-0 sdx<-1/5 sdy<-1/5 r<-1 # 2 は正規分布 rateParam<-0.1 XYs<-matrix(10,Npt,2) for(i in 1:Npt){ plot(ori[1],ori[2],cex=60,pch=19,col=1,xlim=xlim,ylim=yl…

(7) 対立仮説からの量的形質の分布、等分散・異分散(t-test)

R

等分散からのサンプリング # 対立仮説 N1<-5 N2<-5 m1<-500 m2<-510 v1<-10 v2<-10 # 異分散 Niter<-1000 ps1<-ps2<-rep(0,Niter) for(i in 1:Niter){ d1<-rnorm(N1,m1,sqrt(v1)) d2<-rnorm(N2,m2,sqrt(v2)) t.test.out1<-t.test(d1,d2,var.equal=TRUE) t.te…

(6) 帰無仮説からの量的形質の分布、等分散・異分散(t-test)

R

等分散からのサンプリング # 帰無仮説 N1<-5 N2<-5 m1<-500 m2<-500 v1<-10 v2<-10 # 異分散 Niter<-1000 ps1<-ps2<-rep(0,Niter) for(i in 1:Niter){ d1<-rnorm(N1,m1,sqrt(v1)) d2<-rnorm(N2,m2,sqrt(v2)) t.test.out1<-t.test(d1,d2,var.equal=TRUE) t.te…

(5) 量的形質の分布(t-test)

R

# 平均を変える N1<-8 N2<-8 m1<-50 m2<-50 v1<-5 v2<-5 d1<-rnorm(N1,m1,sqrt(v1)) d2<-rnorm(N2,m2,sqrt(v2)) mdeltas<-seq(from=-5,to=5,by=0.5) par(ask=TRUE) d1<-rnorm(N1,m1,sqrt(v1)) d2<-rnorm(N2,m2,sqrt(v2)) ylim<-range(c(d1,d2+min(mdeltas),d…

(4) ケース・コントロール比が大きいとき(コホート疫学)

R

# コホート # 2x2分割表 NOp<-FALSE N1<-10000 N2<-20 a<-1000 A<-c(rep(1,a),rep(2,N1-a)) A<-sample(A) xlim<-ylim<-c(0,1) bs<-seq(from=1,to=N2-1,by=1) t<-seq(from=0,to=1,length=100)*2*pi ra<-0.2 rb<-ra max<-0.25 may<-0.5 mbx<-0.75 mby<-0.5 …

(3) 対立仮説からの2x2表ランダムサンプリング

R

N1<-100 N2<-150 p1<-0.3 p2<-0.4 Niter<-10000 p.out<-rep(0,Niter) v1<-c(rep(1,N1),rep(2,N2)) for(i in 1:Niter){ v2<-c(sample(c(1,2),N1,replace=TRUE,prob=c(p1,1-p1)),sample(c(1,2),N2,replace=TRUE,prob=c(p2,1-p2))) #print(table(v1,v2)) #p.out…

(2) 帰無仮説からの2x2表ランダムサンプリング

R

N1<-100 N2<-150 p1<-p2<-0.3 Niter<-10000 p.out<-rep(0,Niter) v1<-c(rep(1,N1),rep(2,N2)) for(i in 1:Niter){ v2<-sample(c(1,2),N1+N2,replace=TRUE,prob=c(p1,1-p1)) #print(table(v1,v2)) #p.out[i]<-chisq.test(c(rep(1,N1),rep(2,N2)),c(v1,v2))$p.…

第6章 Rでシミュレーション

R

遺伝統計学集中講義のための資料の全体の目次 Rでシミュレーション (1) 2x2分割表(ケース・コントロール スタディ) (2) 帰無仮説からの2x2表ランダムサンプリング (3) 対立仮説からの2x2表ランダムサンプリング (4) ケース・コントロール比が大きい…

(1) 2x2分割表(ケース・コントロール スタディ)

R

# 2x2分割表 NOp<-FALSE N1<-100 N2<-100 a<-50 A<-c(rep(1,a),rep(2,N1-a)) xlim<-ylim<-c(0,1) bs<-seq(from=1,to=N2-1,by=1) t<-seq(from=0,to=1,length=100)*2*pi ra<-0.2 rb<-ra max<-0.25 may<-0.5 mbx<-0.75 mby<-0.5 p.out<-rep(0,length(bs)) fo…

(8) 量的形質の増減(paired t-test)

R

# paired test N<-50 par(ask=TRUE) Pre<-rnorm(N) d<-runif(N)^2 pairedTps<-rep(0,N+1) rankSumps<-rep(0,N+1) for(i in 0:N){ Post<-Pre+d*c(rep(-1,i),rep(1,N-i)) plot(rep(1,length(Pre)),Pre,pch=18,col=3,xlim=c(0,3),ylim=range(c(Pre+max(d),Pre-m…

皮膚のフェノタイプ

皮膚科の診断は視覚所見の役割が大きい 視覚所見は解析に乗せるのが難しい観察項目の代表例 考える機会をいただいたのでそれについてレビューに基づいて考えてみる レビュー(こちら) 疾患フェノタイプの体系的構築における問題(の例) "Most diseases are buc…

ぱらぱらめくる『統計のための行列代数』

統計のための行列代数 上 (1)作者: D.A.ハーヴィル,伊理正夫出版社/メーカー: シュプリンガー・ジャパン株式会社発売日: 2007/06/28メディア: 単行本購入: 14人 クリック: 176回この商品を含むブログ (11件) を見る統計のための行列代数 下 (2)作者: D.A.ハ…

詳細目次(下巻):ぱらぱらめくる『統計のための行列代数』

第16章 クロネッカー積とvec作用素とvech作用素 16.1 2つ以上の行列のクロネッカー積 定義と幾つかの基本的性質 16.2 vec作用素 定義と幾つかの基本的性質 16.3 vec置換行列 16.4 vech作用素 16.5 線形系の再定式化 16.6 ヤコビ行列についての幾つかの結…

詳細目次(上巻):ぱらぱらめくる『統計のための行列代数』

第1章 行列 1.1 基礎用語 1.2 基礎演算 1.3 行列のいくつかの基礎的な型 第2章 部分行列と分割行列 2.1 幾つかの用語と基礎的結果 2.2 分割行列のスカラー倍、転置、和、積 2.3 行列と列ベクトルとの積についての幾つかの結果 2.4 行列の行や列や要素によ…

関数の使用の適切なことの確認の仕方

R

帰無仮説 帰無仮説下でのデータをモンテカルロシミュレーションする 関数に処理させる 返り値(統計量・p値)の分布を確認 対立仮説 対立仮説下でのデータをモンテカルロシミュレーションする 関数に処理させる 返り値(統計量・p値)の分布を確認 Rでモンテカ…

関数の使い方の調べ方

R

ヘルプ記事を見る(こちら)

関数・パッケージの探し方

R

パッケージ一覧(日本語サイト) CRAN(本家)で検索するなら 名前から(英単語がわかっていれば、『それらしい名前』のパッケージにあたりをつけることも)→左側の"Packages"をクリックして、"Table of available packages, sorted by name"へ やりたい作業の分類…

統計用語の英語の探し方

原書・原著論文を調べて、対応する英単語を見つける 解析の仕方が同じ先行研究があるなら、これが一番 日本語の統計用語から英語を見つける場合 Wikipediaならば、日本語の記事の左側に、各国語の記事へのリンクがあるので、そのリンクを使う t検定の日本語…

統計用語の探し方

『言葉は力』 どこかで耳にした単語・目にした単語があるはず。それをたよりに探し始める そのためには、「ぱっと」見て、自分の捜し物に「近いか遠いか」の判断が素早くできる情報ソースを持つことが大事 たとえば、「用語の一覧に目を通す(ア・カ・サ…を開…

やりたいこと(検定)の確認の仕方

やりたいことを一言で言うと ○○であると言いたい ○○であるとは信じがたいと言いたい ○○の値は××であると言いたい ○○の値は××から××であるだろうと言いたい ○と×とを比べたら、○の方がもっともらしいと言いたい 何が言えるかわからないけれど、何か言えること…

第4章 Rで分布関数・乱数

確率分布(Wiki) 確率的に「値」をとって、「すべての可能な値」について「確率」を足し合わせると1になる 確率分布のリスト(Wiki) 確率分布を作ってみる 確率分布のチェックポイント 確率分布の色々 そもそも、どうして確率分布があるのか・気になるのか? …

第2章 Rを電卓・エクセルの代わりとして使う

R

Rを電卓として使う 『どうして自分は「電卓」を使えるのか』と考える 検算ができる処理は「使える」 検算の仕方 「答」を2通りで出してみて、一致を確認する() 複数の答の一致をcoplot()で見る 値の系列を見る() Rをエクセルの代わりとして使う エクセルは…

第1章 Rを使う準備

R

超初心者から コンピュータを使うとき ファイルとディレクトリ→こちらやこちら ファイルの名前と拡張子→こちら 「隠さずに表示させる」→こちら(名前の一部を表示させるやこちら(隠しファイルの表示) 「送るフォルダ」を使って便利に→こちら コンピュータを管…

行列を「長方形」として扱う

R

行列は、行と列とが作る「四角形」として意味がある 行列は統計学の基本ツール 本気でやらないなら 『線形独立』と『行列式』 『正方行列で座標軸の変換』 『固有値分解は、正方行列による「拡大縮小」と「回転」の組み合わせ』 k<-4 M<-matrix(rnorm(k^2),k…

行列を「行の束」「列の束」として扱う

R

「束」として扱うときの扱い方、2通り 「1束」ごとに、「束」を処理する 「束」同士をペアワイズで処理する

行列と統計と

Rが使えて、遺伝学もわかって、バイオインフォマティクス的に大量データハンドリングができて…も、 統計がわかるためには、やはり越えるべきハードルがある 確率と分布、と ベクトルと行列 いつか、どこかで、この2本立てに納得のいく時間をかけることは、…