2013-01-01から1年間の記事一覧

Repeated Measures ANOVA (3)

今、検出したいのは、個人のばらばらを考慮した上で、groupごとに時間経過での違いがあること(Withinのgroup:time項が有意であること) > demo3 <- read.csv("http://www.ats.ucla.edu/stat/data/demo3.csv") > ## Convert variables to factor > demo3 <- wi…

Repeated Measures ANOVA (2)

Strataでまとめること 前の記事で個人をグループに振り分けて3時刻で測定するという例を扱った。このとき、個人の特性がばらつきをもたらすことを前提に解析していた それを個人と言うStrataでまとめる、と言っている 再度、出力を見直してみる Error: idと…

Repeated Measures ANOVA

リンクを集めているページ(こちら) まずはここ(UCLA)のサイトに行ってみよう 例1 demo1 <- read.csv("http://www.ats.ucla.edu/stat/data/demo1.csv") ## Convert variables to factor demo1 <- within(demo1, { group <- factor(group) time <- factor(tim…

Repeated Measures ANOVA (4)

初期値依存のとき 時系列で記録する。グループ別に記録する。ただし、時刻0での値は、ある状態を反映しているので、それを織り込むことが妥当だとする 以下で解析しているのは、次に示すグラフ(左は2群を併せたもの、中央と右が群別の経過)のうち上の方の区…

メモ

上の記事でF分布についてメモした 少しANOVAを。こちらも参考 n.iter <- 1000 ret <- rep(0,n.iter) n.g <- 2 n.s <- 200 for(i in 1:n.iter){ X <- rnorm(n.s) P <- sample(1:n.g,n.s,replace=TRUE) s1 <- which(P==1) s2 <- which(P==2) ret[i] <- t.test(…

F分布

F分布はカイ二乗分布の比と関係がある # 2つのカイ二乗分布乱数を発生させる d1 <- 3 d2 <- 5 q1 <- rchisq(1000,d1) q2 <- rchisq(1000,d2) # カイ二乗分布乱数を自由度で割ったものの比がF統計量 f <- (q1/d1)/(q2/d2) # F統計量は構成元の二つの自由度の…

アメリカ人類遺伝学会@ボストン

2013/10/23-25と会期の全部ではありませんが、参加します 主なトピック 研究トラックに挙げられているもの エピゲノムは取り立てて扱っておこう 「ゲノム空間」の「Integration(統合解析〜積分)」 Galaxyを使って自分でハイスループットデータを使ってみよう…

DelaunayはDelone

準結晶をやっていたら、点がばらばらだけと均等にあるとき「Delone set」と言う、というのが出てきた(こちら) 分布推定をやっていて三角形分割をやっていたらDelaunay図と言うのが出てきた(こちら) Бори́с Никола́евич Делоне́; ボリス ドロネーさんからつい…

メモ

準結晶(こちら)やら、リーマン予想と準結晶(こちら)やら、それらとゼータ関数の関係(こちら)やらを気にしている データ解析的にはどうなるか… ルールがある、ルールが制約空間に像を作る。これが準結晶(と定義してもよい) 準結晶に関する点集合を観察してよ…

ドロネー分割を取り入れる

昨日の記事では酔歩を使って平滑化する話 そのとき、観測点の密度が違うと平滑化後の値が密度推定にはならないことを書いた それを修正するために、ドロネー図的に(多次元に一般化しやすくするため)各点に与えうる密度っぽい値を計算することにしたこちらに…

酔歩で平滑化

先日、体系的発現データ解析で遺伝子の重みをつけるにあたって既知パスウェイ情報から作ったグラフの上で酔歩をさせて遺伝子の重みづけを変更する→結果として平滑化状態に収束する、という話があった じゃあ、ありきたりな量的計測値があったときに「分布」…

酔歩で平滑化

カーネル密度推定のbw.nrd0

R

help(density)でdensity()のヘルプが出る 平滑化の幅のオプションが色々あるが、help(bw.nrd)でその色々のヘルプ記事が出る その中で「最適」とは言いにくいかもしれないが、歴史的経緯から良く用いられているnrd0オプションでは…などの説明がある bw.nrd0 i…

SOAP

診断行為・臨床判断としてのSOAPについてこちらにコメントがある Sに入る前に「対象」が帰属する「母集団」に対する知識が必須。これが事前確率を決め、以降で得られる事後確率に逐一反映してくる〜すべての情報の価値に影響を与えるから 「身体システムを意…

当たりくじ

当たりくじが表示より不当に少なくしか入っていないかどうかを疑っているときのサンプリング鑑定 p1 <- 0.1 p2 <- 0.01 Ns <- 1:46 for(i in 1:length(Ns)){ N <- Ns[i] db.1 <- dbinom(0:N,N,p1) db.2 <- dbinom(0:N,N,p2) cumsum.1 <- cumsum(db.1) cumsum…

ずるしている?

逸脱しかた

大学入試センター試験の願書受付が始まりました 複数の科目の合計点で合否を決めることが普通です 一芸入試というのもあります 絵に描くとどういうことなのでしょう? もし、すべての試験科目が相互に独立で、多次元正規分布していて、中心からのずれの強い…

情報学、統計学・数理科学

こんな企画があってこのブログが載っていたと教えていただきました 「遺伝学・遺伝統計学の研究メモ」という説明がされていました。散漫な内容なので、それ以上の説明はなし、でした ちなみに、ノミネートにdeveloped byと書かれているけれど、このサイト、…

道を選ぶ

今、目の前にn.option本の道がある その道には、それぞれ案内板が立っていて、「この道を進むと、n.type種類の猛獣が必ず1頭出ます。これまでの記録では、虎がa頭、蛇がb頭、蜘蛛がc頭…出ました」という情報が得られる 一方、分岐点に立っている「私」は、…

Mutation in Folate Metabolism Causes Epigenetic Instability and Transgenerational Effects on Development 葉酸代謝異常に伴う胎児発生異常のエピジェネティック効果が5代に渡って現れることを述べた論文 母系のDNA配列によらない表現型への影響に関す…

エピジェネティクス

Directed Random Walk on Graph

"Topologically inferring risk-active pathways toward precise cancer classification by directed random walk"という論文で、遺伝子ネットワークにおける部分パスウェイにスコアを与えている This paper gave scores to subgraph pathways in gene netwo…

Directed Random Walk on Graph

積み上げる

空間があって、そこの座標をとする 多項事象があって、この空間に事象が観察されるとにが得られる ここで、個々の観察対して、それをを中心とした正規分布で空間に起きたとみなせば、その総和は積分が検体数の分布を作る この分布に照らすと、空間の任意の点…

そっくりな双子の違い

一卵性双生児は本当によく似ている。「前からも後ろからもクリソツ」だ、と言う。でも「性格は違うんですよ」とも。 身体表現型の遺伝的制御は頑健で、精神表現型(脳神経ネットワーク)はそうでもない、ということだろう モデルとしてはどんな風に考える? 一…

双子モデル

樹状分布

こちらで濃淡がいろいろな分布とその上のディリクレ分布のことをやっている こちらでフローサイトメータをやっている まずまずな樹状形の分布をランダム発生させてみる 適当に枝分かれルールを作り、枝の長さをつくり、それを順次「生やす」ことで木型を作る…

樹状分布

分布の分布を推定したい

昨日と同じ設定。今日は、各観測点に同じ寄与力を授けたうえで、その寄与力を最大にする1パラメタの最適値推定をする方法でやってみる # 説明変数次元 n.x <- 2 # 被説明変数に影響を及ぼす変数数 n.x.a <- 2 # 被説明変数レベル数 n.y <- 2 Y.level <- 1:n…

分布の分布を推定したい〜その2