遺伝子多型解析を数か月でできるようになるために〜第１回

R Applied Statistical Genetics With R

『Applied Statistical Genetics With R』の読み会シリーズの目次 2011/05/13 テキスト Applied Statistical Genetics with R: For Population-based Association Studies (Use R!)作者: Andrea S. Foulkes出版社/メーカー: Springer New York発売日: 2009/0…

2011-05-14

遺伝子多型解析を数か月でできるようになるために

R Applied Statistical Genetics With R

この読み会について(こちらの「遺伝因子マッピング」勉強会) こちらがまとめ・問題解答です目次第１回 R Basics 第２回第１章第3回第２章, 1 & 2 第４回第２章,残り、第３章第５回第４章マルチプルテスティング

2011-05-13

数学ランドへようこそ、をぱらぱらめくる　続き

数学

驚くことが多い。「なお余談だが、『本質は何か』といったことを考える能力は企業に就職する数学科の卒業生に企業から期待されていることである」、とある。・・・本当だとよいけれど。「微分方程式の初歩については、高校でも教えられていた時期もあった…

2011-05-13

数学ランドへようこそ、をぱらぱらめくる

群環体ガロア体

数学セミナー2011/5は、「大学数学が一望できる数学ランドへようこそ(その１)」特集確率論・統計数学と、情報科学・離散数学とが「ランド」の対角線の相互に反対側に置かれているな、と、まず思う冒頭の「線形代数」で「ガロア理論」が言葉として登場する …

2011-05-12

ウィルコクソンの符号順位検定

R ウィルコクソン

n 個の対象に対し各2回の観察をする nペアの量的データが得られる変化量に興味がある増えた対象もあれば、減った対象もある増えがちなのか、減りがちなのか、そうとも言えないのか、が判定したい要点「まさにそうとも言えない」データはどういう場合な…

2011-05-12

ウィルコクソンの符号順位検定

2011-05-11

検定してみる

R コドン表

コドンの３番目の塩基はアミノ酸決定に関して情報量が少ないというこちらで、第１塩基と第２塩基の「えらさ」を議論しているその「えらさ」を、数字にするとして、大雑把に、どうすることができるだろうか第１，２，３の塩基ごとに、アミノ酸のどれに対応…

2011-05-10

工夫

R P値リテラシー

今年度も（多分）ある、中学生向けの企画こんな企画昨年度はこんな感じ今年度はこんな感じの予定提供側の課題は「わかりやすさ」そのためのネタのメモ事前確率を共有した上で、出現配列の珍しさの「体感値」を「長さや比率」で口にしてみる。他人のそれ…

2011-05-09

実行コマンド

R DNA鑑定

SMMFout<-SearchMissingsMultiFamily(pedigrees=pedigrees,genotypesFamily=genotypesFamily,Gpool=Gpool2,candidatesList=candidatesList,FamilyNames=FamilyNames,IndNames=IndNames,Alleles=Alleles,Probs=Probs) for(ip in 1:length(pedigrees)){ print(…

2011-05-09

デモデータ

R DNA鑑定

pedigrees<-list() # 同胞 pedigrees[[1]]<-matrix( c(1,2,3,4, 0,0,1,1, 0,0,2,2, 1,0,0,1, 3,3,1,2), ncol=5) # Trio pedigrees[[2]]<-matrix( c(1,2,3, 0,0,1, 0,0,2, 1,0,0, 1,3,2), ncol=5) pedigrees[[3]]<-matrix( c(1:8, 0,0,1,0,3,3,3,3, 0,0,2,0,4…

2011-05-09

ソース

R DNA鑑定

# 依存パッケージ library(kinship) library(MCMCpack) library(gtools) library(sets) library(paramlink) # 家系情報からkinshipパッケージのpedigreeオブジェクトを作る # p # 第１カラム：ＩＤ # 第２カラム：母 # 第３カラム：父 # 第４カラム：性別 0:…

2011-05-09

鑑定しよう

R DNA鑑定

昨日の記事のファイル置き場関数セットのファイルデモデータ実行ファイル解説PPT

2011-05-08

マルチ家族の情報を受け入れて処理・家族ごとに処理

R DNA鑑定

# pedigreeごとに # 家系情報 # 生存・協力者のジェノタイプ情報 # 被捜索者ごとに、身元不明者リスト中の候補者がリストアップされている SearchMissingsMultiFamily<-function(pedigrees,genotypesFamily,Gpool,candidatesList,FamilyNames,IndNames,Allel…

2011-05-08

デモデータの作成

R DNA鑑定

家系を与える家系が満足するジェノタイプデータを作る一部の家系メンバーのジェノタイプデータが欠けたデータを作る HWEを満足する集団のジェノタイプデータを作る候補者のジェノタイプデータを家系メンバーのうちのジェノタイプが欠けたメンバーのジェノ…

2011-05-08

鑑定を動かしてみる

R DNA鑑定

昨日の記事の実践編デモデータの作成マルチ家族の情報を受け入れて処理・家族ごとに処理

2011-05-07

ディプロタイプの事前確率を考慮する

R DNA鑑定

核家族ごとに、取りうるディプロタイプの組み合わせごとに確率を計算することを前記事で書いたディプロタイプがわかっている人の場合は、ただ１つのディプロタイプが確率１で決まっているディプロタイプが与えられていないメンバーの場合、親が不明な場合…

2011-05-07

核家族ごと・ディプロタイプを固定して、確率・尤度を計算

R DNA鑑定

核家族のディプロタイプが与えられたとき、その尤度は、両親のディプロタイプから、子のディプロタイプが生まれる確率を計算する子が複数のときは、子ごとに確率を計算して、それを掛け合わせる核家族のメンバーが取りうるディプロタイプがわかっていると…

2011-05-07

核家族の確率・尤度をピボットで連結する

R DNA鑑定

SumPivot<-function(cpnout,like,info){ ret<-NULL #pivotted<-set() #pivotted<-list() pivotted<-rep(0,length(info)) cumulProb<-list() for(nn in 1:length(cpnout)){ tmpdim<-dim(cpnout[[nn]][[1]]) tmp<-rep(1,tmpdim[1]) if(pivotted[[cpnout[[nn]][…

2011-05-07

核家族ごとにディプロタイプ総当たり条件の確率・尤度を計算する

R DNA鑑定

LikeNucWithPrior<-function(cpnout,nucs,DiplotypePrior){ prob<-list() for(nn in 1:length(nucs)){ nucDimVector<-cpnout[[nn]][[2]] tmp<-DiplotypePrior[[nucDimVector[1]]] for(i in 2:length(nucDimVector)){ tmp<-tmp%o%DiplotypePrior[[nucDimVecto…

2011-05-07

候補者がたくさんいて、網羅的に探すときはメンデリアンチェックで絞り込む

R DNA鑑定

library(paramlink) tmpPed<-p[,1:5] tmpPed<-data.frame(ID=tmpPed[,1],FID=tmpPed[,3],MID=tmpPed[,2],SEX=tmpPed[,4]+1,AFF=tmpPed[,5]-1) tmpPed<-linkdat(tmpPed,model=1) # 候補者を当てはめて確定したジェノタイプがtmpG2 tttmpG<-tmpG2[,,1] for(i i…

2011-05-07

DNA鑑定のためのマーカーデータ処理

R DNA鑑定

目次 1. 家系を扱おう２．マーカーごとに可能なディプロタイプ・ハプロタイプを選ぶ３．考慮するアレルで絞る４．核家族ごと・ディプロタイプを固定して、確率・尤度を計算５．ディプロタイプの事前確率を考慮する６．核家族ごとにディプロタイプ総当た…

2011-05-07

マーカーごとに可能なディプロタイプ・ハプロタイプを選ぶ

R DNA鑑定

マーカーが相互に独立な場合には、個々のマーカーに関して確率・尤度を計算して、積を取ることができるゲノム全体にぱらぱらと置いたIdentifilerの場合には、この仮定でよいマーカーごとに次のように考えるアレル数がのとき、ディプロタイプのタイプ数は…

2011-05-07

考慮するアレルで絞る

R DNA鑑定

ここにもあるように、マーカーのアレル数は非常に多いそれは、アレル数が多い方が、伝達に関する情報が多く、鑑定の力が強いからであるしかしながら、組み合わせ計算においては、場合の数を膨大にする源である家系の解析で、気になるアレル(家系内に存在…

2011-05-07

日本人のためのIdentifilerアレル情報

R DNA鑑定

尤度計算に用いるアレル頻度 IdentifilerというDNA鑑定キットがある１５個のSTRマーカーを使うそれの日本人のアレル頻度に関しては、[J Forensic Sci. 50(3): 718-719.:title=こちら]の報告がある。ちなみにSTR頻度に関してこちらのサイトもある日本人270…

2011-05-07

家系を扱おう

R DNA鑑定

家系情報を作る家系情報は行列にする行の順番は時系列を守ること後述するように、尤度・確率の計算では、核家族を分離して計算することで計算量を減らすように作っている。したがって、家系図にループがある場合には、後半が対応していないことに留意する…

2011-05-07

複数いる尤度解析対象者、複数いる候補者、これらを網羅的に組み合わせる

R DNA鑑定

CalcLikeForCandidates<-function(p,G,candidates,Gcandidates,Alleles,Probs){ # Gpoolの候補者が「ポピュレーションで観察される確率」をあらかじめ算出しよう LikeFromGenPop<-rep(0,length(Gpool2[,1,1])) for(i in 1:length(Alleles)){ tmp<-OffspringG…

2011-05-07

複数のマーカーの確率・尤度を合わせる

R DNA鑑定

CalcLikeZ<-function(p,G,nucs,Alleles,Probs){ tmpret<-0 for(na in 1:length(Alleles)){ A<-unlist(Alleles[[na]]) P<-Probs[[na]] g<-G[,,na] gpool<-G[,,na] #A2P2<-LimitAlleles(g,A,P) A2P2<-LimitAlleles(gpool,A,P) A2<-A2P2[[1]] P2<-A2P2[[2]] #LD…

2011-05-07

DNA鑑定　書き直し

2011-05-06

親子トリオ

R DNA鑑定

# setf:父のディプロタイプの集合。アレルの集合(ホモなら要素数１、ヘテロなら要素数２) # setm:母のディプロタイプの集合 # seto:子のディプロタイプの集合 # 父母カップル LikeTrio<-function(setf,setm,seto){ couple<-setf*setm cnt<-0 for(i in couple…

2011-05-05

メモ

検定普遍分散

t-testは正規分布由来のサンプルの検定をするにあたって、標本と母集団との間のずれを補正するためのもの標本平均、標本分散、t分布母平均、母分散、正規分布 t分布は標本数が大きくなると正規分布へ向かう t分布の基本形は、２群の標本数が同じで、２群の…

ryamadaの遺伝学・遺伝統計学メモ

2011-05-01から1ヶ月間の記事一覧

遺伝子多型解析を数か月でできるようになるために〜第１回

遺伝子多型解析を数か月でできるようになるために

数学ランドへようこそ、をぱらぱらめくる　続き

数学ランドへようこそ、をぱらぱらめくる

ウィルコクソンの符号順位検定

ウィルコクソンの符号順位検定

検定してみる

工夫

実行コマンド

デモデータ

ソース

鑑定しよう

マルチ家族の情報を受け入れて処理・家族ごとに処理

デモデータの作成

鑑定を動かしてみる

ディプロタイプの事前確率を考慮する

核家族ごと・ディプロタイプを固定して、確率・尤度を計算

核家族の確率・尤度をピボットで連結する

核家族ごとにディプロタイプ総当たり条件の確率・尤度を計算する

候補者がたくさんいて、網羅的に探すときはメンデリアンチェックで絞り込む

DNA鑑定のためのマーカーデータ処理

マーカーごとに可能なディプロタイプ・ハプロタイプを選ぶ

考慮するアレルで絞る

日本人のためのIdentifilerアレル情報

家系を扱おう

複数いる尤度解析対象者、複数いる候補者、これらを網羅的に組み合わせる

複数のマーカーの確率・尤度を合わせる

DNA鑑定　書き直し

親子トリオ

メモ