１倍体を単位として計算量を減らすアプローチ

R DNA鑑定

概要ハプロタイプグラフ家系図(２倍体の伝達関係）から１倍体の伝達の様子（ハプロタイプグラフ）を作る家系図はすべての個人がつながっているが、ハプロタイプグラフはつながっていない母方と父方のグラフに分かれる「子はかすがい」「子が産まれると…

2011-05-18

地道な計算方法

R DNA鑑定

ある集団のジェノタイプ頻度情報が与えられているその集団において、ジェノタイプ情報つきの家系がどのくらいの頻度で存在しているかを計算する独立した座位は座位ごとに計算して、積をとる家系内には「集団から直接生まれた子」がいる家系内の「集団か…

2011-05-18

確率計算。そのアプローチ、２つの比較

R DNA鑑定

地道な方法は計算が終わらない地道に計算しないで、同じ値を算出したいやり方１地道なやり方では、すべての個人がすべてのジェノタイプを取りうるというところからスタートした家系情報とジェノタイプが与えられると、ジェノタイプが確定している人は、…

2011-05-18

DNA鑑定の仮説について

R DNA鑑定

家系全体を集団の子、とする集団がある家系図があって、その家系図上の人物のDNA情報がある今、DNAがあって、それが家系図上のある人物のそれである(仮説1)かもしれないし、そうでなく、家系と無関係の人物のそれである(仮説2)かもしれない仮説2は、DNA…

2011-05-18

伝達の場合分けと父方・母方の場合分けで網羅する

R DNA鑑定

法数学勉強会(こちら)のネタ目次 DNA鑑定の仮説について地道な計算方法確率計算。そのアプローチ、２つの比較２倍体を単位として計算量を減らすアプローチ１倍体を単位として計算量を減らすアプローチ１倍体で場合分けソースベータ版

2011-05-17

染色体グラフ

R DNA鑑定

家系図がある常染色体の場合は、子の染色体は母方・父方の２本ある ●方の染色体は親●の２本の染色体のいずれかであるいずれかであるけれど、そのどちらかがわからないとき、両方と辺でつなぐこのようにすると、個人間の血縁関係で作ったグラフが複数のグ…

2011-05-17

フェーズを決めたら、染色体グラフは木の集合になる

R DNA鑑定

染色体の伝達が未確定のとき、染色体グラフは分岐を持つが、確定すると、木の集合になる Rでやれば： # sepGraphsと伝達パターンから、木を作って取り出す SelectTrees<-function(sepG,v){ ret<-list() for(i in 1:length(sepG)){ tmp<-sepG[[i]][,1:2] for(…

2011-05-17

染色体グラフの伝達選択数

R DNA鑑定

染色体グラフは子染色体は由来二親染色体と結ばれているこれを分岐と呼ぶことにするグラフにいくつの分岐があるかを数える sepGraphs<-SeparateGraphs(hG) # 分けたグラフごとにいくつの分岐があるかを数える numBifperGraph<-rep(0,length(sepGraphs)) fo…

2011-05-17

染色体グラフの連結グラフに番号をつける

R DNA鑑定

染色体グラフは複数のグラフの集まりである(ことが多い。血族婚などで一つにつながることもある) 個々の連結グラフに番号をつけよう SeparateGraphs<-function(hG){ ns<-length(hG[,1]) assigned<-rep(0,ns) cnt<-1 for(i in 1:length(hG[,1])){ if(hG[i,1]!…

2011-05-17

染色体グラフからフェーズを場合分け

R DNA鑑定

染色体グラフでは、染色体ノードは由来親の２本の染色体と辺で結ばれていた実際は、その２辺のうちの片方が真実であるので、片方のみが存在しているどの染色体の親子関係もそういう50:50の関係であるから、染色体親子関係Nについて通りの取り方があって、…

2011-05-16

始祖比率

R DNA鑑定

個人の常染色体は母由来のそれと父由来のそれとの２本ある家系がある家系のジェノタイプ情報を考えるとき、ジェノタイプが判明している場合と判明していない場合があるジェノタイプが判明していない家系内メンバーであり、かつ、父母のどちらも知られてい…

2011-05-09

実行コマンド

R DNA鑑定

SMMFout<-SearchMissingsMultiFamily(pedigrees=pedigrees,genotypesFamily=genotypesFamily,Gpool=Gpool2,candidatesList=candidatesList,FamilyNames=FamilyNames,IndNames=IndNames,Alleles=Alleles,Probs=Probs) for(ip in 1:length(pedigrees)){ print(…

2011-05-09

デモデータ

R DNA鑑定

pedigrees<-list() # 同胞 pedigrees[[1]]<-matrix( c(1,2,3,4, 0,0,1,1, 0,0,2,2, 1,0,0,1, 3,3,1,2), ncol=5) # Trio pedigrees[[2]]<-matrix( c(1,2,3, 0,0,1, 0,0,2, 1,0,0, 1,3,2), ncol=5) pedigrees[[3]]<-matrix( c(1:8, 0,0,1,0,3,3,3,3, 0,0,2,0,4…

2011-05-09

ソース

R DNA鑑定

# 依存パッケージ library(kinship) library(MCMCpack) library(gtools) library(sets) library(paramlink) # 家系情報からkinshipパッケージのpedigreeオブジェクトを作る # p # 第１カラム：ＩＤ # 第２カラム：母 # 第３カラム：父 # 第４カラム：性別 0:…

2011-05-09

鑑定しよう

R DNA鑑定

昨日の記事のファイル置き場関数セットのファイルデモデータ実行ファイル解説PPT

2011-05-08

マルチ家族の情報を受け入れて処理・家族ごとに処理

R DNA鑑定

# pedigreeごとに # 家系情報 # 生存・協力者のジェノタイプ情報 # 被捜索者ごとに、身元不明者リスト中の候補者がリストアップされている SearchMissingsMultiFamily<-function(pedigrees,genotypesFamily,Gpool,candidatesList,FamilyNames,IndNames,Allel…

2011-05-08

デモデータの作成

R DNA鑑定

家系を与える家系が満足するジェノタイプデータを作る一部の家系メンバーのジェノタイプデータが欠けたデータを作る HWEを満足する集団のジェノタイプデータを作る候補者のジェノタイプデータを家系メンバーのうちのジェノタイプが欠けたメンバーのジェノ…

2011-05-08

鑑定を動かしてみる

R DNA鑑定

昨日の記事の実践編デモデータの作成マルチ家族の情報を受け入れて処理・家族ごとに処理

2011-05-07

ディプロタイプの事前確率を考慮する

R DNA鑑定

核家族ごとに、取りうるディプロタイプの組み合わせごとに確率を計算することを前記事で書いたディプロタイプがわかっている人の場合は、ただ１つのディプロタイプが確率１で決まっているディプロタイプが与えられていないメンバーの場合、親が不明な場合…

2011-05-07

核家族ごと・ディプロタイプを固定して、確率・尤度を計算

R DNA鑑定

核家族のディプロタイプが与えられたとき、その尤度は、両親のディプロタイプから、子のディプロタイプが生まれる確率を計算する子が複数のときは、子ごとに確率を計算して、それを掛け合わせる核家族のメンバーが取りうるディプロタイプがわかっていると…

2011-05-07

核家族の確率・尤度をピボットで連結する

R DNA鑑定

SumPivot<-function(cpnout,like,info){ ret<-NULL #pivotted<-set() #pivotted<-list() pivotted<-rep(0,length(info)) cumulProb<-list() for(nn in 1:length(cpnout)){ tmpdim<-dim(cpnout[[nn]][[1]]) tmp<-rep(1,tmpdim[1]) if(pivotted[[cpnout[[nn]][…

2011-05-07

核家族ごとにディプロタイプ総当たり条件の確率・尤度を計算する

R DNA鑑定

LikeNucWithPrior<-function(cpnout,nucs,DiplotypePrior){ prob<-list() for(nn in 1:length(nucs)){ nucDimVector<-cpnout[[nn]][[2]] tmp<-DiplotypePrior[[nucDimVector[1]]] for(i in 2:length(nucDimVector)){ tmp<-tmp%o%DiplotypePrior[[nucDimVecto…

2011-05-07

候補者がたくさんいて、網羅的に探すときはメンデリアンチェックで絞り込む

R DNA鑑定

library(paramlink) tmpPed<-p[,1:5] tmpPed<-data.frame(ID=tmpPed[,1],FID=tmpPed[,3],MID=tmpPed[,2],SEX=tmpPed[,4]+1,AFF=tmpPed[,5]-1) tmpPed<-linkdat(tmpPed,model=1) # 候補者を当てはめて確定したジェノタイプがtmpG2 tttmpG<-tmpG2[,,1] for(i i…

2011-05-07

DNA鑑定のためのマーカーデータ処理

R DNA鑑定

目次 1. 家系を扱おう２．マーカーごとに可能なディプロタイプ・ハプロタイプを選ぶ３．考慮するアレルで絞る４．核家族ごと・ディプロタイプを固定して、確率・尤度を計算５．ディプロタイプの事前確率を考慮する６．核家族ごとにディプロタイプ総当た…

2011-05-07

マーカーごとに可能なディプロタイプ・ハプロタイプを選ぶ

R DNA鑑定

マーカーが相互に独立な場合には、個々のマーカーに関して確率・尤度を計算して、積を取ることができるゲノム全体にぱらぱらと置いたIdentifilerの場合には、この仮定でよいマーカーごとに次のように考えるアレル数がのとき、ディプロタイプのタイプ数は…

2011-05-07

考慮するアレルで絞る

R DNA鑑定

ここにもあるように、マーカーのアレル数は非常に多いそれは、アレル数が多い方が、伝達に関する情報が多く、鑑定の力が強いからであるしかしながら、組み合わせ計算においては、場合の数を膨大にする源である家系の解析で、気になるアレル(家系内に存在…

2011-05-07

日本人のためのIdentifilerアレル情報

R DNA鑑定

尤度計算に用いるアレル頻度 IdentifilerというDNA鑑定キットがある１５個のSTRマーカーを使うそれの日本人のアレル頻度に関しては、[J Forensic Sci. 50(3): 718-719.:title=こちら]の報告がある。ちなみにSTR頻度に関してこちらのサイトもある日本人270…

2011-05-07

家系を扱おう

R DNA鑑定

家系情報を作る家系情報は行列にする行の順番は時系列を守ること後述するように、尤度・確率の計算では、核家族を分離して計算することで計算量を減らすように作っている。したがって、家系図にループがある場合には、後半が対応していないことに留意する…

2011-05-07

複数いる尤度解析対象者、複数いる候補者、これらを網羅的に組み合わせる

R DNA鑑定

CalcLikeForCandidates<-function(p,G,candidates,Gcandidates,Alleles,Probs){ # Gpoolの候補者が「ポピュレーションで観察される確率」をあらかじめ算出しよう LikeFromGenPop<-rep(0,length(Gpool2[,1,1])) for(i in 1:length(Alleles)){ tmp<-OffspringG…

2011-05-07

複数のマーカーの確率・尤度を合わせる

R DNA鑑定

CalcLikeZ<-function(p,G,nucs,Alleles,Probs){ tmpret<-0 for(na in 1:length(Alleles)){ A<-unlist(Alleles[[na]]) P<-Probs[[na]] g<-G[,,na] gpool<-G[,,na] #A2P2<-LimitAlleles(g,A,P) A2P2<-LimitAlleles(gpool,A,P) A2<-A2P2[[1]] P2<-A2P2[[2]] #LD…