多ローカス・多人種・多フェノタイプ・ハプロタイプデータ管理フォーム(案)



※一部文字化けしています


データ管理

1 アイテム
(1)遺伝子
(2)ローカス
(3)個人

2 遺伝子
2-1 遺伝子の定義
DNAとして親から子へ伝達され、機能性分子(RNAたんぱく質)の発現を通じて個体の生命現象に影響を与える因子。DNA塩基配列とその配列の由来親の性別とによって遺伝子の機能は伝達される。
2-2 遺伝子リスト
={G1,G2,…,GN}
2-2-1 遺伝子数
N
の属性
2-3 遺伝子機能
(Gi)={F1Gi,F2Gi,…,FN(Gi)Gi}
個別遺伝子Giの属性
その集合
={(G1),(G2),…,(G N)}
2-3-1 遺伝子機能の数
N(Gi)
(Gi)の属性
Giの属性でもある
3 ローカス
3-1 ローカスの定義
DNA上の物理的な領域。その長さは1塩基以上、任意の長さを取りうる。複数のローカスは通常、相互に重複のないものとする。ローカス間には、組換えの履歴に応じた関係がある。遺伝子多型の解析にあたっては、多型によって、複数のアレルを有する領域が対象となる場合が多い。ローカス上の多型は遺伝子の機能発現に影響を与えうる。
3-2 ローカスリスト
={L1,L2,…,LN(L)}
3-2-1 ローカス数
N
ローカスリストの属性
3-3 個別ローカス
Li
3-3-1 個別ローカスの位置
Q Li)
個別ローカスのLiの属性
その集合
Q L1),Q L2),…,Q LN())}
3-3-2 Alleles
(Li)={A1Li,A2 Li,…,ANLi}
個別ローカスのLiの属性
その集合
={(L1),(L2),…,(LN())}
3-3-2-1 アレル数
N(Li)
(Li)の属性
個別ローカスLiの属性でもある
その集合
 N(L1), N(L2),…, N( LN())}
3-3-3 ローカス上の遺伝子
(Li)={ C1Li,C2 Li,…,CN(Li)Li}
ただしG.∈
個別ローカスのLiの属性
その集合
={(L1),(L2),…,( LN())}
3-3-3-1 ローカス上遺伝子数
N(Li)
(Li)の属性
個別ローカスLiの属性でもある
その集合
 N(L1), N(L2),…, N( LN())}
3-3-3-2 アレルによる遺伝子への機能影響
ローカスLiのアレルAj Liがローカス上遺伝子Ck Liに及ぼす影響
E(Aj Li)(Ck Li)
そのローカス上遺伝子に関する集合
(Aj Li)(Li)={ E(Aj Li)(C1 Li), E(Aj Li)(C2 Li),…, E(Aj Li)(C N(Li) Li)}
さらにそのアレルに関する集合
Li(A1 Li)(Li),(A2 Li)(Li),…,(A N(Li) Li)(Li)
さらにそのローカスに関する集合
L1L2L N

4 個人
4-1 個人のリスト
={I1,I2,…,IN }
4-1-1 個人の人数
NI
の属性
4-2 Phenotypes
={P1,P2,…,PN}
※ 単一のPhenotypeではなく、複数のPhenotypesに対して解析すること、また、個人が複数のPhenotypesについて情報を持っていることを念頭においている
4-2-1 Phenotypesの数
N
4-2-2 個人のPhenotype情報
個人IiのPhenotype Pjにおける情報を
S(Ii)(Pj)とする
そのPhenotypesに関する集合
S(Ii)={ S(Ii)(P1), S(Ii)(P2),…, S(Ii)(P N)}
その個人に関する集合
={ S(I1), S(I2),…, S(IN)}
4-3 Ethnicity
={B1,B2,…,BN}
4-3-1 Ethnicグループの数
N
4-3-2 個人のEthnicグループ情報
b(Ii)
ただしb∈
その集合
={ b(I1), b(I2),…, b(IN)}
4-4 Genotypeデータ
個人IiのローカスLjの母(m)由来/父(p)由来アレルを
Ym/p(Ii)(Lj)
ただしYm/p(Ii)(Lj)∈(Lj)
そのローカスに関する集合
ym/p(Ii)={ Ym/p(Ii)(L1), Ym/p(Ii)(L2),…, Ym/p(Ii)(LN)}
その個人に関する集合
Ym/p={ ym/p(I1), ym/p(I2)),…, ym/p(IN))}


―――――――――――――――――――――――
実例

今、PADI4遺伝子にはハプロタイプが4タイプ知られており、そのローカスにはPADI4以外の機能性分子がコードされていないとする。このローカスをL1とする。
またSLC22A4とSLC22A5の2分子をコードするSLC22A4/5ローカスには、6タイプのハプロタイプが知られているとし、このローカスをL2とする。このローカスについてアジア人200人、コーカシアン200人(それぞれ、リウマチ50人、クローン病50人、両疾患合併5人、両疾患とも罹患せず95人)のデータがあり、SLC22A4/5ローカスの6ハプロタイプはアジア人ではそのうち3タイプのみが、コーカシアンではその他の3タイプのみが観測され、共通するハプロタイプは認められていないものとする。ただし、リウマチ・クローンに関するPhenotypeはDichotomouであるものとし、1を罹患、0を非罹患とする。


遺伝子リスト
={G1,G2, G3}={PADI4, SLC22A4, SLC22A5}

遺伝子数
N=3
遺伝子機能
(G1)={F1Gi }={Peptidylarginine deiminase}
(G2)={F1Gii}={Transport of Ergothioneine}
(G3)={F1Gi }={Transport of Carnitine}
={(G1),(G2),(G 3)}
遺伝子機能の数
N(G1) =1, N(G2)=1, N(G3)=1
ローカス
={L1,L2}
ローカス数
N=2
個別ローカスの位置
Q L1),Q L2)}={chr1-xxxxx-xxxxx,chr5-xxxxx-xxxxx}
Alleles
(L1)={A1L1, A2L1 A3L1 A4L1 }={xxxx,xxxxx,xxxxx,xxxxx}
(L2)={A1L2, A2L2, A3L2, A4L2, A5L2, A6L2 }={xxxx,xxxxx,xxxxx,xxxxx,xxxx,xxxx}
={(L1),(L2) }
アレル数
 N(L1), N(L2) }={3,6}
ローカス上の遺伝子
(L1)={ C1L1 }={G1}={PADI4}
(L2)={ C1L2,C2 L2 }={G2,G3}={SLC22A4,SLC22A5}
={(L1),(L2) }
ローカス上遺伝子数
 N(L1), N(L2) }={1,2}
アレルによる遺伝子への機能影響
ローカスLiのアレルAj Liがローカス上遺伝子Ck Liに及ぼす影響
E(Aj Li)(Ck Li)
そのローカス上遺伝子に関する集合
(A1 L1)(L1)={ E(A1 Li)(C1 L1) }
(A2 L1)(L1)={ E(A2 L1)(C1 L1) }
(A3 L1)(L1)={ E(A3 L1)(C1 L1) }
(A4 L1)(L1)={ E(A4 L1)(C1 L1) }
(A1 L2)(L2)={ E(A1 L2)(C1 L2), E(A1 L2)(C2 L2) }
(A2 L2)(L2)={ E(A2 L2)(C1 L2), E(A2 L2)(C2 L2) }
(A3 L2)(L2)={ E(A3 L2)(C1 L2), E(A3 L2)(C2 L2) }
(A4 L2)(L2)={ E(A4 L2)(C1 L2), E(A4 L2)(C2 L2) }
(A5 L2)(L2)={ E(A5 L2)(C1 L2), E(A5 L2)(C2 L2) }
(A6 L2)(L2)={ E(A6 L2)(C1 L2), E(A6 L2)(C2 L2) }
さらにそのアレルに関する集合
L1(A1 L1)(L1),(A2 L1)(L1) ,(A3 L1)(L1) ,(A4 L1)(L1)
Li(A1 L2)(L2),(A2 L2)(L2),(A3 L2)(L2),(A4 L2)(L2),(A5 L2)(L2),(A6 L2)(L2)
さらにそのローカスに関する集合
L1L2

個人のリスト
={I1,I2,…,I400}
個人の人数
NI=400
Phenotypes
={P1,P2}={Rheumatoid arithritis, Crohn}
Phenotypesの数
N=2
個人のPhenotype情報
個人IiのPhenotype Pjにおける情報を
S(Ii)(Pj)とする
そのPhenotypesに関する集合
S(I1)={ S(I1)(P1), S(I1)(P2) }={1,0}
S(I2)={ S(I2)(P1), S(I2)(P2) }={1,0}

S(I50)={ S(I50)(P1), S(I50)(P2) }={1,0}
S(I51)={ S(I51)(P1), S(I51)(P2) }={0,1}

S(I100)={ S(I100)(P1), S(I100)(P2) }={0,1}
S(I101)={ S(I101)(P1), S(I101)(P2) }={1,1}

S(I105)={ S(I105)(P1), S(I105)(P2) }={1,1}
S(I106)={ S(I106)(P1), S(I106)(P2) }={0,0}

S(I200)={ S(I200)(P1), S(I200)(P2) }={0,0}
S(I201)={ S(I201)(P1), S(I201)(P2) }={1,0}

S(I250)={ S(I250)(P1), S(I250)(P2) }={1,0}
S(I251)={ S(I251)(P1), S(I251)(P2) }={0,1}

S(I300)={ S(I300)(P1), S(I300)(P2) }={0,1}
S(I301)={ S(I301)(P1), S(I301)(P2) }={1,1}

S(I105)={ S(I305)(P1), S(I305)(P2) }={1,1}
S(I106)={ S(I306)(P1), S(I306)(P2) }={0,0}

S(I400)={ S(I400)(P1), S(I400)(P2) }={0,0}
その個人に関する集合
={ S(I1), S(I2),…, S(IN)}
Ethnicity
={B1,B2}={Asian,Caucasian}
Ethnicグループの数
N=2
個人のEthnicグループ情報
b(Ii)
ただしb∈
その集合
={ b(I1), b(I2),…, b(IN)}={B1,…,B1,B2,…B2}
Genotypeデータ
個人IiのローカスLjの母(m)由来/父(p)由来アレルを
Ym/p(Ii)(Lj)
ただしYm/p(Ii)(Lj)∈(Lj)
そのローカスに関する集合
ym/p(Ii)={ Ym/p(Ii)(L1), Ym/p(Ii)(L2),…, Ym/p(Ii)(LN)}
その個人に関する集合
Ym/p={ ym/p(I1), ym/p(I2)),…, ym/p(IN))}