GRAPH出力ファイル



ファイルにおいて、染色体もしくはハプロタイプはタブ区切りの2数で表される。"3 13"は第3世代の第13番染色体(もしくはプロタイプ)を示す

  • 全12ファイルが"GRAPH"以下に出力される
    • 染色体の伝達関係の6ファイルとハプロタイプの伝達関係の6ファイル
    • chxxxx : は染色体のファイル
    • hpxxxx : はハプロタイプのファイル
    • 6ファイルの内訳
      • 出力情報により3種類x出力形式により2種類の計6種類
        • 出力情報の3種類
          • xxchildxx : 左端のノード(タブ区切り2数で特定された、染色体もしくはハプロタイプ)に対し、それの子にあたるノードを右に記載
          • xxparentxx : 左端のノードに対し、それの親にあたるノードを右に記載
          • xx<>bparentchildxx : child ファイルとparent ファイルの出力を併せて1ファイルに出力。左端のノードの世代と右側のノードの世代の数値の大小で親子のどちらの情報を現しているかが区別される
      • 出力形式の2種類
        • xxxxx_1.txt : あるノードにとっての複数の子ノード(childファイルの場合)もしくは親(parentファイルの場合)ノードがある場合に、それらをタブ区切りで1行に出力する形式
        • xxxxx_2.txt : あるノードにとっての複数の子ノード(childファイルの場合)もしくは親(parentファイルの場合)ノードがある場合にそれらを親子ペアずつ改行して出力する形式

Output file formats

1. GRAPH/ch_child_1.txt
/*
*染色体をノードとするグラフの情報
*親→子
*親世代、親世代内ノードID、子世代、子世代内ノードID
*複数の子がいる場合には、世代、世代内ノードIDのペア情報がタブ区切りで羅列
*子のいない親の場合、子の欄はブランク
*/

// Sample
Parent gen Parent Node ID Child_1 gen Child_1 Node ID Child_2 gen Child_2 ID ...
0 0
0 1
0 2 1 111 1 199
0 3 1 183
0 4 1 172
0 5 1 73 1 174
0 6 1 175 1 180
0 7 1 48
0 8 1 77 1 139
0 9
//

2. GRAPH/ch_child_2.txt
/*
*染色体をノードとするグラフの情報
*親→子
*親世代、親世代内ノードID、子世代、子世代内ノードID
*複数の子がいる場合には、世代、世代内ノードIDの4カラム情報が行を変えて登録される
*子のいない親の場合、その親IDは登場しない
*/

// Sample
Parent gen Parent Node ID Child gen Child Node ID
0 2 1 111
0 2 1 199
0 3 1 183
0 4 1 172
0 5 1 73
0 5 1 174
0 6 1 175
0 6 1 180
0 7 1 48
0 8 1 77
0 8 1 139
//

3. GRAPH/ch_parent_1.txt
/*
*染色体をノードとするグラフの情報
*子→親
*子世代、子世代内ノードID、親世代、親世代内ノードID
*複数の親がいる場合には、世代、世代内ノードIDのペア情報がタブ区切りで羅列
*親の数は1か2、0や3以上はない
*/

// Sample
Child gen Child Node ID Parent_1 gen Parent_1 Node ID Parent_2 gen Parent_2 ID
1 0 0 126
1 1 0 95
1 2 0 49 0 67
1 3 0 121 0 153
1 4 0 59
1 5 0 155
1 6 0 128
1 7 0 166
1 8 0 53
1 9 0 196
//

4. GRAPH/ch_parent_2.txt
/*
*染色体をノードとするグラフの情報
*子→親
*子世代、子世代内ノードID、親世代、親世代内ノードID
*複数の親がいる場合には、世代、世代内ノードIDのペア情報が行を変えて登録
*/

// Sample
Child gen Child Node ID Parent gen Parent Node ID
1 0 0 126
1 1 0 95
1 2 0 49
1 2 0 67
1 3 0 121
1 3 0 153
1 4 0 59
1 5 0 155
1 6 0 128
1 7 0 166
1 8 0 53
1 9 0 196
//

5. GRAPH/ch_parentchild_1.txt
/*
*ch_parent_1.txtとch_child_1.txtの行をすべて出力。
*ただし、どちらのタイプかを識別するためのカラムを最左につけてある
*parentファイルの行と同じ場合には"parent",childファイルの行と同じ場合には"child
*/

//
Sample
parent 2 190
parent 2 191 3 80 3 184
parent 2 192 3 72
parent 2 193 3 35
parent 2 194 3 47 3 103
parent 2 195
parent 2 196 3 30 3 62
parent 2 197 3 156
parent 2 198 3 12 3 104
parent 2 199 3 50
child 3 0 2 76
child 3 1 2 159 2 176
child 3 2 2 42
child 3 3 2 50
child 3 4 2 166
child 3 5 2 105
child 3 6 2 77
//

6. GRAPH/ch_parentchild_2.txt
/*
*ch_parent_2.txtとch_child_2.txtの行をすべて出力。
*ただし、どちらのタイプかを識別するためのカラムを最左につけてある
*parentファイルの行と同じ場合には"parent",childファイルの行と同じ場合には"child
*/

//
Sample
parent 0 190 1 100
parent 0 193 1 162
parent 0 195 1 120
parent 0 195 1 158
parent 0 196 1 9
parent 0 197 1 64
parent 0 197 1 138
parent 0 198 1 193
child 1 0 0 126
child 1 1 0 95
child 1 2 0 49
child 1 2 0 67
child 1 3 0 121
child 1 3 0 153
//

7. GRAPH/ch_child_edge.txt
/*
*親→子のエッジを表示
*左の第1、第2カラムは親染色体の世代、世代内ID
*続いて、子染色体の世代、世代内ID
*次はフローの量をあらわすが1のみが定義されている(hp_xxxx_edge.txtの場合には、この数値が染色体数になるのに対応
*ついで該当エッジが表すDNA線分の始点と終点
*Coalescentの場合は両末端、Recombinationの場合は該当範囲のみ
*/

//
Sample
parent gen parent ID child gen child ID flow start end
0 2 1 111 1 0 100000
0 2 1 199 1 0 85493
0 3 1 183 1 0 100000
0 4 1 172 1 0 100000
0 5 1 73 1 18000 100000
0 5 1 174 1 0 100000
0 6 1 175 1 0 100000
0 6 1 180 1 0 100000
0 7 1 48 1 0 42851
0 8 1 77 1 0 100000
0 8 1 139 1 0 100000
//

8. GRAPH/ch_parent_edge.txt
/*
*子→親のエッジを表示
*左の第1、第2カラムは子染色体の世代、世代内ID
*続いて、親染色体の世代、世代内ID
*次はフローの量をあらわすが1のみが定義されている(hp_xxxx_edge.txtの場合には、この数値が染色体数になるのに対応
*ついで該当エッジが表すDNA線分の始点と終点
*Coalescentの場合は両末端、Recombinationの場合は該当範囲のみ
*/

//
Sample
child gen child ID parent gen parent ID flow start end
0 2 1 111 1 0 100000
0 2 1 199 1 0 85493
0 3 1 183 1 0 100000
0 4 1 172 1 0 100000
0 5 1 73 1 18000 100000
0 5 1 174 1 0 100000
0 6 1 175 1 0 100000
0 6 1 180 1 0 100000
0 7 1 48 1 0 42851
0 8 1 77 1 0 100000
0 8 1 139 1 0 100000
//

9. GRAPH/ch_parentchild_edge.txt
/*
*ch_parent_edge.txtとch_child_edge.txtの行をすべて出力。
*ただし、どちらのタイプかを識別するためのカラムを最左につけてある
*parentファイルの行と同じ場合には"parent",childファイルの行と同じ場合には"child
*/

//
Sample
label gen ID gen ID flow start end
parent 0 190 1 90 1 0 100000
parent 0 190 1 100 1 0 100000
parent 0 193 1 162 1 0 100000
parent 0 195 1 120 1 0 100000
parent 0 195 1 158 1 0 100000
parent 0 196 1 9 1 0 100000
parent 0 197 1 64 1 0 100000
parent 0 197 1 138 1 0 100000
parent 0 198 1 193 1 0 100000
child 1 0 0 126 1 0 100000
child 1 1 0 95 1 0 100000
//

10. GRAPH/ch_hp_nd_id.txt
/*
*染色体ノードとハプロタイプノードの対応
*第1、第2カラムは染色体ノードの世代、ID
*第3、第4カラムはハプロタイプノードの世代、ID
*/

//
Sample
19 183 19 0
19 184 19 2
19 185 19 2
19 186 19 0
19 187 19 10
19 188 19 0
19 189 19 2
19 190 19 1
19 191 19 0
19 192 19 0
19 193 19 0
19 194 19 1
19 195 19 2
19 196 19 0
19 197 19 0

//

11. GRAPH/hp_child_1.txt
/*
*ch_child_1.txtのハプロタイプ
*/

12. GRAPH/hp_child_2.txt
/*
*ch_child_2.txtのハプロタイプ
*/

13. GRAPH/hp_parent_1.txt
/*
*ch_parent_1.txtのハプロタイプ
*/

14. GRAPH/hp_parent_2.txt
/*
*hp_parent_2.txtのハプロタイプ
*/

15. GRAPH/hp_parentchild_1.txt
/*
*ch_parentchild_1.txtのハプロタイプ
*/

16. GRAPH/hp_parentchild_2.txt
/*
*ch_parentchild_2.txtのハプロタイプ
*/

17. GRAPH/hp_child_edge.txt
/*
*ch_child_edge.txtのハプロタイプ
*/

18. GRAPH/hp_parent_edge.txt
/*
*ch_parent_edge.txtのハプロタイプ
*/

19. GRAPH/hp_parentchild_edge.txt
/*
*ch_parentchild_edge.txtのハプロタイプ
*/

20. GRAPH/ch_with_hp_edge.txt
/*
*ch_child_edge.txtに染色体ノードに対応するはプロタイプノード情報を付け加えたもの
*親→子で、第1カラムにそのことを明示する"parent"
*それに続く4カラムは、親染色体の世代、染色体ノードID、世代、ハプロタイプノードID
*その後の4カラムにて、子染色体の世代、染色体ノードID、世代、葉プロタイプノードID
*末尾の2カラムには、エッジの始点と終点
*/

//
Sample
parent 0 0 0 0 1 18 1 0 0 100000
parent 0 2 0 0 1 163 1 0 0 100000
parent 0 2 0 0 1 166 1 0 0 100000
parent 0 4 0 0 1 38 1 0 0 100000
parent 0 6 0 0 1 101 1 0 0 100000
parent 0 7 0 0 1 106 1 0 0 100000
parent 0 7 0 0 1 141 1 0 0 100000
//