DATA出力ファイル



  • 全11ファイルが"DATA"以下に出力される
  • 主要ファイル
    • ch_lastgen.txt
      • シミュレーションの結果、生じる、最終世代の個々の染色体上のSNPアレルについて
    • hp_all_xxxx.txt
      • シミュレーションの実行変数
      • シミュレーションで生じるハプロタイプの頻度とそのSNPアレルの情報について
    • hpseq_common_lastgen.txt
      • シミュレーションの結果、生じる、最終世代のハプロタイプのうち、頻度の高いものの、"00101001"表示のファイル
  • その他のファイルは次の3要因で名前付けがされる
    • 内容で5種類(染色体の置換塩基箇所についてか("ch_xxx")、ハプロタイプの頻度と置換塩基箇所についてか("DATA_hp_xxx")、ハプロタイプハプロタイプ型(01表示)についてか("hpseq_xxx")、ハプロタイプの登録IDについてか("hpid_xxx")、置換塩基箇所についてか("snplist_xxx"))
    • 出力世代で2種類(全世代について通して出力されるか("xxxallgen.txt")、最終世代だけか("xxxlastgen.txt")、)
    • ハプロタイプ頻度で2種類(頻度の高いハプロタイプのみか("xxxcommonxxx")、すべてのハプロタイプか("xxxallxxx")、)

Output file formats

1. DATA/ch_allgen.txt
/*
*全世代を通じて、すべての染色体の配列情報のファイル
*世代の冒頭に1行"generation"+"\t"+"世代番号"+"\n"
*引き続いて"Serial number in the generation"+"\t"+"mutation sites(\t区切り)"+"\n"
*mutation sitesの塩基番号は昇順ソートされている
*/

// Sample
//0,1,2の3世代、1世代に10本の染色体
ID mutation site1 mutation site2 mutation site3 ...
generation 0
0
1
2
3
4
5
6
7
8
9
generation 1
0 560
1 360
2 560 680
3 360 680
4
5
6
7
8
9
generation 2
0
1 360
2 560 680
3 360 680
4
5
6 560 939
7
8
9 360 560
//

2. DATA/ch_lastgen.txt
/*
*最終世代の染色体の配列情報のファイル
*ch_allgen.txtの最終世代の抜書きに相当する
*"Serial number in the generation"+"\t"+"mutation sites(\t区切り)"+"\n"
*mutation sitesの塩基番号は昇順ソートされている
*/

// Sample
//10本の染色体
ID mutation site1 mutation site2 mutation site3 ...

0
1 360
2 560 680
3 360 680
4
5
6 560 939
7
8
9 360 560
//

3. DATA/hp_all_allgen.txt
/*
*全世代を通じて、すべての葉プロタイプの配列情報と本数情報のファイル
*世代の冒頭に1行"generation"+"\t"+"世代番号"+"\n"
*引き続いて"世代内ID Serial number of haplotype in the generation"+"\t"+"全経過ID Serial number of haplotype throughout simulation"+"\t"+"本数"+"mutation sites(\t区切り)"+"\n"
*mutation sitesの塩基番号は昇順ソートされている
*/

//Sample
ID in gen ID in total frequency mutation site1 mutation site2 mutation site3 ...

generation 0
0 0 200
generation 1
0 0 199
1 1 1 28618
generation 2
0 0 199
1 1 1 28618
generation 3
0 0 195
1 1 2 28618
2 2 1 61214
3 3 1 49809
4 4 1 24423
//

4. DATA/hp_all_lastgen.txt
/*
*シミュレーションパラメタが冒頭に
*その後、hp_all_allgen.txtの最終世代の部分の抜書き(カラム内容情報つき)
*/

//
Sample
>Length of region(nt) 100000
>No.total chromosomes 200
>nt/1cM 100000.0
>No.generation 50
>Mutation rate 0.01
>Recombination rate/1cM 0.1
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

>Serial id Haplotype id No.chromosomes Mutation sites
0 0 144
1 7 31 29490
2 49 8 45052
3 60 1 75410
4 90 5 29654
5 94 2 27352 29490
6 96 3 70018
7 103 1 29654 59122
8 104 1 55257
9 105 3 29490 75410
10 107 1 29490 58212
//

5. DATA/hp_common_allgen.txt
/*
*hp_all_allgen.txtのうち、haplotype頻度が指定閾値以上のもののみの抜書き
*/

//
Sample
省略
//

6. DATA/hp_common_lastgen.txt
/*
*hp_all_lastgen.txtのうち、haplotype頻度が指定閾値以上のもののみの抜書き
*/

//
Sample
省略
//

7. DATA/hpid_all_allgen.txt
/*
*haplotypeの世代内IDと全経過IDとの照合表
"generation"+"\t"+"世代内ID"+"\t"+"全経過ID"+"\n"
*/

//
Sample
generation ID in gen ID throughout gens
0 0 0
1 0 0
1 1 1
2 0 0
2 1 1
3 0 0
3 1 1
3 2 2
3 3 3
3 4 4
4 0 0
4 1 2
4 2 3
//

8. DATA/hapid_common_allgen.txt
/*
*hapid_all_allgen.txtのうち、指定閾値以上の頻度を持つhaplotypeについての抜書き*/

//Sample
省略
//

9. DATA/hpseq_all_lastgen.txt
/*
*最終世代のhaplotypeの01表示(頻度情報はない)
*多型箇所が羅列される
*/

//
Sample
000000000
010000000
000100000
000000001
001000000
110000000
000000010
001000100
000010000
010000001
010001000
//

10. DATA/hpseq_common_lastgen.txt
/*
*hpseq_all_lastgen.txtのうち、指定閾値以上の頻度を持つhaplotypeについての抜書き
*/

11. DATA/snplist_lastgen.txt
/*
*最終世代のハプロタイプがもつSNPの位置をタブ区切りで1行に
*/

//
Sample
27352 29490 29654 45052 55257 58212 59122 70018 75410
//