MutationString出力概要
- VGJというグラフ理論用のアプリケーションが組み込まれており、その図として出力される
- 図はVGJのメニューバーから"File"→"Save"もしくは"Save As"として保存できる。保存したファイルは"File"→"Open"で再度図表示できる
- VGJによる図(グラフ)
- 入力ファイルのハプロタイプがノード(頂点)で、ハプロタイプとハプロタイプの間に発生した変異がエッジ(辺)で表される
- ノードはあるハプロタイプに変異が入った「変異体」の場合には紫で、それ以外は「黄色」で表される
- ノードのハプロタイプはノードの下に表示される
- エッジは1箇所の変異に相当するが、変異が発生した塩基番号が表示される
- Scale/2,Scale=1,Scale*2ボタンで拡大・縮小を適宜行うことができる
- すべてのノードが円周上に配置される。VGJウィンドウの"Select Nodes"ボタンをクリックし、任意のノードを選択した上で、メニューから"Algorithm"→"Tree"を選ぶと、選択したノードとそれから派生したハプロタイプがツリー上に表示される
- 変異はParsimonyで決定されており、また、Infinite site modelを用いているので、ある塩基位置に2回以上の変異は起きないように処理されている
- すべてのSNPアレルが0のハプロタイプのノードには、"Node X"というラベル表示がされる。これを消すには、メニューバー→Properties→Use Node ID As Default Labelの選択を解除する
- 出力サンプル
- いくつかの例を示す
- sample1.txt
0000
0010
- 2ハプロタイプ、1SNP
- sample2.txt
0000
0011
- sample3.txt
0000
0011
0010
0001
- sample4.txt
00000000
00001000
00001010
00001001
00001101
10000000
10100000
11000000
11010000
- sample5.txtとsample5_01Inv.txt
- sample5.txt
0000000000
0010000000
0011000000
0100000000
0100100000
0100010000
1000000000
1000001100
1100000000
1100000001
1100000011
- sample5_01Inv.txt
1111111111
1101111111
1100111111
1011111111
1011011111
1011101111
0111111111
0111110011
0011111111
0011111110
0011111100
- 9ハプロタイプ、11SNP。2ファイルは01を相互に逆転したものである。どちらも同じ図が得られる
- sample6.txt
0000000000
0010000000
0011000000
0100000000
0100100000
0100010000
1000000000
1000001100
1100000000
1100000001
1100000011
- 11ハプロタイプ、10SNP
- この9ハプロタイプは4 gamete test陽性であり、組換えが必要なので、複数の木に分かれる
- 4 gamete testは左端の2つのSNPによって起きている。はじめの3ハプロタイプ、次の3ハプロタイプ、次の2ハプロタイプ、最後の3ハプロタイプは、それぞれ、左端が 00 01 10 11である
- 左から3番目とそれより右側のSNPについては、上述の4 gamete testで4つにわけたグループの親 0000000000, 0100000000, 1000000000, 1100000000 に変異が入って生じている。また、その変異は4グループを通じて1回しか発生していないので、4グループはそれぞれ木構造をとる