MutationString出力概要



  • VGJというグラフ理論用のアプリケーションが組み込まれており、その図として出力される
  • 図はVGJのメニューバーから"File"→"Save"もしくは"Save As"として保存できる。保存したファイルは"File"→"Open"で再度図表示できる
  • VGJによる図(グラフ)
    • 入力ファイルのハプロタイプがノード(頂点)で、ハプロタイプハプロタイプの間に発生した変異がエッジ(辺)で表される
    • ノードはあるハプロタイプに変異が入った「変異体」の場合には紫で、それ以外は「黄色」で表される
    • ノードのハプロタイプはノードの下に表示される
    • エッジは1箇所の変異に相当するが、変異が発生した塩基番号が表示される
    • Scale/2,Scale=1,Scale*2ボタンで拡大・縮小を適宜行うことができる
    • すべてのノードが円周上に配置される。VGJウィンドウの"Select Nodes"ボタンをクリックし、任意のノードを選択した上で、メニューから"Algorithm"→"Tree"を選ぶと、選択したノードとそれから派生したハプロタイプがツリー上に表示される
    • 変異はParsimonyで決定されており、また、Infinite site modelを用いているので、ある塩基位置に2回以上の変異は起きないように処理されている
    • すべてのSNPアレルが0のハプロタイプのノードには、"Node X"というラベル表示がされる。これを消すには、メニューバー→Properties→Use Node ID As Default Labelの選択を解除する
  • 出力サンプル
    • いくつかの例を示す
  • sample1.txt

0000
0010

  • sample2.txt

0000
0011

  • sample3.txt

0000
0011
0010
0001

    • ハプロタイプ、2SNP
    • この4ハプロタイプは4 gamete test陽性であり、Infinite site modelにおいては組換えを考慮しないと説明できない。したがって、図では、4ハプロタイプのいずれもが独立して黄色いノードとして表示される

  • sample4.txt

00000000
00001000
00001010
00001001
00001101
10000000
10100000
11000000
11010000

  • sample5.txtとsample5_01Inv.txt
    • sample5.txt

0000000000
0010000000
0011000000
0100000000
0100100000
0100010000
1000000000
1000001100
1100000000
1100000001
1100000011

    • sample5_01Inv.txt

1111111111
1101111111
1100111111
1011111111
1011011111
1011101111
0111111111
0111110011
0011111111
0011111110
0011111100

    • ハプロタイプ、11SNP。2ファイルは01を相互に逆転したものである。どちらも同じ図が得られる

  • sample6.txt

0000000000
0010000000
0011000000
0100000000
0100100000
0100010000
1000000000
1000001100
1100000000
1100000001
1100000011

    • 11ハプロタイプ、10SNP
    • この9ハプロタイプは4 gamete test陽性であり、組換えが必要なので、複数の木に分かれる
    • 4 gamete testは左端の2つのSNPによって起きている。はじめの3ハプロタイプ、次の3ハプロタイプ、次の2ハプロタイプ、最後の3ハプロタイプは、それぞれ、左端が 00 01 10 11である
    • 左から3番目とそれより右側のSNPについては、上述の4 gamete testで4つにわけたグループの親 0000000000, 0100000000, 1000000000, 1100000000 に変異が入って生じている。また、その変異は4グループを通じて1回しか発生していないので、4グループはそれぞれ木構造をとる