X染色体用のペアワイズLD計算
- ベータ版扱いです。ファイルはかなり重いですので、アクセスには忍耐が必要かも知れません(重いのは、EMのiteration 5000回分のところ)。
- X染色体は、男に1本、女に2本ありますので、ハプロタイプ推定にあたっては、観測データにつき、女のデータは2本分、男のデータは1本分として重み付けをしてカウントします。
- ただし、X染色体には、pseudoautosomal regionsと呼ばれる領域があり、この領域はY染色体に相同領域があり、男女ともディプロイドになっているので、その領域の解析には、常染色体と同様の解析を行います。pseudoautosomal regionsでは男でも多型のヘテロ個体が存在するのに対し、それ以外の領域では、ハプロイドなのでジェノタイプは"ホモ"のように観測されます。たとえば、HapmapのCEUの公開データにて、男のヘテロ観測人数を縦軸に、X染色体上の位置を横軸にプロットすると以下のようになります。
これは、pseudoautosomal regionsはX染色体の両端にあるという事実と符合します。以下では、X染色体と書いたものは、このpseudoautosomal regionsを除いたX染色体領域のこととします。
- X染色体の男女混成サンプルのジェノタイプデータを用いて、EMアルゴリズムによるLD計算
- 非家系データの場合
- トリオデータの場合
- 両親の3本の染色体について計算する。
- 父親の1本の染色体のタイプは、父親のジェノタイプのみを用いて決定する。父親がヘテロの場合は、タイピングエラーとみなして計算から排除する
- 母親の2本の染色体のタイプは、2SNPの両方がヘテロの場合以外は、子供・父親のジェノタイプデータによらず、自身のジェノタイプのみを用いて決定する。
- 母親のジェノタイプが2SNPの両方でヘテロの場合には、次のようにする。
- 子が男の場合
- 子が女の場合
- 父親がホモの場合
- 父親がヘテロ(タイピングエラー)の場合
- 父親がホモの場合
- 上記のように、メンデルの法則への合致・非合致の判断は、子が息子か娘かで異なるので、入力フォーマットは、両親-息子用と両親-娘用の2パターンに分かれている。
- 子が男の場合
- 非家系データの場合
X染色体トリオデータ、方法1
■1トリオあたり、父1本、母2本の計3本の染色体情報を用いる
■父のハプロタイプは常に確定する
■母の2SNPの複合ジェノタイプが9タイプのうち、決定的8タイプの場合は、それに従って振り分ける
■母がダブルヘテロの場合には次の手順を踏む
●子が男の場合
→子の2SNP複合ジェノタイプが適正(ダブルホモ)の場合。確定する。
→子の2SNP複合ジェノタイプが不適切な場合。不確定。母の染色体2本について通常のEMにおける分配規則を適用する群とみなす(Undet)
●子が女の場合
→父母子トリオのジェノタイプ関係が、メンデルの法則を満足するかどうかを判断する
→満足しないとき:娘の染色体の1本は母から伝達されたものとみなして、母の2本の染色体を分配する。
→娘がダブルホモのとき、確定する。
→娘が半ヘテロのときは
→AABbのとき、AB/ab vs Ab/aBをAB vs Abで分配する
→aaBbのとき、AB/ab vs Ab/aBをaB vs abで分配する
→AaBBのとき、AB/ab vs Ab/aBをAB vs aBで分配する
→Aabbのとき、AB/ab vs Ab/aBをAb vs abで分配する
→娘がダブルへテロのときは
→AB/ab vs Ab/aBをAB^2*ab+AB*ab^2 vs Ab^2*aB+Ab*aB^2で分配する
→満足するとき:確定する。