GC-MSのアラインメント

  • 論文 Combining peak- and chromatogram-based retention time alignment algorithms for multiple chromatography-mass spectrometry datasets
  • GC-MSは2次元データ。その実験を複数やると、シグナルピークの出現位置に実験間のずれが出るので、結果の比較が難しくなる
  • 2次元は、溶出時間(Retention time, RT)とイオン化質量(mz)との2軸だが、RTが問題になる
  • 論文では2方法
    • BIPACE
      • 両方向性に最適ヒットするピークを合わせてそこからヒットする領域を拡大する
      • BI-directional best hit P-eak A-ssignment and C-luster E-xtension
    • CeMAPP-DTW
      • ペアワイズに部分ごとに・DTWすることで、中心を構成するレファレンスを選び、そこを中心にマルチアラインメントする
      • CE-nter star M-ultiple A-lignment by P-airwise P-artitioned D-ynamic T-ime W-arping
  • BIPACEで探索領域を狭めたうえでCeMAPP-DTWをかけるとパフォーマンスがよい、という主張
  • BIPACE
    • 溶出時刻ごとにmz値とそこでのシグナル強度がある(時刻ごとのそれをpeakと呼ぶことにする)
    • ピーク間の類似度評価関数を定義する
    • 異なる標本からのピーク同士の類似度を全ピークで産出する
    • これを基に、合わせてもよい時刻(のペア)の候補を選ぶ(ここでbidirectional)
    • 複数の標本のそれぞれから1時刻ずつを取り出して、その組(クリーク)として一致の良いものを選ぶ。全部の標本でそれができれば完璧だし、一部の標本のそれでも致し方ないが、よい組み合わせを記録する
  • CeMAPP-DTW
    • DTWでペアワイズなグローバルアラインメントをする(適切な対角線に近い折れ線を得る)
  • フローは論文のFig4screenshot