GC-MSのアラインメント
- 論文 Combining peak- and chromatogram-based retention time alignment algorithms for multiple chromatography-mass spectrometry datasets
- GC-MSは2次元データ。その実験を複数やると、シグナルピークの出現位置に実験間のずれが出るので、結果の比較が難しくなる
- 2次元は、溶出時間(Retention time, RT)とイオン化質量(mz)との2軸だが、RTが問題になる
- 論文では2方法
- BIPACEで探索領域を狭めたうえでCeMAPP-DTWをかけるとパフォーマンスがよい、という主張
- BIPACE
- 溶出時刻ごとにmz値とそこでのシグナル強度がある(時刻ごとのそれをpeakと呼ぶことにする)
- ピーク間の類似度評価関数を定義する
- 異なる標本からのピーク同士の類似度を全ピークで産出する
- これを基に、合わせてもよい時刻(のペア)の候補を選ぶ(ここでbidirectional)
- 複数の標本のそれぞれから1時刻ずつを取り出して、その組(クリーク)として一致の良いものを選ぶ。全部の標本でそれができれば完璧だし、一部の標本のそれでも致し方ないが、よい組み合わせを記録する
- CeMAPP-DTW
- DTWでペアワイズなグローバルアラインメントをする(適切な対角線に近い折れ線を得る)
- フローは論文のFig4