iPOP特徴量抽出・相関検出
- こちらの論文(Personal Omics Profiling Reveals Dynamic Molecular and Medical Phenotypes )
- データ解析に関しては、Experimental ProceduresのExtended タブ(こちら)
- 以下、その手順
- データを収集
- 時系列で
- データのタイプ
- 解析の枠組み
- 上記のタイプごとにデータをQC
- タイプを越えて(multi-omicsで)解析
- タイプごとの処理
- 扱うための情報集約
- 扱うための加工
- ノイズに埋もれているとみなせるものを排除
- 時系列解析に耐えないもの(複数の観測時点で値が取れていないもの)を排除
- 意義のあるもののみを残す
- FDR処理など
- 扱うための標準化
- 経時処理
- 多数の観測時点がある場合には、フーリエ変換して、周期的要素に分解(periodogramを作成)して、periodogramの特徴量を解析対象とする
- 多数の観測時点があって、周期的反応を見たいときなどは、(こんな感じ)
- 時点数が少ないとき
- すべての時点について単調増・単調減を考えているときは、(線形)回帰など、単純なものを
- 初期スパート、後期減衰など、一定のパターンを想定しているときは、そのパターンごとに時点の順序を入れ替えて、(線形)回帰など
- 仮説フリーで行うなら、全時点の順序を無視して
- 各論
- その他
- 複数サンプルの場合
- 本論文は、1個人の経時的プロファイル
- 複数人の経時的プロファイルの場合には、個人を分類するラベル(フェノタイプなど)の情報を加えたり、その上で、さらに個人ごとに異なる挙動を考慮したければ、(個人に関する)ランダムエフェクトを入れた上で、適宜、回帰などを(参考→こちら
- 複数サンプルの場合