Milestone 21

  • 21. ENSEMBL-an example of a gene annotation tool
  • ゲノム上に遺伝子がコードされていることは、「予測」されている
  • もっとも初期にはORFにあてはめることから始まり、コーディング領域と非コーディング領域との配列特性の違いを利用するようになった
  • このやり方はパターン認識問題であり、linear-discriminant analysis、マルコフ連鎖モデル、ニューラルネットワークの手法を使っている
  • イントロンのある真核生物遺伝子の場合には、エクソン-イントロン境界の予測があり、原核生物の場合より問題が複雑化する
  • 予測プログラムに学習機能を持たせることも
  • 最新の予測プログラムはEnsembl や Gnomonなどがあり、これらは、cDNA配列、タンパク配列等の蓄積的データを利用している