01 Transcription factor motifs :駆け足でサーフする『ENCODE explorer (nature)』
- サイト(01)
- 転写因子結合部位モチーフ(配列のパターン)
- 実験設定
- DNA-binding proteins 119個
- 72 cell typesとそれらが持つ多数のRNA polymerase構成因子
- ChIP-seq
- 結果概要
- 87/119個のDNA-binding proteingsが配列特異的転写因子(TFSS:Transcription Factor Sequence-Specific)
- 636,336調節配列が231Mbに渡って存在
- Binding sitesはDNA-bindingモチーフを持っているものが大多数で、そのうちの多くは既知のモチーフだったが新規モチーフも認めた
- 個々のTFについての検討
- Transcription factors(TF) x cell lines の表がFactorbook
- どのTFがどのcell lineで検出されたかを示す。検出した実験数が記されている
- 個別のTFについてのページにリンクしていて、以下が提示される
- 基本情報・データベースID
- 実験別のChIP-seq peak分布(binding-siteの転写開始点からの相対的距離分布)に関する情報
- MEME-ChIP(アプリケーション)によるモチーフ配列とそのsequence logo、検出モチーフ間の頻度比較
(Wikipedia Sequence_logoより)
-
-
- ヒストンの修飾状態図
-
- Binding sitesの配列保存性
- Binding sites とBinding sitesの配列をシャッフルしたものと、Binding sitesの近傍の配列とで比較
- モチーフ内位置のInformation contentが高いほど、多型・変異は少ないという関係がある(関係は、バイオリンプロットで示すのが適切な、単純ではない分布)
library(vioplot) # 2峰性のデータを作成 x <- c(rnorm(100),rnorm(200,5)) # ただの箱ヒゲ図では2峰性であることは描けないがバイオリンプロットなら描ける vioplot(x)
- TFが結合していることと実際に発現機能を有していることの対応関係(それほど単純ではない。セルラインでもあるし…)
- TFモチーフもprimaryとsecondaryとに(少なくとも)なっていると考えるとよさそう
- モチーフの強弱
- 新規モチーフも見つかった
- 複数のTFによる協調制御
- 細胞タイプ-specificな協調制御
- 複数TFの協調メカニズム2態
- 近傍DNA配列に結合
- 合体して1箇所のDNA配列への結合しやすさを調整
- 同一TFペアの協調したりしなかったりのばらつき
- Circosプロットで協調関係
- RCircosなら
library(RCircos); data(UCSC.HG19.Human.CytoBandIdeogram); data(RCircos.Link.Data); cyto.info <- UCSC.HG19.Human.CytoBandIdeogram; chr.exclude <- c("chrX", "chrY"); num.inside <- 5; num.outside <- 0; RCircos.Set.Core.Components(cyto.info,chr.exclude, num.inside, num.outside); RCircos.Set.Plot.Area(); RCircos.Chromosome.Ideogram.Plot(); track.num <- 2; RCircos.Link.Plot(RCircos.Link.Data,track.num, TRUE);