Data Structure for Human Cell Atlas-like Project

  • 昨日の記事でHuman Cell Atlasのことを書いた
  • 例 Example
    • Aさんの臓器Bから臓器片Cを取り出し、1細胞にばらして/臓器片中の相対的位置情報を取りつつ、細胞集合{d_1,...}とし、個々の細胞について1細胞オミクス解析をして、ゲノム・エピゲノム・トランスクリプトーム・プロテオームデータを取得した Assume you take a piece C of an organ B of a person A. You dissect C into a set of cells {d_1,...} with or without obtaining location information of them in C.
    • Aさんは個人属性を持つ(身長・体重など、受精からの時間) A is an individual with attributes that belong to A but not belong to parts of A (e.g., height, weight, time since fertilization)
    • 臓器Bは臓器属性を持つ(大きさ・形状、機能等) The organ B also has its attributes (size, shape, function etc.)
    • 臓器片Cは臓器片属性を持つ(顕微鏡画像からの評価値等) A piece C has its own attribute such as measures based on its microscopic observation.
    • 個々の細胞d_iは、一塊データセットとしてのオミクスデータをオミクス層ごとに持つ。臓器片中の位置情報を持ちうる。臓器片に認めるパターンに照らした空間的情報を持ちうる。臓器片の顕微鏡画像などに基づく細胞形状データを持ちうる。
  • 何が情報となっているか Each cell d_i has a set of values that is a omics data for multiple omics layers. Cells may have spatial information in C. The spatial information may be one based on patterns in C. The cells themselves also may have morphological information
    • Aさんとは What A is
      • Aさんとは、受精卵から始まり、死亡するまでの存在であり、時空間的存在。時空間的存在は、ある時刻にその全体・もしくは部分について観測し、その観測結果を記録することができる A is a physical existence that starts at the fertilization and ends with its death. A is a spatio-temporal existence. We observe the whole A or parts of A at some particular time points.
    • 臓器Bとは何か What B is
      • 時空間的存在の部分のことで、慣用的に、「B〜呼称」というカテゴリカルデータ型によって定められる部分のこと。Aさんの時空間において、空間的な部分であり、時間的には連続的である。ただし、時間的には連続ではあるが、Aさんの生涯の全期間に存在するものではない B is also a spatio-temporal existence. However, B is a part of A. B's chronological period is a subset of one of A. The name B is a category.
      • 臓器には、臓器全体に関する情報(大きさ・形・性状など)があり、それは臓器の属性である B has its own attributes that belong to B but not parts of B.
      • また、臓器は複数あり、複数の臓器の間には関係を定めることができる There are relative spatial relationship among organs.
        • 解剖学的な位置関係、脈管支配に関する相対的関係などである The spacial relationship may be given by anatomical structure and/or vascular structure.
        • したがって、臓器は個体に対してカテゴリカルであるが、複数臓器を順序なしカテゴリとみなすことが適当な場合もあれば(この場合は単体として表す)、グラフ構造・包含構造を入れることが適当な場合もある Organ name labels are categorical. The categorical labels can be non-ordered (simplex representation) or structured categories whose structure may be represented by graphs and/or sets with inclusion relationship.
    • 臓器片Cとは何か What a piece of organ C is
      • 臓器Bの部分集合であり、細胞の塊、もしくは、細胞の集合 C is a subset of B. C is consisted of cells and a set of cells.
      • Bにおける相対的位置は、ユークリッド空間的にも与えうるし、解剖学的な位置(構造を(グラフ化してそのグラフ上のノード等に)対応付ける)ことも可能 The relative location of C in B can be expressed in Euclidean way or anatomical way.
      • 顕微鏡観察の対象になりえる。そのことは、顕微的構造・パターン情報を取れることを意味する。パターン情報などは二次的属性になるだろう C can be observed by microscopy and structures and patterns can be identified as its attribute. The information might be secondary.
      • この顕微鏡所見には「悪性」「正常」等の「臓器片全体」に関する属性がある Malignant or normal is an attribute of the whole piece.
    • 細胞集団Dとは何か What the cell population D
      • 臓器片Cに存在する細胞集合。C中の位置情報を取りえるし、その位置情報はユークリッド空間的にも取れるし、解剖学的な位置(構造・パターンに基づく相対的関係)を取りえる。また、画像データにより個々の細胞の形態属性も取れる D is a set of cells in C. Location in C is observable and the location can be in Euclidean or in anatomical way. Individual cell's morphological information can be taken.
    • 細胞d_iとは何か What a cell d_i is
      • 1個の細胞。1細胞分子オミクス解析の対象。解剖学的・機能的な属性を持ちうる。細胞間の相対的位置関係情報を持ちうる A cell. The target of single cell-molecular omics analysis. It can have its won anatopical/functional attributes. Relative spatial relation among cells can be recorded.
    • 分子オミクスデータとは何か What molecular omics are
      • 共通項で括りうる、多数の観察対象の集合に対して、一括して測定して得られるデータ。多数の観察対象は、細胞内構造的情報を属性として持つことがある。特に、DNA配列に結びづく観察対象は、DNA配列という1次元空間を複数集めた(複数のDNA分子・染色体)上での位置情報を持つ。また、分子内局在情報を取得することもあり、その場合には、観察対象と言うよりは、観察対象のインスタンスとしての分子の位置情報が得られる Omics data sets are the value sets of items that are elements of set and the observations are performed at the same time. The items can be distinct and independent but sometimes they are mutually related via their attributes such as spatial information. In particular, omics elements that are connected to DNA sequence should be handled with their relative location on DNA molecules/chromosomes. Also the omics observation can measure individual element instance ( physical molecule to be observed) with their location intracellular.