ニューラルネットワークでのトロピカル幾何

arxiv.org この論文では、ニューラルネットワークでのactivation function をReLUに絞っても、まあ大丈夫、との判断の下、ReLUに絞った上で、ニューラルネットワークの入力から出力への変換がトロピカル幾何・トロピカル・有理関数で表現されることを説明し…

Overleaf用にpubmedからcitation 情報を取り出す

Overleaf qiita.comは、オンライン上でLaTex文書を作るサイト テンプレートもたくさんあるので便利 LaTexなので引用文献も \cite{Yamada2020} と文中に書き込んでおいて、引用文献を書きたい場所に %This is where your bibliography is generated. Make sur…

グラフラプラシアンとPCAと固有値分解

点集合の座標が行列Xとして与えられているとき、そのペアワイズ内積行列は対称行列であり、それを固有値分解し 回転行列Vと非負固有値を対角成分とする対角行列とを使って と分解できる これは、点をVで回転して となるようななる、新しい座標を点に与え、そ…

パラパラめくる『統計学を哲学する』

統計学を哲学する [ 大塚 淳 ]価格: 3520 円楽天で詳細を見る データを取って、手法を適用して、その結果を使う(検定する、推定する、予測する、論文に根拠として書く)とき、統計学・データサイエンスは、何をしてくれているのだろうか、と言うことを、い…

Let’s read the document "sklearn.tree.DecisionTreeClassifier"

scikit-learn.org Click the [https://github.com/scikit-learn/scikit-learn/blob/42aff4e2e/sklearn/tree/_classes.py#L607:title=\[source\]] and check that the information in the website is provided in the source. ソースコードを見てみよう The s…

Decision Tree & Graphviz、pip, conda を使う

Visit this site for the original codes. Start your jupyter notebook ジュピターノートブックを開始する (1) Start your "Anaconda navigator" then select jupyter notebook. アナコンダ・ナビゲータを立ち上げて、そのメニューからジュピターノートブッ…

Add library/package ライブラリ/パッケージの追加 pip, conda

Library > Package > Module Different terms... but, simply speaking, something you can get and use for your study. 名前が色々あるけれど、簡単に言えば、「取ってきて使うもの」 PyPI : Py-thon P-ackage I-ndex pypi.org python's libraries and pac…

Install Anaconda, Anacondaのインストール

Let's use Anaconda。Anacondaを使う www.anaconda.com Why? どうして? (1) It provides basic libraries/packages for data science (numpy, scipy, pandas). データサイエンス用の基本ライブラリ・パッケージが入っているから (numpy, scipy, pandas) num…

numpy.ndarray と Rのapply()

Rの行列で、各行の和を出そうと思ったら M <- matrix(rnorm(100),10,10) apply(M,1,sum) だろう 同じことをPythonでやるのはどうするのかな、と思った Pythonで行列を扱うならnumpyがよいのでそうすることにしたとして 値のセットの和を出すsum()関数を、軸…

RとPythonの両方で使えるplotlyでの3Dスキャタープロットを覚える

Rもpythonもjupyter notebookで文書作成できる 3次元プロットをしなくてよいのなら、Rでは普通の二次元プロッティング関数を使えばよいし、Pythonではmatplotlibを使えばよい 3次元プロットを描いてぐりぐり動かすとなると、Rではplot3dを使い、pythonでは…

ぱらぱらめくる『Nature Reviews Genetics』2020

1細胞データに付加価値(採取場所情報、細胞間関係情報、細胞集合としての分布取得、など)を付ける話が目立つようです。 12月号 Genotype–Tissue Expression (GTEx) 最新の成果についてのコメント。GTExのポータルで検索可能 "The data set of 838 donors an…

離散値の出現順序の独立性を検定する

(非負)整数列(ポアソン乱数、負の二項分布乱数など)が生成されたとする。一見、出現する値はバラバラに見えるが、本当にバラバラなのかについて考えたい これは疑似乱数列のランダム性の評価として、様々な方法が提唱されている(たとえばこちら)問題だが、一…

STRINGのinteraction confidence score

STRINGと言うタンパク-タンパクネットワークデータベース・ツールがある(こちら) タンパク-タンパク間に数値が出てくるのだが、その数値がどう言う由来なのかがわかりにくい こちらのはてなブログの記事 kazumaxneo.hatenablog.com に「STRINGのインタラクシ…

ぱらぱらめくる『熱力学の数理』

熱力学の数理 [ 新井朝雄 ]価格: 4180 円楽天で詳細を見る 熱力学は温度を持った物理学的系が起こす現象を記載する形式である 統計力学の立場から、多数の要素が取りうる状態の多寡と乱雑度とを使って説明されることもある 本書は、そうではなく、巨視的熱力…

乱数製造器としての確率変数

標準正規分布に従う乱数を作ってくれる製造器を標準正規分布確率変数と呼ぶ(と呼ぼう) このように、問いかければ、何かを返してくれるもの、返してくれる何かが問いかけのたびに変わるもの、ただし、そこにはルールがある、そんなものが確率変数(としよう…

エッセンス:量子確率論

こちらで「量子確率論とその応用」をぱらぱらめくった 文書を抜き書きしただけで、特に数式についてはあえて端折った この記事では、数式関連の抜き書きをする 直交多項式は以下のような漸化式で表される ここで、がヤコビ系数列 ヒルベルト空間の正規直交基…

ぱらぱらめくる『量子確率論とその応用』 再び

このPDF『量子確率論とその応用』は、1年ほど前に、読みかじったのだが、消化不良だった。 再読を試みる異にする いつものごとく、自分の興味・目的に引きつけて読む事になるが、1年前と今とで、何が違うかというと、行列の集合を比較することへの興味が強…

ランダム行列とその応用

参考文献

推定。パラとノンパラ

混交正規分布が背景にあるとする パラメトリックに、単純な正規分布を仮定して、推定すると、サンプル数を増やしても、推定結果は1峰性の正規分布であり、背景分布の平均(期待値)と分散は正確になるが、混合正規分布の特徴である複数峰は決して推定されな…

モザイク・キメラ・混合試料のための二項分布Rコード

シークエンサーを使ったSNPタイピングをDNA鑑定に用いるとき、単純なホモ・ヘテロ接合体の分離だけでなく、モザイク・キメラ体個人のそれをする必要に迫られることになる さらに、この課題は混合試料の解析・解釈とも関係する それを考えるためのスラ…

ぱらぱらめくる『Nature Reviews Genetics』2019

毎年やっている、年末の『パラパラめくるNature Reviews Genetics』 今年もやってみましょう 年を経るごとに、細かいことは、ま、いいか、と、雑になっていますが、頑張って参ります 全体の印象としては: 昨年までなどは、「現象」に関する総説が多かったよ…

正規分布、多次元正規分布、カイ二乗分布とその自由度、Non-centrality

講義内実習

混合正規分布のEMアルゴリズム推定

線形回帰をリサンプリングでやってみる

線形回帰式はデータセットから1つ得られる ばらつかせたい データセットは一つしかないので、リサンプリングすることで、データセットの疑似バリエーションを作るとする 標本の一部を取り出してみる場合と、標本と同数の標本を重複アリなリサンプリングして…

歩幅1の酔歩

d次元空間を原点から出発して、歩幅を1に固定して歩き回ることにする k歩目での原点からの距離の期待値はいくつになるかをシミュレーションで計算してみる に収束するらしい

ガウシアンカーネル、カーネル・トリック

カーネルトリックというのがある カーネル関数を使って、データの次元を上げてやり、上げた次元で簡単な処理(線形処理)をした結果を返すことで、データのオリジナルな次元空間での非線形な出力を得るような時に使うのだが、トリックなのは、上げた次元での…

ディリクレ過程混交正規分布様球面分布

球面に粗密がランダムな点を取りたい ディリクレ過程で定まる無限項の多項分布を想定し、個々の項に対応して球面正規分布様のそれを取る ただし、球面積分布様のそれ、とは、球面上の一様乱点を接点とする接面に、接点を中心とした2次元正規分布をとる。その…

疑似1細胞発現データを作る

複数の細胞からのデータがある 細胞数が分かっている リード数を細胞数に分けて、疑似1細胞発現データを作りたい sample()関数を使って疑似作成できることを示し # 検体数 N # ある遺伝子のNGSリード数が Mだった # m1 + ... + mN = M; mi >= 0となるような…

Traceが1の自己随伴行列。そのpure stateとmixed state

Traceが1の自己随伴行列で固有値がすべて非負のものは、密度行列と呼ばれ、固有値が確率を、固有ベクトルが対応する(離散的)状態を表している このような行列のうち、単位ベクトルの複素共役クロネッカー積([tex:|x> Methods of Information Geometry (Ta…

generalized procrustes analysis

多変量解析の1つ 多検体・多変量情報があったときに、それを一括して処理して、多検体の「平均」を求める 多変量情報については、値の伸び縮みをさせたりする 空間座標が多変量情報の場合には、回転させたりもする そのようにして、「位置合わせ」をして、…