2008-04-01から1ヶ月間の記事一覧
群・環・体入門作者: 新妻弘,木村哲三出版社/メーカー: 共立出版発売日: 1999/02/01メディア: 単行本購入: 5人 クリック: 50回この商品を含むブログ (15件) を見る群と表現 (理工系の基礎数学 9)作者: 吉川圭二出版社/メーカー: 岩波書店発売日: 1996/10/18…
自作関数を作った後、Rを立ち上げて、それを読み込むのは簡単だ。でもいちいち読み込むのも面倒だ。何かよい方法がRwikiなどにないかと探したが、うまい記載に行き当たらないので、少し調べてみた。 Rでsearchpaths()というコマンドを打つと、(どうも)R起動…
行列サンプルを置いてあるサイト(こちら) Matrix market で用いられている、行列の書式はこちら Matrix market coordinate format 非0要素を、その行・列・値の3値の組で記載したフォーマット たとえば、疎な行列(0が多い行列)では、nxm行列の全要素を記す…
高次元データは、データベクトル間の距離の短いものをまとめるというクラスタリングの基本において、不適切な結果へ導きやすくするという問題を持つ。これを解決するために、データベクトルの特性を失わずに次元を小さくすることが効果的であり、それを次元…
データをグラフのノードとし、データ間の類似度をエッジで表現する。このとき、クラスタリングは、グラフからエッジを取り去り(cut)、いくつかの部分グラフに分ける作業にあたる。クラスタリングの評価は、取り去るエッジが少なく、残った部分グラフが密であ…
データの背景に複数のモデルがあり、そのモデルのいずれかによって、観測データのそれぞれは得られ、観測における誤差によって、全データの分布が説明できるとみなす 個々のモデルを、期待値ベクトルで表し、そこからの誤差を多次元正規分布によって近似する…
クラスタ数 k を与える k個のクラスタの中心を仮に与え、データ点を、一番近い中心のクラスタに帰属させる k個のクラスタ中心を帰属した点の重心として再定義し、データ点の帰属クラスタを再定義する 全データ点の帰属クラスタが変わらなくなるまで繰り返す …
Rで学ぶクラスタ解析作者: 新納浩幸出版社/メーカー: オーム社発売日: 2007/11/01メディア: 単行本購入: 9人 クリック: 207回この商品を含むブログ (29件) を見る
全要素を別個のクラスタとした段階から、クラスタ間の距離がもっとも近い2つのクラスタを1つのクラスタとみなす、という処理を繰り返し、最終的に1つのクラスタに纏め上げ、その過程で作ったクラスタの包含関係をクラスタ構造の全体とする手法 クラスタ間…
データのベクトル化と重み付け TF*IDF(term frequency-inverse document frequency) public static double[][] tfidf(double[][] vs, int type){ /* * type=0 log(N/n) * type=1 log((N+1)/n) */ double[][] ret = new double[vs.length][vs[0].length]; int…
クラスタリング手法の分類 階層的手法と非階層的手法 ソフトクラスタリング手法とハードクラスタリング手法 クラスタリング結果の評価方法 F値 エントロピー 純度 精度 クロス表の作成 > a<-c(1,2,3,1,2,3,1,2,3) > b<-c(1,1,2,2,1,1,3,3,2) > t<-table(a,b)…
Rが得意とするベクトルと行列というデータ形式に特化した短い記載だが、非常によくまとまっている > (a<-matrix(c(1:30),nrow=5,byrow=TRUE)) [,1] [,2] [,3] [,4] [,5] [,6] [1,] 1 2 3 4 5 6 [2,] 7 8 9 10 11 12 [3,] 13 14 15 16 17 18 [4,] 19 20 21 22…
表題の4つのキーワードで、何かツールがないか、と質問された。 久しぶりに系統樹について考えた。配列間距離の推定もベイズなのだ、と。。。 確率論を入れるとしたら、『樹の形』についての信頼区間(それを信頼区間と呼ぶかどうかは別として)を持たせた出…
NxMテーブルがある。 N個+M個の周辺度数の最大値をmとする。の自由度は f=(N-1)x(M-1) 自由度fの確率密度格子はf次元ユークリッド空間中の、辺の長さをm+1とするf-単体状の格子として表現できる。 格子の各点は、このテーブルの周辺度数を満足するテーブル…
オイラー探検-無限大の滝と12連峰 (シュプリンガー数学リーディングス)作者: 黒川信重出版社/メーカー: シュプリンガー・ジャパン株式会社発売日: 2007/10/03メディア: 単行本 クリック: 19回この商品を含むブログ (9件) を見る 素因数分解の一意性によって…
以前、こんな記事を書いた。 A novel method to express SNP-based genetic heterogeneity,Ψ, and its use to measure linkage disequilibrium for multiple SNPs, Dg, and to estimate absolute maximum of haplotype frequency用あって、これの、日本語の…
生命の数理作者: 巌佐庸出版社/メーカー: 共立出版発売日: 2008/02/22メディア: 単行本購入: 5人 クリック: 58回この商品を含むブログ (10件) を見る 遺伝現象に関する数理解析のほかにも、数理解析されるものは(たくさん)ある 細胞増殖、生化学反応・酵素反…
コンピュータグラフィックス作者: コンピュータグラフィックス編集委員会出版社/メーカー: CGーARTS協会発売日: 2006/03/01メディア: 単行本購入: 5人 クリック: 67回この商品を含むブログ (19件) を見る デジタルカメラ、デジタルカメラモデル、モデリング…
基本群と写像類群 基本群は、基点へループを引きよせようとするときの障害についての代数的記述といえる(そうだ)。この障害を絵にすることは、幾何学的表現になる(のか?) 写像類群は、自己写像を恒等写像に変形する過程で遭遇する障害についての代数的記述…
裏返しを絵で見せることの章
だまし絵 だまし絵は、ユークリッド3次元空間に実現不可能なすがたを2次元に描いて、さも、実現可能であるかに見せるもの 多様体の絵 多様体は、ユークリッド多様体として実現可能なもので、それは、2次元空間で描くと、3次元空間に実在しないけれども実…
遠近感を出す
正しく描くことと分かりやすく描くこと 図法トポロジーの構成要素をその座標(とその写像)どおりに描くよりも、伸ばしたり強調したりして描くことが適切なことがある 輪郭稜と側面稜 隠れた面と隠れていない面とを分ける稜が輪郭稜 見えている2枚の面をただ…
図法トポロジー Descriptive topologyの構成要素 (境界線を持った)正規曲面 2重線 3重点 ピンチ点 カスプ(cusp) 輪郭線 その他の用語 一般の位置 安定(な写像) 母線 線織面 埋め込まれている(embedded)、はめ込まれている(immersed)
トポロジーの絵本 新装版 (シュプリンガー数学リーディングス)作者: G.K.フランシス,笠原晧司,宮崎興二出版社/メーカー: シュプリンガー・フェアラーク東京発売日: 2005/12/01メディア: 単行本購入: 1人 クリック: 26回この商品を含むブログ (7件) を見る小…
ローマン曲面 n次元射影空間は、n+1次元ユークリッド空間の原点を通るすべての直線の全体である このメビウスの輪は、幅がないけれども、「表と裏」はあって、黒が表、青が裏。黒い直線上の丸点から、四角点の方向に歩き出した1次元空間上のヒトは、四角点…
ハムサンドイッチ定理
いくつかの発展のためのコメントがあるが、このブログの性格上、もっとも発展が望ましい方向は 「離散幾何学と組合せ幾何学」への発展で、参照文献はこちら組合せ幾何学のアルゴリズム作者: Herbert Edelsbrunner,今井桂子出版社/メーカー: 共立出版発売日: …