2013-02-01から1ヶ月間の記事一覧

データ解析手法を確認する

こちらに『私がたどりついた英語論文の読み方』というとてもよい記事がある。これをまねて、データ解析手法の読み方について書いてみる 目的 2通り 解析したいデータを出してくる実験が決まっている 実験は決まっていないけれども解析のやり方に興味がある …

wget + フリーソフト

wgetで階層の深さの指定(今は表層の1層だけ)をとってきて、 それを、おおまかにhtmlタグをとるべく、こんなフリーソフト(H2Tconv)を使ってテキストファイル化してしまうことにする wget on Windowsはこちら) H2Tconvはこちら Wikipediaはありがたいことに…

zimHttpServer.pl

Wikipediaの圧縮・配布・再利用にhoge.zimというファイル形式があることを昨日書いた このzimファイルを読むアプリをzim readerと呼んでKiwixもその一つ Wikipediaらしくオープンソースで進められているOpenZim 記事のテキスト部分だけがほしいので、整形す…

Biomedical text mining

医学・生物学領域ではpubmed,MeSH,オントロジーなどテキストマイニングが進んでいる。それをBoimedical text miningと呼び、Wikiの記事としても独立しているようだ こちらなどで、テキスト情報のハンドリングをしている そのこころは、今のところ、こんな感…

15世紀の骨のDNA鑑定

人骨がRichard IIIとDNA鑑定されたそうだ。脊柱の彎曲も傍証のようだが「子孫から採取したDNAによる鑑定が決め手」と日本の新聞にはある(こちら)。 イギリスBBC(こちら)では"Turi King, leader of the DNA team, said she completed her work confirming …

証拠

DNA鑑定は法的な証拠として使われる 法的な証拠について、どんなことがどんな風に言われているのかをチェックしてみる Legal burden of proofというWiki記事がある 証拠やその信憑性・利用については、文化や歴史も絡み複雑怪奇・曖昧模糊・魑魅魍魎、的な印…

ぱらぱらめくる『Statistics in Criminology and Criminal Justice: Analysis and Interpretation』

だいたいわかった(Wikiではわからない、ということが)ので、本を読むことにする これは、法・裁判関連を専門にする人のための、「簡易統計学入門」だった。 Statistics in Criminology and Criminal Justice: Analysis and Interpretation作者: Jeffery T. W…

メモ

こちらに書いた2013/02/01の研究会でMDR minimum description length (最小記述長)の話を聞きました。 離散化誤差に対する対処、として、こんな記述(数値計算と離散化、そもそも離散化)があります これに関してこんなPDFがありました MDRは情報系の方法・圧…