2013-02-01から1ヶ月間の記事一覧
こちらに『私がたどりついた英語論文の読み方』というとてもよい記事がある。これをまねて、データ解析手法の読み方について書いてみる 目的 2通り 解析したいデータを出してくる実験が決まっている 実験は決まっていないけれども解析のやり方に興味がある …
wgetで階層の深さの指定(今は表層の1層だけ)をとってきて、 それを、おおまかにhtmlタグをとるべく、こんなフリーソフト(H2Tconv)を使ってテキストファイル化してしまうことにする wget on Windowsはこちら) H2Tconvはこちら Wikipediaはありがたいことに…
Wikipediaの圧縮・配布・再利用にhoge.zimというファイル形式があることを昨日書いた このzimファイルを読むアプリをzim readerと呼んでKiwixもその一つ Wikipediaらしくオープンソースで進められているOpenZim 記事のテキスト部分だけがほしいので、整形す…
医学・生物学領域ではpubmed,MeSH,オントロジーなどテキストマイニングが進んでいる。それをBoimedical text miningと呼び、Wikiの記事としても独立しているようだ こちらなどで、テキスト情報のハンドリングをしている そのこころは、今のところ、こんな感…
人骨がRichard IIIとDNA鑑定されたそうだ。脊柱の彎曲も傍証のようだが「子孫から採取したDNAによる鑑定が決め手」と日本の新聞にはある(こちら)。 イギリスBBC(こちら)では"Turi King, leader of the DNA team, said she completed her work confirming …
DNA鑑定は法的な証拠として使われる 法的な証拠について、どんなことがどんな風に言われているのかをチェックしてみる Legal burden of proofというWiki記事がある 証拠やその信憑性・利用については、文化や歴史も絡み複雑怪奇・曖昧模糊・魑魅魍魎、的な印…
だいたいわかった(Wikiではわからない、ということが)ので、本を読むことにする これは、法・裁判関連を専門にする人のための、「簡易統計学入門」だった。 Statistics in Criminology and Criminal Justice: Analysis and Interpretation作者: Jeffery T. W…
こちらに書いた2013/02/01の研究会でMDR minimum description length (最小記述長)の話を聞きました。 離散化誤差に対する対処、として、こんな記述(数値計算と離散化、そもそも離散化)があります これに関してこんなPDFがありました MDRは情報系の方法・圧…