2013-02-08から1日間の記事一覧

wget + フリーソフト

wgetで階層の深さの指定(今は表層の1層だけ)をとってきて、 それを、おおまかにhtmlタグをとるべく、こんなフリーソフト(H2Tconv)を使ってテキストファイル化してしまうことにする wget on Windowsはこちら) H2Tconvはこちら Wikipediaはありがたいことに…

zimHttpServer.pl

Wikipediaの圧縮・配布・再利用にhoge.zimというファイル形式があることを昨日書いた このzimファイルを読むアプリをzim readerと呼んでKiwixもその一つ Wikipediaらしくオープンソースで進められているOpenZim 記事のテキスト部分だけがほしいので、整形す…