Spidering hacks

最近仕事で、ってか今日だけど、
LWP::UserAgent使って、HTML::Parserつかって
もりもりスクレイピングしてました、
楽勝かなぁと思ってたけど、RSSとかと違ってHTMLをもりもりパースするのは
激しく面倒だなぁと改めて実感。
XML形式はやっぱ楽だよなぁ。まあそれもCPANあってのことなんだけど。
むーってかもっと楽できそうな気がするんだよなぁ。

Spidering hacksはそれ系のネタ満載だからお勧めですね。
この週末読み直そう。
週明けも変なHTMLたちと戦うのかぁ。。
100%でなく60%くらいで頑張ろう(謎

Spidering hacks―ウェブ情報ラクラク取得テクニック101選
Kevin Hemenway Tara Calishain 村上 雅章
オライリー・ジャパン
売り上げランキング: 4,316
おすすめ度の平均: 4.57
2 初心者は買っても無駄
5 『Hacks』の白眉
5 混沌のWEBからデータを収集した人は必読

Perlデータマンジング―データ加工のテクニック集
デイビッド クロス David Cross 宮川 達彦
ピアソンエデュケーション
売り上げランキング: 4,803
おすすめ度の平均: 4.5
4 便利なすぐ使えるイディオム満載
5 一課に一冊