HTML::TableExtractを使った
-
付与されたタグ:
- Perl
今日はPerlの話。HTMLのスクレイピングをするときにtableに特化したライブラリ。テーブルのヘッダを見てとかいろいろあるようだが,そんなものはめんどくさいので数値で指定。次のようなコードとなる。
1段入れ子になったテーブルの最初のテーブルということになる。はっきり言ってこんなことならXPath使ったほうが楽だな。いや,他のモジュールが使ってないから使わないほうがいいのかなと思っただけ。