RSS

HTML::TableExtractを使った

    付与されたタグ:
  • Perl

今日はPerlの話。HTMLのスクレイピングをするときにtableに特化したライブラリ。テーブルのヘッダを見てとかいろいろあるようだが,そんなものはめんどくさいので数値で指定。次のようなコードとなる。

1段入れ子になったテーブルの最初のテーブルということになる。はっきり言ってこんなことならXPath使ったほうが楽だな。いや,他のモジュールが使ってないから使わないほうがいいのかなと思っただけ。