RSS

lxmlテスト

Pythonのscrapingライブラリのlxmlをちょっとテスト。

    付与されたタグ:
  • Python
#!/usr/bin/python

from lxml.html import fromstring
lh = fromstring(file('2007.shtml').read())
for i in lh.xpath('//a[img[@src="foo.jpg"]]'):
        print i.values()
こんなかんじ。なるほど。