現在位置: ホーム 日々のメモ書き lxmlテスト

lxmlテスト

2010年02月26日 16時01分 Posted by TANIGUCHI Takaki | | タグ:
Pythonのscrapingライブラリのlxmlをちょっとテスト。
#!/usr/bin/python

from lxml.html import fromstring
lh = fromstring(file('2007.shtml').read())
for i in lh.xpath('//a[img[@src="foo.jpg"]]'):
        print i.values()
こんなかんじ。なるほど。

 

Facebook Like!
Google Ad
Google Ad
Copyright © 1996-2012 TANIGUCHI Takaki