帮助用Python解析页面
我想要解析一个网页,以便获取视频下载的链接。我使用的是Python和Firebug,但我找不到这个链接。
举个例子:
我需要获取视频链接的网页地址是: hxxp://www.rtve.es/mediateca/videos/20100125/saber-comer---salsa-verde-judiones-25-01-10/676590.shtml
视频的链接是: hxxp://www.rtve.es/resources/TE_SSAC011/flv/8/2/1264426362028.flv
你能帮我一下吗?非常感谢,抱歉我的英语不好!
3 个回答
0
import re
from urllib2 import urlopen
text = urlopen('http://www.rtve.es/mediateca/videos/20100125/saber-comer---salsa-verde-judiones-25-01-10/676590.shtm').read()
reg = re.compile(r'http://www\.rtv.*flv')
reg.findall(text)
通常你可以使用这个。但是里面没有你的链接。
5
可以使用BeautifulSoup
或者lxml
这两个工具。