我是新的网页刮。我们被要求使用iypthon笔记本写一个刮刀或蜘蛛下载几个网页。这是我们在课堂上学到的,但我想还有一步我想不出来。你知道吗
%pylab inline
import urllib
myUrl="http://www.google.com"
theSite=urllib.urlopen(myUrl).read()
import re
tags=re.findall('''<(.+?)>''',theSite,re.DOTALL)
print len(tags)
for i in range(100):
print tags[]
目前没有回答
相关问题 更多 >
编程相关推荐