我从here下载了源代码。我试着从托比·塞加拉的《集体智能编程》一书的第4章中引用这个例子。我的python版本是2.7.2。我在翻译程序中输入以下代码:
import searchengine
pages=['http://en.wikipedia.org/wiki/Programming_language']
crawler = searchengine.crawler('searchindex.db')
crawler.crawl(pages)
然后得到信息:
^{pr2}$或者有时会收到信息:
Indexing http://en.wikipedia.org/wiki/Programming_language
Could not parse page http://en.wikipedia.org/wiki/Programming_language
总之,爬虫程序不会索引页面。我做错什么了?在
把}。您还必须执行后面的步骤,例如
def separateWords(self,text)
大写的W变成小写,在gettextonly(self,soup)
中,v==Null
变成{首先,然后尝试运行
page=['***']
和其他步骤。在相关问题 更多 >
编程相关推荐