“编程集体智能”的例子

2024-05-14 21:04:02 发布

男 | 程序猿一只，喜欢编程写python代码。

我从here下载了源代码。我试着从托比·塞加拉的《集体智能编程》一书的第4章中引用这个例子。我的python版本是2.7.2。我在翻译程序中输入以下代码：

import searchengine
pages=['http://en.wikipedia.org/wiki/Programming_language']
crawler = searchengine.crawler('searchindex.db')
crawler.crawl(pages)

然后得到信息：

^{pr2}$

或者有时会收到信息：

Indexing http://en.wikipedia.org/wiki/Programming_language
Could not parse page http://en.wikipedia.org/wiki/Programming_language

总之，爬虫程序不会索引页面。我做错什么了？在

Tags： org 信息 http here 源代码智能 wiki pages

1条回答

网友

1楼 · 发布于 2024-05-14 21:04:02

把def separateWords(self,text)大写的W变成小写，在gettextonly(self,soup)中，v==Null变成{}。您还必须执行后面的步骤，例如

>> crawler=searchengine.crawler('searchindex.db') 
>> crawler.createindextables()
>> crawler=searchengine.crawler('searchindex.db')

首先，然后尝试运行page=['***']和其他步骤。在