制作一个基本的python scraper…不知道如何将我制作的模块包含到另一个模块中。获取:“无模块错误”。以下是文件结构:
代码_蜘蛛网.py公司名称:
from scrapy.spiders import BaseSpider
from scrapy.selector import HtmlXPathSelector
from scrapy.loader import XPathItemLoader
from scrapy.loader.processors import Join, MapCompose
from ..scraper_app import items
class IndeedSpider(BaseSpider):
name = "indeed"
allowed_domains = ["indeed.com"]
start_urls = ["http://www.indeed.com/jobs?q=security&l="]
deals_list_xpath = '//div[@class="row result"]/td[@class="snip"]'
item_fields = {
'title': '',
'location': '',
'blurb': '',
'pay': '',
'description': ''
}
当我运行python时确实发生了错误_蜘蛛网.py…我确信我缺少了对python的一些基本理解,我对这种语言非常陌生。谢谢!:)
使用Scrapy时,从根文件夹(包含
scrapy.cfg
文件的根文件夹)运行scrapy crawl <spider name>
的蜘蛛。在如果您使用
scrapy startproject
生成spider项目,那么您应该已经得到一个items.py
,在这里可以定义您的Item
子类。在相关问题 更多 >
编程相关推荐