擅长:python、mysql、java
<p>我通常对输出进行修剪和清理的方法是将<a href="http://doc.scrapy.org/en/latest/topics/loaders.html#input-and-output-processors" rel="nofollow">Input and/or Output Processors</a>与<a href="http://doc.scrapy.org/en/latest/topics/loaders.html" rel="nofollow">Item Loaders</a>一起使用,这样可以使事情更加模块化和干净:</p>
<pre><code>class ScrapingTestingLoader(ItemLoader):
default_input_processor = MapCompose(unicode.strip)
default_output_processor = TakeFirst()
</code></pre>
<p>然后,如果使用此项加载器加载项,则提取的值将被剥离并作为字符串(而不是列表)显示。例如,如果提取的字段是<code>["my value \n"]</code>-您将获得<code>my value</code>作为输出。</p>