擅长:python、mysql、java
<p>你最好不要使用JS渲染,它非常慢,很重,而且很麻烦。
花5分钟在Chrome的“网络”选项卡上查找数据源。它通常内置在页面源中,或者通过XHR请求传递。你知道吗</p>
<p>在这种情况下,您需要的所有数据都可以在页面本身上找到,但是您应该检查其源代码,而不是呈现的版本。在chrome中使用<code>ctrl+u</code>,然后<code>ctrl+f</code>找到所有需要的部件。你知道吗</p>
<pre><code>import json
track_data = response.xpath('//script[@name="schema:music-album"]/text()').extract_first()
track_json = json.loads(track_data)
track_title = track_json['name']
yield {'title': track_title}
</code></pre>
<p>在这种情况下,它的工作速度是<code>splash</code>的5-7倍</p>