擅长:python、mysql、java
<p>抓取需要一些搜索参数。当我用来抓取网站时,我使用了一个search between函数,发现了用于网站上不同内容(名称、编号、地址)的独特html包装器。它们可能存储为:</p>
<pre><code><div class="userName" id="userName">This is a username</div>
</code></pre>
<p>因此,我将使用一个函数来搜索html的第一部分,并以搜索结束div结束,并返回中间的内容。在</p>
<p>然而,不同的网站不太可能有相同的html结构。所以你必须为每一个你需要抓取的不同网站写下规则。在</p>
<p>希望这有帮助</p>