擅长:python、mysql、java
<p>好的,所以您正确地获取了所有<code><tr></code>,现在我们只需要从它们中获取data属性。在</p>
<pre><code>import re
import requests
from bs4 import BeautifulSoup
url = 'http://cinematreasures.org/theaters/united-states?page=1'
r = requests.get(url)
soup = BeautifulSoup(r.text, "html.parser")
theaters = soup.findAll("tr", class_="theater")
data = [ t.get('data') for t in theaters if t.get('data') ]
print data
</code></pre>
<p>不幸的是,这给了您一个字符串列表,而不是一个人们可能希望的dictionary对象。我们可以在数据字符串上使用正则表达式将其转换为dict(谢谢<a href="https://stackoverflow.com/users/5828883/roottwo">RootTwo</a>):</p>
^{pr2}$