我试图抓取一个新闻网站,我需要改变一个参数。我改为替换为下一个代码:
while i < len(links):
conn = urllib.urlopen(links[i])
html = conn.read()
soup = BeautifulSoup(html)
t = html.replace('class="row bigbox container mi-df-local locked-single"', 'class="row bigbox container mi-df-local single-local"')
n = str(t.find("div", attrs={'class':'entry cuerpo-noticias'}))
print(p)
问题是“t”类型是string,find with attributes只适用于类型<class 'BeautifulSoup.BeautifulSoup'>
。你知道我怎样才能把“t”转换成那种类型吗?
只需在解析前进行替换即可:
注意,还可以(我甚至可以说preferred)解析HTML、定位元素并修改实例的属性,例如:
注意
class
是一个特殊的multi-valued attribute-这就是为什么我们要将值设置为单个类的列表。演示:
现在看看
div
元素类是如何更新的:相关问题 更多 >
编程相关推荐