我正试着给一个网站打电话,在网站上搜索特定的词。你知道吗
现在我有:
import urllib.request
from bs4 import BeautifulSoup
response = urllib.request.urlopen("https://www.mtb.com")
page_source = response.read()
soup = BeautifulSoup(page_source, 'lxml')
我想在html中搜索“Chat”这个词(实际上是一长串不同的词)。你知道吗
如果我做了这样的事
"Chat" in soup
False
"Chat" in page_source
TypeError: 'str' does not support the buffer interface
查看网站的源代码,我可以看到它确实有Chat
。我想看看这个词是否存在于html中(他们使用的是聊天工具),而不是仅如果这个词作为文本存在于网页上。(如果网页上也有则罚款)
您也可以不使用BeautifulSoup来实现这一点,只需使用正则表达式即可。由于刮取的页面以类似字节的对象的格式返回,因此
x = page_source.decode()
将类似字节的对象转换为字符串完整代码:
相关问题 更多 >
编程相关推荐