2024-06-02 08:01:26 发布
网友
a_string = soup.find(text='围') soup.find_all('title', limit=1) # [<title>The Dormouse's story</title>] soup.find('title') # <title>The Dormouse's story</title>
在使用beauthulsoup时,有没有什么可以处理汉字查找的?在
试了一段时间,似乎找不到角色。英文字很好用
我工作的网站的来源
当您使用find(text='something')时,它将搜索只包含文本“something”而不包含其他内容的文本节点。在
find(text='something')
如果要查找包含特定字母的文本,或匹配任何其他正则表达式,则必须使用正则表达式模式(如@Yannis所说):
soup.find(text=re.compile(u'定'))
注意,re.U标志不是必需的,因为您没有更改特殊字符(如\s或\w)的行为。如果是这样,则可能需要提供它。查看有关正则表达式的更多信息here
re.U
尝试类似于:
a_string = soup.find(text=re.compile(u'围', re.U))
换句话说,应该确保搜索的字符串是unicode。它可能在没有re.compile()的情况下工作,但至少要确保您的中文字符串包含在u''内
re.compile()
u''
当您使用
find(text='something')
时,它将搜索只包含文本“something”而不包含其他内容的文本节点。在如果要查找包含特定字母的文本,或匹配任何其他正则表达式,则必须使用正则表达式模式(如@Yannis所说):
注意,
re.U
标志不是必需的,因为您没有更改特殊字符(如\s或\w)的行为。如果是这样,则可能需要提供它。查看有关正则表达式的更多信息here尝试类似于:
换句话说,应该确保搜索的字符串是unicode。它可能在没有
re.compile()
的情况下工作,但至少要确保您的中文字符串包含在u''
内相关问题 更多 >
编程相关推荐