靓汤。找汉字

2024-06-02 08:01:26 发布

您现在位置:Python中文网/ 问答频道 /正文

a_string = soup.find(text='围')

soup.find_all('title', limit=1)
# [<title>The Dormouse's story</title>]

soup.find('title')
# <title>The Dormouse's story</title>

在使用beauthulsoup时,有没有什么可以处理汉字查找的?在

试了一段时间,似乎找不到角色。英文字很好用

我工作的网站的来源

^{pr2}$

Tags: thetext角色stringtitle网站来源all
2条回答

当您使用find(text='something')时,它将搜索只包含文本“something”而不包含其他内容的文本节点。在

如果要查找包含特定字母的文本,或匹配任何其他正则表达式,则必须使用正则表达式模式(如@Yannis所说):

soup.find(text=re.compile(u'定'))

注意,re.U标志不是必需的,因为您没有更改特殊字符(如\s或\w)的行为。如果是这样,则可能需要提供它。查看有关正则表达式的更多信息here

尝试类似于:

a_string = soup.find(text=re.compile(u'围', re.U))

换句话说,应该确保搜索的字符串是unicode。它可能在没有re.compile()的情况下工作,但至少要确保您的中文字符串包含在u''

相关问题 更多 >