靓汤。找汉字 - 问答 - Python中文网

靓汤。找汉字

2024-06-02 08:01:26 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

a_string = soup.find(text='围')

soup.find_all('title', limit=1)
# [<title>The Dormouse's story</title>]

soup.find('title')
# <title>The Dormouse's story</title>

在使用beauthulsoup时，有没有什么可以处理汉字查找的？在

试了一段时间，似乎找不到角色。英文字很好用

我工作的网站的来源

^{pr2}$

Tags： the text 角色 string title 网站来源 all

2条回答

网友

1楼 · 编辑于 2024-06-02 08:01:26

当您使用find(text='something')时，它将搜索只包含文本“something”而不包含其他内容的文本节点。在

如果要查找包含特定字母的文本，或匹配任何其他正则表达式，则必须使用正则表达式模式（如@Yannis所说）：

soup.find(text=re.compile(u'定'))

注意，re.U标志不是必需的，因为您没有更改特殊字符（如\s或\w）的行为。如果是这样，则可能需要提供它。查看有关正则表达式的更多信息here

网友

2楼 · 编辑于 2024-06-02 08:01:26

尝试类似于：

a_string = soup.find(text=re.compile(u'围', re.U))

换句话说，应该确保搜索的字符串是unicode。它可能在没有re.compile()的情况下工作，但至少要确保您的中文字符串包含在u''内

相关问题更多 >

编程相关推荐

热门问题

热门文章