unicode findall python

2024-06-11 16:10:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我对英语有一个工作模式,但是我的母语不起作用,这让我头疼。首先,我提出了很多关于编码的问题,我知道我低估了它,这是个大问题。我花了一些时间读了一下,但问题仍然存在。所以现在我面临一个正则表达式utf问题。所以模式是:

exactMatch = re.compile(r"([^\.]*\bтурција\b[^\.]*)\.", re.UNICODE)
print exactMatch.pattern
result= exactMatch.findall("турција е на врвот од индустријата. турција е на врвот од индустријата.")

它适用于英语。它的功能是给我一个段落中的所有句子。有什么建议吗?在

我也尝试了编码和解码,但没有发生除了编码错误。在


Tags: 功能re编码时间unicode模式resultutf
1条回答
网友
1楼 · 发布于 2024-06-11 16:10:30

这将起作用:

exactMatch = re.compile(ur"([^\.]*\bтурција\b[^\.]*)\.", re.UNICODE)
print exactMatch.pattern
result= exactMatch.findall(u"турција е на врвот од индустријата. турција е на врвот од индустријата.")

如果使用unicode,则使用unicode。在

相关问题 更多 >