Python正则表达式替换连续标点符号

2024-06-16 11:45:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一大堆在线评论,我想替换一些东西,比如“ ^例如,{}或{}分别与{}和{}结合。 我想我的问题可以归结为两个方面:

  1. 如何编译正则表达式模式来检测两个+背对背的标点符号
  2. 在使用诸如replace之类的方法时,如何检索检测到的特定模式?以便使用该模式替换其连续性

作为一个扩展,如何替换您在tweet(如^{)中可能看到的奇怪标点符号

任何指导都有帮助


Tags: 方法模式评论replacetweet指导标点符号连续性
1条回答
网友
1楼 · 发布于 2024-06-16 11:45:52

您可以在此处使用re.sub

inp = "Hello World!!!"
output = re.sub(r'([!?,;])\1+', r'\1', inp)
print(inp + "\n" + output)

这张照片是:

Hello World!!!
Hello World!

您可以根据需要扩展字符类[!?,;],以包括其他标点符号

相关问题 更多 >