Python正则表达式删除括号中的注释或数字

import re string = """(1) At what time.!? [asdf] School- (2) bus. So late, already.!? [ghjk]""" #res = re.sub(r"[\(\[].*?[\)\]]", "", string) res = re.sub("(\d+) ","", res) res = re.sub("[.*]","", res) res = re.sub(r"-\s","", res) res = re.sub(r"[^\w\säüöß]","", res) res = re.sub("-\n","", res) print(res.split())

1条回答

网友

1楼 · 发布于 2024-06-07 07:51:51

您可以使用此sub + findall解决方案：

import re

string = """(1) At what time.!? [asdf] School-
(2) bus. So late, already.!? [ghjk]"""

print (re.findall(r'\b\w+(?:-\w+)*', re.sub(r'(\([^)]*\)|\[[^]]*\]|-)\s*', '', string)))

输出：

['At', 'what', 'time', 'Schoolbus', 'So', 'late', 'already']

详细信息：

re.sub(r'(\([^)]*\)|\[[^]]*\]|-)\s*', '', string)：删除所有(...)和[...]或-字符串，后跟0或更多空格
\b\w+：匹配以单词边界开头的1+个单词字符

编程相关推荐

.net等效于Java的Swing TableModel？
java将具有相同标记的xml结构解组到不同的字段
JavaSpringDataGemFire：自定义过期示例
设计模式质疑java中工厂函数的使用
文本区域中的swing格式。JAVA
Java:IEEE双倍于IBM浮点
java解析微数据时，我得到的是空值
java如何配置Ebean生成SQLite代码
具有复合工厂或抽象工厂的java工厂
如何使用java中的POI在excel工作表中获取小计

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python正则表达式删除括号中的注释或数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >