我有一些文本文件是另一个软件的输出。我有一个由管道磁带连接在一起的Perl脚本,它用一系列几乎100个正则表达式来清理这些脚本。你知道吗
我对Python还不太熟悉,不知道是否有比一大块Python更惯用的方法来处理这个问题,这比perl的:string =~ s/blah/blah/i;
结构要重得多
string = re.sub(r' +', " ", string, re.I)
string = re.sub(r'(\w)- ', "\1, ", string, re.I)
string = re.sub(r'u-s', "U.S.", string, re.I)
比如某种带有正则表达式的dict和它们的替代品?我还很好奇,连续多次调用一个模块的函数会如何影响性能?你知道吗
如果将正则表达式放入元组中,那么迭代元组并执行替换是一件容易的事情。你知道吗
正则表达式:
代码:
测试数据:
结果:
相关问题 更多 >
编程相关推荐