如何使用正则表达式解析带符号“|”的文本

2024-04-23 11:44:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要解析一堆类似于下面的未格式化文本。你知道吗

those|DT|O considered|VBN|O anarchists|NNS|O at|IN|O best|JJS|O share|NN|O a|DT|O certain|JJ|O family|NN|O resemblance|NN|O .|.|O "|RQU|O

我需要使用正则表达式将数据解析为如下格式:

The DT I-MISC

certain JJ O

in IN O

the DT B

pound NN I


Tags: in文本sharedtnnatbestconsidered
1条回答
网友
1楼 · 发布于 2024-04-23 11:44:10
with open('outfile.txt', 'wb') as outfile, open('infile.txt', 'r') as infile:
    [outfile.write(i.replace('|', ' ') + '\n')  for i in infile.read().split()]

你基本上只想按空格分割然后用空格替换|对吗?那似乎就是你要找的。你知道吗

编辑: 代码现在写入文件。你知道吗

编辑2: 代码现在从文件中读取

相关问题 更多 >