使用python对文件中给定的模式执行regex操作

1条回答

网友

1楼 · 发布于 2024-05-28 15:38:45

对于一个文本文件包含多个简单地连接在一起的JSON对象的情况（即，没有将它们放入列表中，因此在JSON编码的对象之间缺少,），下面的内容可能有助于纠正这一问题（不会解释其他地方的错误编码；问题的输入已修改为仅针对提问者要求的内容）：

>>> import re
>>> import json
>>> s = """
... { "log": [
...        {"code": "abc",
...          "refs": {"a":"b"}
...        }
... ]}
... { "log": [
...        {"code": "xyz",
...          "refs": {"p":"q", "x": ["abc","xyz"] }
...        }
... ]}
... 
... 
... { "log": [
...        {"code": "abc",
...          "refs": {"a":"b"}
...        }
... ]}
... """
>>> items = json.loads('[' + re.sub('}\s*{', '},\n{', s, flags=re.M) + ']')
>>> items[0]
{'log': [{'code': 'abc', 'refs': {'a': 'b'}}]}
>>> items[1]
{'log': [{'code': 'xyz', 'refs': {'p': 'q', 'x': ['abc', 'xyz']}}]}
>>> items[2]['log'][0]['code']
'abc'

关键位是re.sub('}\s*{', '},\n{', s, flags=re.M)，表达式所做的（'}\s*{'）是查找}和{的所有情况，这些情况仅由空格隔开（或者完全没有）。另一位是flags关键字参数，以确保跨多行检查替换，否则表达式将像原始示例一样跨换行匹配

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用python对文件中给定的模式执行regex操作

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >