将文件中的块解析为不带换行符的Python列表

网友

1楼 · 编辑于 2024-05-15 17:47:46

使用类似的方法将所有内容连接到一行：

with open(infile) as data:
    joined = ''.join(data.read().splitlines())

然后不用担心换行符来解析它。在

如果你的文件真的很大，你可能需要考虑另一种方法来避免把它都放在内存中。在

网友

2楼 · 编辑于 2024-05-15 17:47:46

对于一个快速的解决方案，您可以实现基于正则表达式的简单字符串连接。在

我为你的数据格式实现了一个简短的解决方案。在

import re

def naiveDecimalExtractor(data):
    p = re.compile("(-?\d+)[\n\s]*(\d+\.\d+)[\n\s]*(\d+)")
    brokenNumbers = p.findall(data)

    return ["".join(n) for n in brokenNumbers]

data = """
1\1\GINC-NODE9999\Scan\...
 ... ... ... ... ... ... ...
 ... ... ... ... ...\HF=-568
 .8880019,-568.2343213, -568
 .2343432, ... , -586.328492
 1\RMSD=...
"""

print naiveDecimalExtractor(data)

谨致问候

和过去

网友

3楼 · 编辑于 2024-05-15 17:47:46

多行非贪心正则表达式可用于提取介于\HF=和\RMSD=之间的文本。一旦文本被提取出来，它应该很容易标记成组成数字

import re
import os
pattern = r'''\HF=(.*?)\RMSD='''
pat = re.compile(pattern, re.DOTALL)
for number in pat.finditer(open('file.txt').read()):
    print number.group(1).replace(os.linesep, '').replace(' ', '').strip(r'''\\''')
... 
-568 .8880019,-568.2343213, -568 .2343432, ... , -586.328492 1\

相关问题更多 >

编程相关推荐

热门问题

热门文章

将文件中的块解析为不带换行符的Python列表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >