我在一个包含许多内容的通用文件中有一个特定的内容块,该文件任意长,可以包含任何字符,每行以空格开头,并且在某些文本文件中具有格式:
1\1\GINC-NODE9999\Scan\...
... ... ... ... ... ... ...
... ... ... ... ...\HF=-568
.8880019,-568.2343213, -568
.2343432, ... , -586.328492
1\RMSD=...
我对介于\HF=
和{\HF=
和{
当前努力
我目前有以下情况:
^{pr2}$列出了以下清单
['.6184082129,7.5129238742\\\\Version=EM64L-G09RevC.01\\
State=1-A\\HF=-568\n', ' .8880019,-568.8879907,-568.8879686,
-568.887937,-\n']
问题是我不仅在整个过程中有新行,而且还保存了比我应该保存的更多的数据。此外,滚动到其他行上的数字在列表中有自己的位置。我需要它看起来像
['-568.8880019', '-568.8879907', ... ]
使用类似的方法将所有内容连接到一行:
然后不用担心换行符来解析它。在
如果你的文件真的很大,你可能需要考虑另一种方法来避免把它都放在内存中。在
对于一个快速的解决方案,您可以实现基于正则表达式的简单字符串连接。在
我为你的数据格式实现了一个简短的解决方案。在
谨致问候
和过去
多行非贪心正则表达式可用于提取介于\HF=和\RMSD=之间的文本。一旦文本被提取出来,它应该很容易标记成组成数字
相关问题 更多 >
编程相关推荐