试图拆分大字符串的Python内存错误

2条回答

网友

1楼 · 编辑于 2024-04-26 03:58:33

函数load_data正在将整个文件读入内存中，显然内存不足。所以你必须放弃先读后处理的想法。取而代之的是，一次读一行文件，并在得到这些行时对其进行处理。在

这将以与data.split('\n\n')相同的方式将文件拆分为字符串，但一次只能分割一行：

with open("mybigfile.txt", "r") as f:
    for line in f:
        mydata = line.rstrip()
        if mydata:
            do_something_with(mydata)

网友

2楼 · 编辑于 2024-04-26 03:58:33

如果要逐个处理字符串的各个部分，则可以使用生成器分别发出每个部分；这将减少使用的内存量，因为您不会像使用str.split那样生成所有部分的列表。在

>>> s = 'abc\n\ndef\n\nghi'

>>> def splitter(s):
...     chars = []
...     for x in s:
...         chars.append(x)
...         # Check for split characters and yield string
...         if chars[-2:] == ['\n', '\n']:
...             yield ''.join(chars[:-2])
...             chars = []
...     yield ''.join(chars)
... 
>>> 
>>> for word in splitter(s):
...     print word
... 
abc
def
ghi

相关问题更多 >

编程相关推荐

热门问题

热门文章

试图拆分大字符串的Python内存错误

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >