拆分带有前缀的大型.gz文件

网友

1楼 · 编辑于 2024-05-28 23:55:01

...I need to unzip it first.

不，你不知道，至少不是用手。^{}将允许您打开压缩文件，此时您将读取一定数量的字节并将其写入单独的压缩文件中。请参阅底部的“如何读取”和“如何写入”两个压缩文件的示例。在

with gzip.open(infile, 'rb') as inp:
  for <some number of loops>:
    with gzip.open(outslice,'wb') as outp:
      outp.write(inp.read(slicesize))
  else: # only if you're not sure that you got the whole thing
    with gzip.open(outslice,'wb') as outp:
      outp.write(inp.read())

请注意，gzip压缩文件不是随机访问的，因此您需要一次性执行该操作，除非您想先将源文件解压缩到磁盘。在

网友

2楼 · 编辑于 2024-05-28 23:55:01

可以像读取未压缩文件一样读取gzip压缩文件：

>>> import gzip
>>> for line in gzip.open('myfile.txt.gz', 'r'):
...   process(line)

process()函数将处理您提到的特定行计数和条件处理逻辑。在

网友

3楼 · 编辑于 2024-05-28 23:55:01

已发布here

zcat XXX.fastq.gz | split -l 1000000  additional-suffix=".fastq"  filter='gzip > $FILE.gz' - "XXX_"

相关问题更多 >

编程相关推荐

热门问题

热门文章

拆分带有前缀的大型.gz文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >