高效地读取fasta和fastq文件
dnaio的Python项目详细描述
dnaio解析fastq和fasta
dnaio
是一个用于快速解析fastq和fast a文件的python 3库。该代码以前是
cutadapt工具,自从它被拆分后得到了改进。
示例用法
主界面是dnaio.open
函数:
import dnaio
with dnaio.open('reads.fastq.gz') as f:
bp = 0
for record in f:
bp += len(record)
print(f'The input file contains {bp/1E6:.1f} Mbp')
功能和支持的文件类型
- 快速Q输入和输出
- fasta输入和输出
- 压缩输入和输出(
.gz
,.bz2
和.xz
,自动检测) - 两个文件中的成对结束数据
- 在单个文件中交织成对结束数据
- 可以读取带有DOS/Windows换行符的文件
- 支持具有第二个标题行(在
+
之后)的fastq文件
限制
- 不支持多行fastq文件。无论如何你不应该用它们。
- fastq解析是这个库的重点。fasta解析器没有优化。