提高解析速度

2024-06-16 08:55:07 发布

您现在位置：Python中文网/ 问答频道 /正文

9335

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图从三个fasta文件中提取标题并比较它们的标题。但是，它只适用于较小的文件。当文件的大小为两GB时，python脚本将自行终止

我的代码是：

from Bio import SeqIO

def get_header(filename):
    parts = SeqIO.parse(filename, 'fasta')
    headers = map(lambda x: x.id, parts)
    return set(headers)

bact1 = get_header('file1.fasta')
bact2 = get_header('file2.fasta')
bact3 = get_header('file3.fasta')


print 'Only in bact1:', len(bact1 - bact2 - bact3)
print 'Only in bact2:', len(bact2 - bact1 - bact3)
print 'Only in bact3:', len(bact3 - bact1 - bact2)

如果你能表现出洞察力，我将不胜感激

Tags：文件 in 标题 only get len filename fasta

0条回答

目前没有回答

编程相关推荐

java使用（BluetoothGattCharacteristic）特性中的数据创建、写入和保存csv文件。getValue（）
java如何使用groupBy创建一个值为BigDecimal字段平均值的映射？
日期时间Java将iso_即时格式的字符串转换为日期
java如何检索和显示Android firebase的配置文件？
scala AWSJAVASDK:解压缩大小必须小于262144000字节
要应用于列表的java JSTL if条件
java在3个点之间画一个正方形
Kotlin java抽象类IllegaAccessError
java原语双值相等取决于大小？
java有没有一种方法可以对数据集使用compareTo（）方法，而不必遍历数据集的每个元素？

提高解析速度

相关问题更多 >

编程相关推荐

热门问题

热门文章

提高解析速度

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >