如何优化我的代码效率，以加快大型数据文件提取程序？

chromosomefragmentlist=[] Number_of_fragments=150 ChromosomeNumber=1 FragmentSize=1000000 for i in range(0, (Number_of_fragments), 1): a = ("Chromosome" + str(ChromosomeNumber) + "Fragment" + str(i) + ",Basepairs " + str(i * FragmentSize + 1) + "-" + str(i * FragmentSize + FragmentSize)) chromosomefragmentlist.append(str(Dict.get((a)))) return(chromosomefragmentlist)

1条回答

网友

1楼 · 发布于 2024-05-21 04:21:57

这段代码不能被“增强”，因为无论如何你必须在范围内迭代并从dict中获取值。小的加速你可以用列表理解来实现，但是这并不重要。你知道吗

我建议您阅读PEP8，并使用推荐的编码风格。将其应用于当前代码时，应重命名变量：

ChromosomeNumber->；chromosome_num。你知道吗
Variable names should be lowercase, with words separated by underscores as necessary to improve readability
FragmentSize->；fragment_size；
Number_of_fragments->；fragments_len（len是length的缩短变体）
Dict->；some_dict（应该用适当的关键字替换一些；还应该避免用python内置类型、函数、模块等的名称命名变量）
chromosomefragmentlist->；chromosomes。你知道吗

其他建议：

range(0, (Number_of_fragments), 1)等价于range(Number_of_fragments)（docs）
最好使用string formatting而不是字符串连接
如果您不需要在键不存在时返回默认值，那么使用some_dict[key]语法而不是^{}方法更为常见。你知道吗

使用所有建议，您将得到下一个代码：

fmt = "Chromosome{}Fragment{},Basepairs {}-{}"
return [some_dict[fmt.format(chromosome_num, i, i * fragment_size + 1, i * fragment_size + fragment_size)]
        for i in range(fragments_len)]

相关问题更多 >

编程相关推荐

热门问题

热门文章