我应该在Python中将分类变量存储为整数还是字母?

2024-04-27 05:05:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图用ATGCs来表示生物病毒的序列,但我看到了用1234s来表示的代码。如果我们将它存储为整数而不是字母,那么内存使用率或代码速度会有什么不同吗?你知道吗

对于那些可能需要更多上下文的人,除了在随机位置更改数字/字母字符串的标识(即突变)之外,我不会对这些数字/字母字符串执行任何数学操作,而是跟踪字典中偏离引用序列的突变位置(如:{2:'G', 52:'A'}{2:3, 52:1}),并导出通过迭代参考序列并检查突变字典中的任何突变,获得任何生物病毒株的完整序列。你知道吗


Tags: 内存字符串代码字典字母生物序列数字
1条回答
网友
1楼 · 发布于 2024-04-27 05:05:22

字符串或整数的使用取决于DNA序列的大小。我知道有些序列可能超过数百万个元素。 如果要处理大量信息,最好使用类型化整数。否则,您可以使用字符串,如果它更适合您。你知道吗

相关问题 更多 >