细菌基因组复制起源与终点预测
teritori的Python项目详细描述
简介
寻找复制的起源(ori)和终点(ter)对于涉及基因组数据测序的所有研究都是重要的,主要是因为它为序列提供了明确的起点和终点,并且能够对不同的样本进行比较和分析。了解这些位置还可以验证序列是否正确组装。目前还没有一个一站式的软件解决方案来识别细菌中的ori和ter;研究人员必须依靠不同工具的组合和对结果的手动检查。
为了解决这个问题,我们开发了一种自动识别细菌基因组复制起点和终点的工具teritori,它将不同的关键基因组特征结合到一个单一的最终可靠预测中。结果也经过了统计检验,这让用户了解了预测的准确性。在teritori,我们相信我们已经创建了一个有用的程序,它将填补目前可用软件的空白,并使与复制相关的研究更简单、更快和更准确。
teritori中包含的三个特征是基因组偏斜(gc和ta)、基因链定向和保守基序(特别是dnaa盒、dif基序和rrna)。teritori将查询细菌基因组的fasta文件作为输入,并允许用户指定要在分析中包括哪些功能(一个、两个或三个的组合)。它还提供了一个预测细菌基因的文件,这些基因已经被原核预测程序prodigal预测过了。如果浪子基因预测已经可用,用户可以将其指定为输入。
这个程序还处于非常早期的阶段,结果可能并不总是完全准确。执行时间有时也可能非常长(长达几个小时)。