可配置重试。
mask-plasmid的Python项目详细描述
掩膜质粒:从组装好的基因组中创建一个快速床文件
背景
当用微生物基因组数据构建系统发生树时,必须 尽可能接近克隆框架。
识别克隆帧的一种常用技术是将读取映射到引用。 基因组,然后过滤掉所有样本中不存在的任何位点 兴趣。
一般来说,质粒不应该是克隆框架的一部分。在理论上 它们可能是克隆框架的一部分,用短读数据 很难说质粒是不是都一样。然而,更重要的是, 很难说质粒和染色体 从样本的最新共同祖先垂直继承的。
因此,通常建议从分析中移除质粒。
当无法用 确定读是否属于质粒或染色体。有时质粒 被插入染色体,有时读到应该映射到质粒但错误 定位到染色体,因为分析中不包括质粒。 因此,在映射读取到引用的上下文中,可以识别潜在的变量和 克隆框架,模棱两可的读取(即,可以映射到染色体上或 (在质粒上)应该从用于识别变异位点的潜在读取池中移除。
如果在尝试映射 读取,则无法识别不明确的读取。因此,一个更好的策略 可能是将质粒保存在引用数据集中,映射所有读取,标识 可变位点,然后掩盖质粒位点。
这可以通过使用Snippy 4来实现
--mask
选项并给它一个bed文件。
这个工具是做什么的?
这个工具将生成一个包含genbank文件中每个轨迹的bed文件,它可以
使用Snippy 4
时,可轻松编辑并用于--mask
质粒。
安装
pip install mask-plasmid
运行
mask-plasmid <my_gb.gbk[.gz]> > plasmids.bed
开发
推到pypi
以下命令将:
- 运行测试
- 清理当前分支
- 碰撞版本
- 生成分布
- 清理当前分支
- 用版本标记提交
- 推到Github
- 按PYPI
git commit -a -m <message>
pipenv run inv deploy <new_version_number> [<patch|minor|major>]