从参考基因组生成突变序列文件。
snp-mutator的Python项目详细描述
从参考基因组生成突变序列文件。
snp突变子是由美国食品公司开发的。 以及药品管理局,食品安全和应用营养中心。
- 免费软件
- 文档:https://snp-mutator.readthedocs.io/en/latest/readme.html
- 源代码:https://github.com/CFSAN-Biostatistics/snp-mutator
- PYPI分布:https://pypi.python.org/pypi/snp-mutator
功能
- 读取fasta文件并生成任意数量的经过修改的fasta复制文件。
- 突变可以是任意数量的随机单碱基替换、插入和删除。 选定的位置,均匀分布在整个基因组中。
- 突变可以从所有可能位置的子集(池)中选择。
- 复制可以划分为多个组,每个组共享一个符合条件的位置池。
- 生成一个摘要文件,列出所有变异位置的原始基和变异。
- 突变可以是单形的,也可以是多态的。
- VCF文件生成。
- 可以将各种度量保存到输出文件中。
- 可以自定义fasta defline序列id。
引用snp突变子
要引用snp mutator,请引用以下出版物:
Davis S, Pettengill JB, Luo Y, Payne J, Shpuntoff A, Rand H, Strain E. (2015) CFSAN SNP Pipeline: an automated method for constructing SNP matrices from next-generation sequence data. PeerJ Computer Science 1:e20 https://doi.org/10.7717/peerj-cs.20
许可证
请参阅snp mutator发行版中包含的许可文件。
历史记录
1.2.0(2019-05-15)
- 增加了对Python3.6和3.7的支持。
- 添加了一个命令行选项来指定生成的fasta文件的输出目录。
1.1.0(2018-10-23)
- 添加了在输出文件中指定fasta defline sequence id的功能。
- 未经修改但连接的序列引用可以写入单独的输出文件。 所有的复制都是这个文件的突变。
1.0.0(2018-10-12)
- 突变可以从所有可能位置的子集(池)中选择。
- 复制可以划分为多个组,每个组共享一个符合条件的位置池。
- 突变可以是单形的,也可以是多态的。
- 添加生成VCF输出文件的功能。
- 添加生成度量输出文件的功能。
- 安装程序创建一个名为snpmutator的可执行脚本。
- 插入现在放置在原始引用位置之后,而不是之前,如以前版本的 传感器。这意味着不可能准确地再现先前版本的结果 这个软件。
0.2.0(2016-01-15)
- 允许输入fasta文件中使用小写字母。
- 不要改变间隙或模棱两可的位置。
- 添加命令行开关以显示程序版本。
0.1.1(2015-06-17)
- 从摘要文件列标题中删除空格。这将简化下游 一些脚本语言中的分析。
0.1.0(2015-05-21)
- github上的第一个版本,阅读文档和pypi。