从序列多重比对计算等位基因频率。
allfreqs的Python项目详细描述
所有频率
从序列多重比对计算等位基因频率。在
- 免费软件:麻省理工学院许可证
- 文档:https://allfreqs.readthedocs.io
- GitHub回购:https://github.com/robertopreste/allfreqs
特点
从fasta或csv格式的核苷酸多重比对中计算等位基因频率。在
等位基因频率将作为一个表格返回,其中每一行是一个核苷酸位置(基于 提供的参考序列)和列是A、C、G、T频率以及间隙等 非标准核苷酸。在
例如,给定以下多重对齐:
ID | Sequence |
---|---|
ref | ACGTACGT |
seq1 | A-GTAGGN |
seq2 | ACCAGCGT |
由此产生的等位基因频率为:
^{tb2}$非规范(不明确)核苷酸的频率默认压缩为oth 列,但也可以使用简单的标志单独显示。在
allfreq既可以用作命令行工具,也可以通过其pythonapi使用。在
有关详细信息,请参阅文档的Usage部分。在
安装
请注意:allfreqs只支持Python>;=3.6!
allfreqs的首选安装方法是使用pip:
$ pip install allfreqs
有关详细信息,请参阅文档的Installation部分。在
学分
此包是用Cookiecutter和cc-pypackage项目模板创建的。在
历史
0.1.0(2019-07-08)
- 第一次发布。在
0.1.1(2019-08-08)
- 从fasta和csv文件读取并处理多重对齐(仅限于Python模块)。在
0.1.2(2019-10-17)
- 添加多重比对中包含和不包含参考的测试
- 添加带有真实数据集的测试(来自单倍型组特定的多重比对)。在
0.1.3(2019-10-18)
- 为真实数据集添加更详细的测试
- 实现更高效的频率计算
- 增加dunder方法和健全性检查
- 确定需求和测试框架
- 干净的代码。在
0.2.0(2020-03-07)
- 将numpy和大熊猫从scikit bio安装的要求中删除
- 将测试模块移到allfreq中
- 增加内部管理模块
- 干净的代码。在
0.3.0(2020-04-02)
- 添加允许不明确的核苷酸单独显示的选项。在
- 项目
标签: