生成具有指定氨基酸、密码子和k-mer频率的dna序列。
freqgen的Python项目详细描述
#频率发生器
<;p align=“center”>; <;img src='https://raw.githubusercontent.com/Lab41/freqgen/master/logo/Freqgen2-01_icon_only.png高度=“150”>; <;p>;
[![生成状态](https://travis-ci.org/Lab41/freqgen.svg?branch=master)](https://travis-ci.org/Lab41/freqgen)[![文档状态](https://readthedocs.org/projects/freqgen/badge/?version=latest)](https://freqgen.readthedocs.io/en/latest/?徽章=最新的)[![编码因子](https://www.codefactor.io/repository/github/lab41/freqgen/badge)](https://www.codefactor.io/repository/github/lab41/freqgen)
freqgen是用特定的氨基酸产生编码dna序列的工具。 使用频率或序列、gc含量、密码子使用偏差和/或k-mer 使用偏差。为了实现这一点,frequegen使用遗传算法来有效地 搜索可能的DNA序列的解空间,找到那些 与所需参数紧密匹配。
##功能
- cli和python api
- 可以同时匹配多个DNA统计信息
- 内置可视化实用程序
- 支持多种健身指标(你可以自己带!)
##安装
只需运行:
$ pip install freqgen
或者,要获得最新(但不一定稳定)的开发版本:
$ pip install git+https://github.com/Lab41/freqgen.git
##五秒钟的cli教程
freqgen的基本流程可以概括为三个步骤:
一。根据 参考序列。如果你已经有了一个特定的氨基酸序列 (i.e.用于合成生物学),跳过这一步:
$ freqgen aa reference_sequences.fna -o new_sequence.faa -l LENGTH
2.创建一个包含氨基酸的k-mer频率的yaml文件 序列的DNA有:
$ freqgen featurize reference_sequences.fna -k INT -o reference_freqs.yaml
生成编码氨基酸序列的DNA序列:
$ freqgen -t reference_freqs.yaml -s new_sequence.faa -v -o optimized.fna
可视化优化结果(可选):
$ freqgen visualize –target reference_freqs.yaml –optimized optimized.fna
##文档
阅读完整的文档 [freqgen.readthedocs.io](http://freqgen.readthedocs.io)。
##引文
待定!