基于物种特异性密码子使用分布的氨基酸反向翻译和dna优化工具。

codon-harmon的Python项目详细描述


密码子和声

https://img.shields.io/pypi/v/codon_harmony.svgMIT Licensehttps://img.shields.io/travis/weitzner/codon_harmony.svgDocumentation statusCoverage reportUpdatesCode style: black

基于物种特异性密码子使用分布的氨基酸反向翻译和dna优化工具。 物种特定数据可以在Codon Usage Database上使用NCBI Taxonomy databaseid(例如413997)或有机体的拉丁名(例如大肠杆菌b)找到。可以将物种名称映射到分类IDhere

功能

  1. 将输入的氨基酸序列反向翻译成dna。
  2. 计算主机的每a a密码子使用配置文件-使用的密码子少于指定的阈值(默认为10%)将被删除。
  3. 将反向翻译的dna序列与宿主基因进行比较,确定哪些密码子被过度使用/未充分使用。
  4. 根据宿主轮廓随机突变密码子。
  5. 根据相对于宿主的密码子适应指数对序列进行排序
  6. 处理DNA以删除不需要的特征:
    • 滑动窗口内和整个序列中的高GC含量
    • 不需要的限制站点
    • 交替启动位置(富含GA区域ATG/GTG/TTG上游18 bp)
    • 3个连续的相同密码子和9-mer重复片段
    • 连续4个(可变)以上相同bps的区域(“局部均聚物”)
    • rna发夹,通过在序列中寻找10个带有反向补体(包括摆动碱基)的mer来检测
    • RNA剪接位点,通过与一致的供体和受体位点序列的相似性检测

该过程从步骤3开始重复指定的循环次数(默认值为1000),或者直到当前DNA和宿主配置文件的每AA密码子配置文件匹配(在耐受范围内)。

未来工作

  • 更高级的rna结构去除

历史记录

0.9.2(2019-02-06)

  • pypi上的第一个版本。

0.9.4(2019-02-20)

  • 添加了全套测试,发现并修复了错误
  • 包装设置的调整-现在可以实际安装

0.9.5(2019-02-25)

  • 增加对rna剪接位点检测和移除的支持

0.9.6(2019-02-28)

  • 更新报告和显示优化失败的方式
  • 通过进程池并行化

1.0.0(2019-03-06)

  • 除了从Internet获取数据外,还可以使用脱机表
  • 全套测试和文档
  • 在实际序列上测试

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何为ConcurrentHashMap使用并设置适当的并发级别?   java泛型方法,运行时错误,   java在页面上显示加载的图像   java Paypal定期直接支付问题   java如何延迟重新绘制组件   JavaSpringBoot+Hibernate如何维护@Transient字段   java在其方法中获取关于类的信息   在java中将别名添加到枚举   java如何解决向google报告成绩时“需要重新连接客户端”的问题   清晰的java图像背景   java未找到适合JDateChooser的构造函数(字符串、字符串、字符)   java LRU缓存实现。某些测试用例的代码失败   if语句Java嵌套的if/Else条件   java JSoup“wrap”并非每次都按预期工作   Java Spring引导循环依赖于一个环境   ssl证书无法通过Java和IntelliJ连接到SOAP服务   带整数验证的Java扫描器   java在Flex中呈现具有动态列的datagrid   java Android:通过用户选择的选项将文件上载到服务器   子类中的java抛出错误、异常和运行时异常