在微生物中发现高度分化的dna和rna病毒

vica的Python项目详细描述


https://travis-ci.org/USDA-ARS-GBRU/vica.svg?branch=masterhttps://codecov.io/gh/USDA-ARS-GBRU/vica/branch/master/graph/badge.svgDocumentation Statushttps://api.codacy.com/project/badge/Grade/f39e8359ea334739842bba35e596cfdc

作者

  • Adam R.Rivers,美国农业部,农业研究处
  • 张庆鹏,美国能源部,联合基因组研究所
  • Susannah G.Tringe,美国能源部,联合基因组研究所

简介

VICA设计用于识别高度分化的病毒和代表新病毒的噬菌体 集合的亚基因组和亚转录组数据中的科或目。维卡 这是通过组合来自不同组合的信息来实现的吗 同源性。当前版本的VICA使用三个功能集(5-MERS, 所有三个帧中的密码子用法,以及长kmers(k=24,31)的minhash草图。 分类器使用一个联合训练的深神经网络和logistic模型 在tensorflow中实现。这个软件设计用来识别两种DNA 以及rna病毒和噬菌体在基因组和转录体中的表达。

型号

当前租约不包括经过培训的模型,但我们将添加它们 在未来允许快速识别病毒而无需模型训练。

用法

该软件包可以对装配后的数据进行分类,训练新的分类模型。 大多数用户只使用VICA中的分类功能。我们将提供 未来版本中用于分类contig的训练模型。分类可以是 使用以下命令很容易调用:

vica classify -infile contigs.fasta -out classifications.txt -modeldir modeldir

该软件包还提供了一套工具,用于准备数据、培训和评估新的 分类模型。执行此操作的许多工作流都可以使用 相同的子命令界面:

vica split
vica get_features
vica train
vica evaluate

有关详细信息,请参见教程。

要求

包依赖于许多python依赖项,这些依赖项在 软件包是用pip安装的。

非python依赖项是:

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
带有字符串的java JNA调用与带有字节[]的java JNA调用的行为不同   java基于键列表获取子映射   重启后永久增加java堆大小?   JavaHTTPS服务器:相互SSL身份验证   java为什么接受接口的方法会拒绝该接口的实现?   片段中的java视图无法应用于()   ms access Java SQL更新命令不工作   java将web服务自动打包和部署到Oracle Application Server 10g   java有没有办法在安卓 studio中为安卓时钟设置多个警报?   位于FTP服务器上的文件上的Java校验和md5   在Java中创建类时遇到问题。有些方法不太确定   java错误:在类chrome\u驱动程序中找不到主方法   通用海图(Javascript\Java)