使用决策树的序列识别;使用机器学习模型对DNA读取进行分类的工具。

SIDR的Python项目详细描述


https://travis-ci.org/damurdock/SIDR.svg?branch=master

sidr(发音:cider)是过滤下一代测序的工具。 (ngs)基于选定目标生物体的数据。SIDR使用爆炸数据 (或类似的分类器)训练决策树模型进行分类 序列数据要么属于目标生物体,要么属于 去别的地方。此分类可用于筛选数据 以后的集会。

注:sidr是alpha软件。功能当前不完整,可能会有重大更改。

安装

要安装sidr,请克隆此存储库并运行setup.py,或使用pip进行安装。

pip install sidr

有关详细信息,请参见documentation 细节。

使用量

SIDR有两种主要模式。默认模式需要几个生物信息学文件 作为输入,并基于GC内容百分比计算决策树 以及每个基地的序列覆盖率。要运行它,请使用:

sidr default -d [taxdump path] -b [bamfile] -f [assembly FASTA] -r [BLAST results] -k tokeep.contigids -x toremove.contigids -t [target phylum]

runfile模式采用以制表符分隔的文件,其中包含contigs、变量和 分类为输入。要运行它,请使用:

sidr runfile -i [runfile] -k tokeep.contigids -x toremove.contigids -t [target phylum]

有关详细信息,请参见documentation 细节。

待办事项

  • 更完整的文档
  • 更多单元测试

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java将Map<String,String>传递给需要Map<String,Object>   java在循环中使用字符串而不是StringBuilder是否会造成内存损失?   jnlp如何更新java控制台JRE?   java更改、修改和重新打包CXFAPI源文件   JavaFXJava应用程序在Fedora上运行一段时间后关闭   使用来自不同类的方法的java   java如何通过ant脚本在linux中使用subst?   java在使用camunda modeler进行base64编码/解码时出错   获取java。netbeans、weblogic和fastswap设置为true时的lang.NoSuchMethodError   java如何提高FinalizerThread在GC中收集对象的优先级   java检测具有相同根的单词   netbeans crud应用程序中的java错误