用minhash草图比较dna序列的工具

sourmash的Python项目详细描述


苏尔马什

DocumentationBuild StatuscodecovDOI

计算核苷酸(dna/rna)和蛋白质序列的minhash特征。

用法:

sourmash compute *.fq.gz
sourmash compare *.sig -o distances
sourmash plot distances

sourmash 1.0是published on JOSS;如果您使用sourmash(doi: 10.21105/joss.00027),请引用这篇文章。


名字是Mash的即兴模仿, 加上@ctb对威士忌的喜爱。 (Sour mash用于 制作威士忌。)

主要作者:C. Titus Brown@ctb)和Luiz C. Irber, Jr@luizirber)。

苏尔马什是 Lab for Data-Intensive BiologyUC Davis School of Veterinary Medicine

安装

我们建议使用Bioconda安装Sourmash:

conda install -c conda-forge -c bioconda sourmash

这将安装最新稳定版本的Sourmash 2。

您也可以使用pip安装sourmash:

pip install sourmash

快速入门教程is available

要求

Sourmash在Python2.7.x和Python3.5+下运行。基地 要求是SRIDED和IJSON,再加上C++开发 环境和cpython开发头和库(用于 C++扩展。

比较代码(sourmash compare)使用numpy,并绘制 代码使用matplotlib和scipy,但是大多数代码在没有 这些。

对于searchgather,您还需要khmer版本2.1+。

安装conda

bioconda是conda包管理器的一个通道,重点是生物信息软件。安装conda之后,您需要添加bioconda通道以及other channelsbioconda所依赖的。一旦安装了bioconda,就可以通过运行以下命令安装sourmash:

$ conda create -n sourmash_env -c conda-forge -c bioconda sourmash python=3.7
$ source activate sourmash_env
$ sourmash compute -h

它将安装最新的alpha版本。

支架

请提出问题并归档问题 on Github

开发

在Github上进行开发 dib-lab/sourmash

安装后,sourmash是主要的命令行入口点; 使用python -m sourmash运行它,或执行pip install -e /path/to/repo以 在虚拟环境中安装开发人员。

sourmash/目录包含库代码。

测试需要py.test,可以使用make test运行。

有关详细信息,请参见the developer notes


CTB公司 2018年12月

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Log4j:运行服务器日志时发出警告   ssl与Java通信到TLSEncypted CUPS打印服务器   Guice Java提供的方法没有已知的依赖关系?   java Android:EditText的默认文本大小是多少?   更正错误字符串的Java异常   string Java如何从来自多个源的数据推断类型   从路径错误创建java文件   java获取不同类安卓中切换按钮的状态   java扩展AnyVal和AnyRef的对象的内存分配有什么不同   java如何从callable(即runnable)获取类名   java Hornetq大量消息填满了磁盘空间   用java从excel中读取一行的多列?   java不使用JAXB将映射转换为XML   java将多个图像与一个图像进行比较   当X扩展Y时,javax不适用于参数Y   运行时jar文件中未显示java Python输出   JavaSpringMVC3:定义自己的DatatypeBinding   java从fragment类调用activity函数给出了NPE   java在时区、日历和SimpleDataFormat方面存在奇怪的问题