处理gfa1和gfa2格式数据的库

gfap的Python项目详细描述


图形片段程序集(gfa)是表示 序列图,包括装配图、变异图和拼接图。 已经定义了两个版本的gfa(gfa1和gfa2)和几个序列 分析程序一直采用这种格式作为交换格式, 这样可以方便地组合不同的序列分析工具。

这个库实现了gfa1和gfa2规范 描述于https://github.com/GFA-spec/GFA-spec/blob/master/GFA-spec.md。 它允许从gfa格式的文件创建gfa对象 或者从头开始,枚举图形元素(段、链接, 包含、路径和标题行),以遍历图形(通过 遍历出段或入段的所有链接),以搜索 元素(例如连接两个段的链接)和操作 图形(例如,消除链接或段或复制段 在副本上平均分配读取计数)。

用户可以通过定义自己的自定义项轻松扩展gfa格式 标签和记录类型。在gfapy中,很容易编写扩展模块, 它允许为解析定义自定义记录类型和数据类型 以及自定义字段的验证。可以使用 引用、相互引用和标准记录类型的行。

要求

gfapy是为python 3编写的,并使用python3.3版进行了测试。 它不需要任何额外的python包或其他软件。

安装

gfapy作为python包分发,可以使用 python包管理器pip和conda(在bioconda通道中)。

下面的命令安装来自python的当前稳定版本 包裹索引:

pip install gfapy

如果您想从github安装当前的开发版本, 使用以下命令:

pip install -e git+https://github.com/ggonnella/gfapy.git#egg=gfapy

或者可以使用conda安装gfapy。Gfapy是 包含在bioconda(https://bioconda.github.io/)通道中:

conda install -c bioconda gfapy

用法

如果如上所述安装了gfapy,则可以在脚本中导入它 使用传统的python语法:

>>> import gfapy

文档

文档,包括对gfapy的介绍,一个用户手册 api文档托管在readthedocs服务器上, 在url http://gfapy.readthedocs.io/en/latest/处,它可以是 从url下载为pdf https://github.com/ggonnella/gfapy/blob/master/manual/gfapy-manual.pdf

参考文献

<>吉奥吉奥Gnnela和斯特凡库尔兹“GFAPY:一个灵活可扩展的软件 Python中处理序列图的库”,生物信息学(2017)BTx398 https://doi.org/10.1093/bioinformatics/btx398

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java与Groovy正则表达式匹配混淆   java控制台未定义为JSNI   主目录中的java指针异常   java如何获取hashmap中的arrayList的大小   ApachePOI用于文本,Java代码中的word doc(.docx)中没有进行追加   Ruby对象到Java对象   JavaSpringJPA哈希集只返回一个值   Java在执行由配置了精确类路径参数的mavenjarpluin生成的可执行jar时无法找到依赖项   java我试图在画布上写一个文本,但什么也没发生   java HTTP 404源服务器找不到目标资源的当前表示形式,或者不愿意透露存在该表示形式。不起作用   java提取小数点后的最后一个数字   oop Java:无法访问对象的元素   PHP URL中RecyclerView中的java句柄空异常   不调用OnCreateViewHolder的java Update RecyclerView适配器项