处理gfa1和gfa2格式数据的库
gfap的Python项目详细描述
图形片段程序集(gfa)是表示 序列图,包括装配图、变异图和拼接图。 已经定义了两个版本的gfa(gfa1和gfa2)和几个序列 分析程序一直采用这种格式作为交换格式, 这样可以方便地组合不同的序列分析工具。
这个库实现了gfa1和gfa2规范 描述于https://github.com/GFA-spec/GFA-spec/blob/master/GFA-spec.md。 它允许从gfa格式的文件创建gfa对象 或者从头开始,枚举图形元素(段、链接, 包含、路径和标题行),以遍历图形(通过 遍历出段或入段的所有链接),以搜索 元素(例如连接两个段的链接)和操作 图形(例如,消除链接或段或复制段 在副本上平均分配读取计数)。
用户可以通过定义自己的自定义项轻松扩展gfa格式 标签和记录类型。在gfapy中,很容易编写扩展模块, 它允许为解析定义自定义记录类型和数据类型 以及自定义字段的验证。可以使用 引用、相互引用和标准记录类型的行。
要求
gfapy是为python 3编写的,并使用python3.3版进行了测试。 它不需要任何额外的python包或其他软件。
安装
gfapy作为python包分发,可以使用 python包管理器pip和conda(在bioconda通道中)。
下面的命令安装来自python的当前稳定版本 包裹索引:
pip install gfapy
如果您想从github安装当前的开发版本, 使用以下命令:
pip install -e git+https://github.com/ggonnella/gfapy.git#egg=gfapy
或者可以使用conda安装gfapy。Gfapy是 包含在bioconda(https://bioconda.github.io/)通道中:
conda install -c bioconda gfapy
用法
如果如上所述安装了gfapy,则可以在脚本中导入它 使用传统的python语法:
>>> import gfapy
文档
文档,包括对gfapy的介绍,一个用户手册 api文档托管在readthedocs服务器上, 在url http://gfapy.readthedocs.io/en/latest/处,它可以是 从url下载为pdf https://github.com/ggonnella/gfapy/blob/master/manual/gfapy-manual.pdf。