python版本的r gsalib将gatk报表读入pandas数据帧

gsalib的Python项目详细描述


gsalib使得python用户可以轻松地分析由broad institute的基因组分析工具包(gatk)创建的度量报告。broad提供了一个名为gsalib的r库,允许您将gatkreport文件加载到r中进行进一步的分析(https://gatkforums.broadinstitute.org/gatk/discussion/1244/what-is-the-gatkreport-file-format)。pythongsalib是r库的一个改编,它允许您将gatkreport文件加载到python/pandas数据帧中。

r和python版本的gsalib都不支持由Picard Tools创建的samtools.metrics报告。要使用python分析picard报告,请考虑在Crimson模块中使用picard.parse函数。

功能

  • 使用强大的pandas数据框架和绘图功能分析gatk报告
  • 读取gatkreport版本0.x和1.x
  • 兼容python>;=2.7和>;=3.4

安装

通过运行安装gsalib

pip install gsalib

示例

读取报表并获取表的数据帧:

from gsalib import GatkReport

report = GatkReport('/path/to/gsalib/test/test_v1.0_gatkreport.table')
table = report.tables['ExampleTable']

许可证

这个项目是根据麻省理工学院的许可证授权的。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
安卓在java中加入字符串组以创建复合字符串   java系统甚至不点击“下一步”或“上一步”按钮就将我返回到上一页,而不是进入下一页   java如何在arrayList中获取特定列的不同值   CXF GZIP REST JAVA   Java:使用大量半恒定标志检查优化循环中的循环?   java如何在两个应用程序之间进行会话管理?   java SVG文件使用蜡染(但没有轴线)转换为PNG   使用协议缓冲区和内部数据模型的java   java如何在logtag 安卓中打印和查看字符串的值   javascript如何在NodeJs中应用Java/Spring的分层架构?   java Spring URL在JSP中编码不正确   模式对话框后面的java工具提示   java WSRPC生成日历对象而不是日期   在对象外部无法识别类变量   java将图像从文件读/写到BuffereImage的最快方法?   JavaSpring数据存储库对具有不同Id的子类使用抽象超类   安全在Java 5.0上运行web应用程序服务器有危险吗?