python版本的r gsalib将gatk报表读入pandas数据帧
gsalib的Python项目详细描述
gsalib使得python用户可以轻松地分析由broad institute的基因组分析工具包(gatk)创建的度量报告。broad提供了一个名为gsalib的r库,允许您将gatkreport文件加载到r中进行进一步的分析(https://gatkforums.broadinstitute.org/gatk/discussion/1244/what-is-the-gatkreport-file-format)。pythongsalib是r库的一个改编,它允许您将gatkreport文件加载到python/pandas数据帧中。
r和python版本的gsalib都不支持由Picard Tools创建的samtools.metrics报告。要使用python分析picard报告,请考虑在Crimson模块中使用picard.parse函数。
功能
- 使用强大的pandas数据框架和绘图功能分析gatk报告
- 读取gatkreport版本0.x和1.x
- 兼容python>;=2.7和>;=3.4
安装
通过运行安装gsalib。
pip install gsalib
示例
读取报表并获取表的数据帧:
from gsalib import GatkReport report = GatkReport('/path/to/gsalib/test/test_v1.0_gatkreport.table') table = report.tables['ExampleTable']
许可证
这个项目是根据麻省理工学院的许可证授权的。