基因集网络分析
pygna的Python项目详细描述
#pygna:用于geneset网络分析的python框架
当前版本:2.0.5-dev
[![生成状态](http://drone.stracquadaniolab.org/api/badges/stracquadaniolab/pygna/status.svg)](http://drone.stracquadaniolab.org/stracquadaniolab/pygna) [![水蟒服务器徽章](https://anaconda.org/stracquadaniolab/pygna/badges/platforms.svg)](https://anaconda.org/stracquadaniolab/pygna) [![水蟒服务器徽章](https://anaconda.org/stracquadaniolab/pygna/badges/version.svg)](https://anaconda.org/stracquadaniolab/pygna)
pygna是一个用于高通量实验结果网络分析的统一框架。它既可以用作独立的命令行应用程序,也可以作为包包含在您自己的python代码中。
有关pygna功能的概述,请查看下面的信息图,否则请进入[入门](入门)指南。
啊![信息图形](docs/pygna_infographic-01.png)
##安装
使用conda安装pygna的最简单和最快方法:
$ conda install -c stracquadaniolab -c bioconda -c conda-forge pygna
或者,您可以通过pip安装它:
$ pip install pygna
请注意,pip不会安装非python需求。
##入门
典型的pygna分析包括3个步骤:
- 为您正在使用的网络生成rwr和sp矩阵(生成后,您无需再次重复相同的步骤)
- 确保输入基因集的格式正确。如果网络使用entrez id,并且您的文件使用hugo symbols,请使用pygna实用程序进行名称转换。
- 运行你感兴趣的分析。
- 一旦有了输出表,就可以选择可视化一个或多个绘图。
否则您可以查看我们的[snakemake工作流](https://github.com/stracquadaniolab/workflow-pygna)以获得完整的geneset分析; 我们的工作流程包含示例数据,您可以使用这些数据熟悉我们的软件。
下面的示例显示了一些可以使用pygna进行的基本分析
###示例1:运行pygna gnt分析
在此输入上运行pygna,如下所示:
$ cd ./your-path/min-working-example/
$ pygna build-rwr-diffusion barabasi.interactome.tsv –output-file interactome_RWR.hdf5
$ pygna test-topology-rwr barabasi.interactome.tsv disgenet_cancer_groups_subset.gmt interactome_RWR.hdf5 table_topology_rwr.csv –number-of-permutations 1000 –cores 4
$ pygna paint-datasets-stats table_topology_rwr.csv barplot_rwr.pdf
您可以在barplot_rwr.pdf文件中查看结果的绘图,并在table_topology_rwr.csv中查看相应的表。
###示例2:运行pygna gna分析
$ cd ./your-path/min-working-example/
如果矩阵已计算,请跳过此步骤
$ pygna build-RWR-diffusion barabasi.interactome.tsv –output-file interactome_RWR.hdf5
关联分析运行n x m次(n个基因集,m个路径),在本例中,我们仅使用50个置换来避免长时间计算;但是,建议值为1000。
$ pygna test-association-rwr barabasi.interactome.tsv disgenet_cancer_groups_subset.gmt interactome_RWR.hdf5 table_association_rwr.csv -B disgenet_cancer_groups_subset.gmt –keep –number-of-permutations 100 –cores 4
如果在比较步骤中不包括–results figure标志,请按如下方式绘制矩阵
$ pygna paint-comparison-matrix table_association_rwr.csv heatmap_association_rwr.png –rwr –annotate
-k标志只在集合a上保留-b geneset和permutes。
如果未传递setname b,则在geneset中的每对setname之间运行分析。
$ pygna test-association-rwr barabasi.interactome.tsv disgenet_cancer_groups_subset.gmt interactome_RWR.hdf5 table_within_comparison_rwr.csv –number-of-permutations 100 –cores 4
$ pygna paint-comparison-matrix table_within_comparison_rwr.csv heatmap_within_comparison_rwr.png –rwr –single-geneset
您可以查看comparison rwr.png文件中的热图和comparison rwr.csv文件中的相应表。
##文档
pygna的官方文档可以在[readthedocs](https://pygna.readthedocs.io/)上找到。
##作者
- Viola Fanfani(v.fanfani@sms.ed.ac.uk):首席开发人员。
- 乔瓦尼·斯特拉奎达尼奥(giovanni.stracquadanio@ed.ac.uk)
##引文
geneset网络分析的统一框架。维奥拉·范法尼,乔瓦尼·斯特拉奎达尼奥。BioXIV 699926;DOI:^ {A8}
##问题
请发布问题以报告错误或请求新功能。 我们现在正在进行代码重构和标准化I/O行为。