基因集网络分析

pygna的Python项目详细描述


#pygna:用于geneset网络分析的python框架

当前版本:2.0.5-dev

[![生成状态](http://drone.stracquadaniolab.org/api/badges/stracquadaniolab/pygna/status.svg)](http://drone.stracquadaniolab.org/stracquadaniolab/pygna) [![水蟒服务器徽章](https://anaconda.org/stracquadaniolab/pygna/badges/platforms.svg)](https://anaconda.org/stracquadaniolab/pygna) [![水蟒服务器徽章](https://anaconda.org/stracquadaniolab/pygna/badges/version.svg)](https://anaconda.org/stracquadaniolab/pygna

pygna是一个用于高通量实验结果网络分析的统一框架。它既可以用作独立的命令行应用程序,也可以作为包包含在您自己的python代码中。

有关pygna功能的概述,请查看下面的信息图,否则请进入[入门](入门)指南。

啊![信息图形](docs/pygna_infographic-01.png)

##安装

使用conda安装pygna的最简单和最快方法:

$ conda install -c stracquadaniolab -c bioconda -c conda-forge pygna

或者,您可以通过pip安装它:

$ pip install pygna

请注意,pip不会安装非python需求。

##入门

典型的pygna分析包括3个步骤:

  1. 为您正在使用的网络生成rwr和sp矩阵(生成后,您无需再次重复相同的步骤)
  2. 确保输入基因集的格式正确。如果网络使用entrez id,并且您的文件使用hugo symbols,请使用pygna实用程序进行名称转换。
  3. 运行你感兴趣的分析。
  4. 一旦有了输出表,就可以选择可视化一个或多个绘图。

否则您可以查看我们的[snakemake工作流](https://github.com/stracquadaniolab/workflow-pygna)以获得完整的geneset分析; 我们的工作流程包含示例数据,您可以使用这些数据熟悉我们的软件。

下面的示例显示了一些可以使用pygna进行的基本分析

###示例1:运行pygna gnt分析

在此输入上运行pygna,如下所示:

$ cd ./your-path/min-working-example/

$ pygna build-rwr-diffusion barabasi.interactome.tsv –output-file interactome_RWR.hdf5

$ pygna test-topology-rwr barabasi.interactome.tsv disgenet_cancer_groups_subset.gmt interactome_RWR.hdf5 table_topology_rwr.csv –number-of-permutations 1000 –cores 4

$ pygna paint-datasets-stats table_topology_rwr.csv barplot_rwr.pdf

您可以在barplot_rwr.pdf文件中查看结果的绘图,并在table_topology_rwr.csv中查看相应的表。

###示例2:运行pygna gna分析

$ cd ./your-path/min-working-example/

如果矩阵已计算,请跳过此步骤

$ pygna build-RWR-diffusion barabasi.interactome.tsv –output-file interactome_RWR.hdf5

关联分析运行n x m次(n个基因集,m个路径),在本例中,我们仅使用50个置换来避免长时间计算;但是,建议值为1000。

$ pygna test-association-rwr barabasi.interactome.tsv disgenet_cancer_groups_subset.gmt interactome_RWR.hdf5 table_association_rwr.csv -B disgenet_cancer_groups_subset.gmt –keep –number-of-permutations 100 –cores 4

如果在比较步骤中不包括–results figure标志,请按如下方式绘制矩阵

$ pygna paint-comparison-matrix table_association_rwr.csv heatmap_association_rwr.png –rwr –annotate

-k标志只在集合a上保留-b geneset和permutes。

如果未传递setname b,则在geneset中的每对setname之间运行分析。

$ pygna test-association-rwr barabasi.interactome.tsv disgenet_cancer_groups_subset.gmt interactome_RWR.hdf5 table_within_comparison_rwr.csv –number-of-permutations 100 –cores 4

$ pygna paint-comparison-matrix table_within_comparison_rwr.csv heatmap_within_comparison_rwr.png –rwr –single-geneset

您可以查看comparison rwr.png文件中的热图和comparison rwr.csv文件中的相应表。

##文档

pygna的官方文档可以在[readthedocs](https://pygna.readthedocs.io/)上找到。

##作者

##引文

geneset网络分析的统一框架。维奥拉·范法尼,乔瓦尼·斯特拉奎达尼奥。BioXIV 699926;DOI:^ {A8}

##问题

请发布问题以报告错误或请求新功能。 我们现在正在进行代码重构和标准化I/O行为。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java变量始终存储0值。为什么?   如何使用Java/REST将Azure blob从一个存储容器移动到另一个存储容器?   java将commons DBCP从1.2升级到1.4,我应该害怕吗?   java如何使用分隔符拆分字符串?   java使用数组读取json对象   java在groovy中切片字符串   交换数组java的两个邻域元素   java移动用于确定字符串是否为回文的逻辑   java Android应用程序在一个活动中崩溃   java Sparkjava将webapp文件夹设置为静态资源/模板的文件夹   java复杂条件表达式,用户易用。   java如何仅在表存在时从表中选择值   java I无法将数据从Recyclerview传递到其他活动   java数据结构最佳设计(大数据)   java Android从DatePickerDialogFragment中删除日历视图   java将数据从Firebase获取到片段   数组。sort()在java中运行不正常