cptac数据的python打包
cptac的Python项目详细描述
cptac
该项目旨在促进从国家癌症研究所cptac联合会获取癌症数据并与之交互,该联合会描述和研究肿瘤的蛋白质基因组景观。目前,可用的数据集有:子宫内膜癌、卵巢癌和结肠癌。这些癌症研究可以通过我们的python包作为原生dataframe对象下载,因此可以非常快速和方便地与其他基于python的数据分析工具集成。按照我们的演练教程演示如何使用我们的系统。
有关安装说明,请参见doc/setup.md
教程
这个包的教程描述了如何使用包函数对所提供的数据进行研究。所有教程都是使用交互式jupyter笔记本用python编写的。如果您不熟悉jupyter,请按照jupyter.org/install上的说明进行操作。然后,您将能够以交互式、探索性数据分析的形式运行我们的教程。
- 教程1:CPTAC数据介绍
- 教程2:使用pandas处理cptac数据帧
- 教程3:使用cptac连接数据帧
- 用例1:比较单个基因的转录组学和蛋白质组学
- 用例2:寻找临床属性之间的相关性
- 用例3:将临床变量与乙酰化联系起来
要求
这个包打算在python 3.6上运行,pandas为0.24.2。在教程中,我们使用Seaborn 0.9.0进行数据可视化。
许可证
此软件包包含描述要使用的许可证的license.md文档。请注意应用于代码和数据的许可证之间的区别。