基于分岔分析的单细胞聚类python

PySCUBA的Python项目详细描述


pyscuba代表“python for single cell clustering using bi叉 分析”。

pyscuba是一种新的提取谱系的计算方法 单细胞基因组学数据的关系和动力学建模 与细胞分化相关的变化。皮斯库巴从 非线性动力学技术与随机知识 微分方程为建模提供了系统框架 涉及多沿袭规范的复杂过程。

该方法有一个matlab实现。然而,皮斯库巴是 彻底检修和重新设计,其中一些错误,数学 已采取不一致和异常情况处理不当的措施 关心。pyscuba还附带了一个gui,使用python包装器编写 对于qt框架。

pyscuba是开源的,可以使用而无需支付高昂的许可费 这妨碍了我们的一些同事。此外,皮斯库巴是 处理计算和数据的速度更快、效率更高的方法 相应计算生物学方法的基础处理。打开 比较基准,发现在Matlab代码中 大约20分钟后完成,Pyscuba在大约30分钟内完成相同的任务 几秒钟。

安装

pyscuba是用python 2.7编写的。它依赖于以下库 和API:*^{TT1}$(1.4.3或其他版本)*^{TT2}$ (1.9.0或更高版本)*Pillow(3.2.0或更高版本)*PyQt4(至少 版本4.11.4)*python-igraph(版本>;=0.7.1)*rpy2(2.8.1 或更高版本)*scipy(0.17.0或更高版本)*setuptools (版本>;=21.0.0)*sklearn(版本>;=0.17.1)*Wand(版本 0.4.3或后续)

大多数依赖项都应该在 使用pip安装,方法是*启动终端;*运行 $ pip install PySCUBA

尽管如此,请确保以前满足了所有这些先决条件 继续。尤其是,PyQt可能必须 手动安装。另外,请注意,您可能需要运行 根据您的python安装使用sudo

或者,您也可以通过下载 来自相应github页面的tarball或zip存档。一旦你有了 下载并解压源,导航到根源 目录并运行:

$ python setup.py install

用法

在终端中,运行

$ PySCUBA

一个图形用户界面应该弹出。

选择要处理的文件并选择相关的数据类型和其他 这些参数。对这些选项的详细解释可以是 通过将光标保持在一个特定的按钮上获得;这个 包括数据集的格式规范。

在您的数据经过 GAP统计与惩罚极大似然估计 福克-普朗克势的参数,将提示您选择 在pyscuba gui中显示的各种输出文件。你可以滚动 向上和向下显示窗口,以及放大和缩小。

示例

一个完整的、带注释的示例,演示了标准用法 皮斯库巴就在这里。

首先,在python会话中,让我们导入几个模块。 Pandas将非常方便地获取示例数据集:

from os import getcwd, path
import pandas as pd

所讨论的数据集是来自Deng等人的一些QPCR数据,“单细胞 rna-seq揭示哺乳动物动态随机单等位基因表达 细胞。“科学。2014年1月10日;343(6167):193-6。它可以从 特定的github存储库,其url显示在下面。我们想要 该文件的内容,而不是其完整的github视图,这就是为什么我们使用 Raw链接到该存储库并解释缺少任何blob/ 在其url路径中:

url = 'https://raw.githubusercontent.com/gcyuan/SCUBA/master/sample_data/guo2010/guo2010Data.txt'
df = pd.read_csv(url, delimiter='\t')

通过键入来检查是否没有发生任何异常情况

df.head()

我们现在要把这个数据框写到一个tab-sepaated*.txt文件 在当前工作目录中:

df.to_csv(path.join(getcwd(), 'super_duper_data.txt'), sep='\t', index=False)

在您的终端中,我们现在准备启动pyscuba图形用户 接口,可以从任何目录启动(不一定是 一个持有super_duper_data.txt):

$ PySCUBA

请参阅pyscuba的github页面,以获取屏幕截图,说明pyscuba gui在开始时的外观,如何选择super_duper_data.txt进行处理,以及, 一旦尘埃落定,如何选择要显示的文件 调查。

归因

如果你觉得派斯库巴对你的研究有用,请引用它的github 存储库:

Giecold G,Pyscuba,(2016),Github仓库, https://github.com/GGiecold/PySCUBA

相应的bibtex条目是

@misc{Giecold2016,
  author = {Giecold, G.},
  title = {PySCUBA},
  year = {2016},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/GGiecold/PySCUBA}},
  commit = {8ee6a08de15decdcdaf7d877888ae783832d80f2}
}

此外,请同时引用以下参考资料:

马可E,卡尔R,郭G,罗布森P,哈特A,特里帕L,袁GC。(2014年) 单细胞基因表达数据的分岔分析揭示 后生景观”。国家科学院学报, 111,E5643-E5650。

许可证

版权所有2016-2021 Gregory Giecold。

Pyscuba是麻省理工学院许可下提供的免费软件。为了 详细信息请参见许可文件。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
文件系统是否可以用java覆盖文件,使其无法恢复?   java在一个应用程序中集成Spring Boot和Node js   java如何使用MySQL后端设置Hibernate save()调用的超时?   java为什么我的Gremlin迁移查询只从每个顶点添加一条边?   java是否有方法提取单击的JPanel?   macos在MacOSX上为JDK7u4在Eclipse中设置什么JRE主页?   java JaxWsPortProxyFactoryBean查询超时   java SimpleDataFormat转换   java递归地打印序列:2,5,3,11,14,…   java在JPA查询中包含枚举   在Java8中创建内存泄漏   使用java 11的windows JFXPanel设置   hibernate Java NoClassDefFound错误