scgen-预测单细胞扰动
scgen的Python项目详细描述
scgen
简介
scgen的tensorflow实现。scgen是一个生成模型,用于预测跨细胞类型、研究和物种的单细胞扰动响应。 (Nature Methods, 2019)。
开始
*使用scgen可以做什么:
在一个具有多个单元类型和条件的数据集上训练并预测对单元类型的扰动效应 你只有一个条件。这个场景可以扩展到多个你想预测的物种 一个特定物种使用另一个或所有物种的效果。
在有两个条件(例如控制和扰动)的数据集上训练,并在第二个数据集上预测 有相似的基因。
删除标记数据上的批处理效果。在这种情况下,您需要为 方法。请注意,
batch_removal
并不要求所有单元格类型都存在于所有数据集中(批处理)。如果 您有数据集特定的单元格类型,它将像以前一样保留。- 我们假设在你的数据集中存在两个条件(例如控制和扰动)。你可以训练模特 你的数据和预测的细胞类型/物种的干扰感兴趣。
我们建议使用规范化数据进行培训。使用scanpy:
规范化管道的一个简单示例
importscanpyasscadata=sc.read(data)sc.pp.normalize_per_cell(adata)sc.pp.log1p(adata)
- 我们进一步建议使用高度可变基因(hvg)。对于本文中的大多数示例,我们使用了top~7000 哈夫格。但是,这是可选的,并且高度依赖于您的应用程序和计算能力。
安装
安装PIP
要从pypi安装最新版本,只需使用以下bash脚本:
pip install scgen
或者通过pip安装开发版本:
pip install git+https://github.com/theislab/scgen.git
或者您可以先安装flit并克隆此存储库:
pip install flit
git clone https://github.com/theislab/scGen
cd scgen
flit install
在Windows机器上,如果您希望从源代码自己构建,您可能需要下载一个C++编译器。示例
对于扰动预测,请检查example 从Kang et al.刺激干扰素(ifn)-β。
对于批量删除,请检查集成四个胰腺数据集的example。
复制纸张结果:
要复制纸质结果,请访问here。
参考文献
洛特福拉希,穆罕默德和沃尔夫,亚历山大和泰斯,法比安J。 “scgen预测单细胞扰动响应。” 自然方法,2019年。pdf