单小区数据的半监督生成式自动编码器
sisua的Python项目详细描述
半监督单细胞模型:
- 自由软件:麻省理工学院许可证
- 文档:https://github.com/trungnt13/sisua/tree/master/docs。
参考:
- trung ngo trong、roger kramer、juha mehtonen、gerardo gonzález、ville hautam_ki、merja hein_niemi。“Sisua:单细胞数据的半监督生成自动编码器”,ICML计算生物学研讨会,2019年。[pdf]
安装
您只需要Python 3.6,通过pip安装稳定版本的sisua:
^{tt2}$
在github上安装夜间版本:
^{tt3}$
对于开发人员,我们为sisua贡献创建conda环境sisua_env
^{tt4}$
开始
- 单细胞分析:
- 潜在空间
- 基因表达的估算
- 蛋白质标记的预测
- 高级技术主题:
- Probabilistic embedding
- 分层建模(即将推出)
- 因果分析(coming soon)
- 跨数据集分析
- 基准:
- Scalability test
- 微调网络
- 数据规范化
工具包
我们提供二进制工具包,用于快速高效地分析单细胞数据集:
- sisua-train:训练单细胞建模算法,支持并行训练多个系统。
- sisua-analyze:评估、比较和解释经过训练的模型。
- sisua-embed:半监督训练的概率嵌入。
- sisua-data:即将推出
一些重要的论点:
-model | name of function declared in models
|
-ds | name of dataset declared in data. Description of all predefined datasets is in docs. Some good datasets for practicing:
|
配置
默认情况下,数据将保存在位于~/bio_data的主文件夹中, 实验的输出将存储在~/bio_log
您可以使用环境变量自定义这两条路径:
- 用于存储下载和预处理的数据:SISUA_DATA
- 对于实验:SISUA_EXP
例如:
importosos.environ['SISUA_DATA']='/tmp/bio_data'os.environ['SISUA_EXP']='/tmp/bio_log'fromsisua.dataimportEXP_DIR,DATA_DIRprint(DATA_DIR)# /tmp/bio_dataprint(EXP_DIR)# /tmp/bio_log
或者您可以预先设置变量:
exportSISUA_DATA=/tmp/bio_data exportSISUA_EXP=/tmp/bio_log python sisua/train.py # or using the provided toolkit: sisua-train