甲基化预测的模块化深度学习方法。
methylnet的Python项目详细描述
甲基网
甲基化深度学习
methylnet是一个命令行工具和python库,它提供类来处理甲基化数据的深层学习任务。它建立在(https://github.com/Christensen-Lab-Dartmouth/PyMethylProcess)中引入的pythonic甲基化射线数据类型的基础上,并使用pytorch来探索/预测甲基化数据。
https://www.biorxiv.org/content/10.1101/692665v1
帮助文档:https://christensen-lab-dartmouth.github.io/MethylNet/
甲基网可以做什么:
- 通过超参数和神经网络拓扑网格搜索训练变分自编码(vae)提取dna甲基化潜空间。
2.对甲基化数据(如年龄、细胞类型比例和疾病状态)进行分类、单输出和多输出回归预测。这是在转移学习vae拓扑和超参数神经网络拓扑网格搜索之后完成的。
三。使用shap查找最重要的预测cpg,解释个人和加积类级别的预测。
四。使用流行的管道(如lola、gometh、gsea)查询这些提取的cpg,并将cpg与其他已知的cpg集合重叠。此外,顶部的cpg集合与其他预测的cpg重叠。
注意:图像将被更新以反映最新的methylnet命令集。
methylnet目前正在审查中,wiki页面正在进行中。可以在:https://www.biorxiv.org/content/10.1101/692665v1
访问BioXIV。帮助文档:https://christensen-lab-dartmouth.github.io/MethylNet/
install(强烈建议使用conda,但可以使用docker):
- conda create-n methylnet python=3.6
- 源激活甲基网
- 有关pymethylprocess的安装说明,请参见https://github.com/Christensen-Lab-Dartmouth/PyMethylProcess
- Conda安装Pythorch TorchVision-c Pythorch
- pip安装methylnet
- 替代安装:克隆此存储库并运行python setup.py sdist bdist戋u wheel&;pip install dist/methylnet-0.1.tar.gz
- 为GSEA集合运行:下载帮助数据
- 备选docker安装:docker pull joshualevy44/methylnet:0.1
*如果只想使用CPU,只需要核心Docker或Singularity,有关如何提取Docker图像的信息,请参见Singularity网站
*请参阅https://singularity.lbl.gov/faq#does-singularity-support-containers-that-require-gpus以获取有关使用gpu使用singularity的信息
*nvidia docker也是相当于运行gpu作业的docker - 如果您的计算机具有GPU访问权限,也可以通过基本安装(不带Docker或考虑NVIDIA Docker选项)使用GPU。
运行甲基网:
- 源激活甲基网
- 预处理管道:可从https://github.com/Christensen-Lab-Dartmouth/PyMethylProcess获得从450k/850k IDAT到易于学习的甲基化数据类型的指令。
- 运行嵌入超参数扫描
- 选择顶部嵌入超参数并再次进行最后一次训练
- 运行预测超参数扫描
- 选择Top Prediction超参数并再次训练一次
- 通过运行shap查找顶级cpg。
- 询问shap派生的cpg。
- 有关用法,请参见帮助文档。
正在运行测试管道:
- Docker Pull Joshualevy44/甲基网:0.1
- 备选方案:sh docker_build.sh
- Docker Run-IT Joshualevy44/甲基网:0.1
- 备选方案:sh run_docker.sh
- 甲基网试验管道
运行管道的示例:
有关如何显式运行的示例,请参见./example_脚本: