从编码细胞系预测新细胞类型ChIPseq峰的ML模型

epitome的Python项目详细描述


缩影

从表观遗传数据集学习TFB的完整管道。在

Epitome Diagram

表位利用染色质可及性数据预测新细胞类型上的转录因子结合位点。表位计算编码区11种细胞类型与新细胞类型之间的染色质相似性,并利用染色质相似性将已知细胞类型中的结合信息传递给感兴趣的新细胞类型。在

要求:

设置和安装:

  1. 创建并激活conda venv:
conda create --name EpitomeEnv python=3.6 pip
source activate EpitomeEnv
  1. 安装缩影:
^{pr2}$

安装用于开发的缩影:

pip install -e .

注:表位配置为tensorflow 1.12/Cuda 9。如果你有不同的 cuda版本,相应更新tensorflow gpu版本。在

要检查您的Cuda版本:

nvcc --version

训练模特

assays=list_assays()[0:3]# list of available ChIP-seq targets epitome can predict onfromepitome.modelsimport*model=VLP(['CTCF','SMC3','RAD21'])model.train(5000)# train for 5000 iterations

评估模型:

model.test(1000)# evaluate how well the model performs on a validation set

使用模型预测:

表位可以进行全基因组预测或区域特异性预测 新的DNase-seq或ATAC-seq样本。在

要对特定区域评分:

chromatin_peak_file=...# path to peak called ATAC-seq or DNase-seq in bed formatregions_file=...# path to bed file of regions to scoreresults=model.score_peak_file(chromatin_peak_file,regions_file)

对整个基因组进行评分:

chromatin_peak_file=...# path to peak called ATAC-seq or DNase-seq in bed formatfile_prefix=...# file to save compressed numpy predictions to.model.score_peak_file(chromatin_peak_file,file_prefix)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java中最小长度的字数计算   java事务处理JavaEE 6   java如何进行5分钟刷新并检查txt是否被修改?   java可以同时拖动多个对象   变量长、双精度、字节、字符在Java中的用途是什么?   spring将XMLBean配置转换为java配置   java检测不可靠网络上的TCP丢失   Java:TCP加密、SSL和Netty   在java中,如何使用isAssignableFrom的映射避免多个if-else   在J2EE动态Web项目中找不到java CSS文件   java遍历领域查询到RealmList   安卓阅读网站内容Java   java如何修改/自定义/反编译Opera mini jar文件?   java死锁播放框架如何使用控制器中的参数检查@RestrictedResource?   java在MS Excel中导入xml文件我们如何使用Python或任何其他编程语言自动化此流程?   java如何暂停正在运行的线程并在需要时重新启动同一线程?