来自NCI-CPTAC梦想蛋白质基因组挑战的一个包

proteo-estimator的Python项目详细描述


蛋白质估计器

概述

我们提出了第一个数据科学竞赛,旨在预测蛋白质水平从拷贝数和转录水平,以及磷酸化水平从蛋白质水平。获胜模型的性能优于标准的基线机器学习方法,并且简单地使用转录水平作为新患者样本的蛋白质水平预测性能的代理。 一项深入的分析揭示了通常的预测基因和重要性之间的联系。我们向社区提供所有提交的模型以供重复使用,并提供一个web应用程序来探索这一挑战的结果,以支持改进肿瘤样本的大规模蛋白质基因组特征,并更好地理解信号解除调控。

安装

pipinstallproteo_estimator

需要Python3

用法

importproteo_estimatoraspr# Subchallenge 2: predicting protein levels from copy number and transcript levelsprediction_file_protein=pr.predict_protein_abundances(tumor,rna,cna,output_dir,logging=True)# Subchallenge 3: predicting phospho levels from protein abundance and transcript levelsprediction_file_phospho=pr.predict_phospho(tumor,rna,protein,output_dir,logging=True)

预测蛋白质丰度

参数

ParameterDefaultTypeDescription
tumorstrTumor type, options are 'breast' and 'ovarian'
rnastrAbsolute file path for rna table. Table must be in TSV format of genes x samples
cnastrAbsolute file path for cna table. Table must be in TSV format of genes x samples
output_dirstrAbsolute file path for output directory. Prediction table and confidence scores will be saved under this directory as prediction.tsv and confidence.tsv
loggingTrueboolPrint progress to stdout

返回值

OutputTypeDescription
prediction_filestrPath to tab-separated file of predicted protein levels in the shape of genes x samples. This file will be saved in the directory passed to the parameter "output_dir" as prediction.tsv

预测磷

参数

ParameterDefaultTypeDescription
tumorstrTumor type, options are 'breast' and 'ovarian'
rnastrAbsolute file path for rna table. Table must be in TSV format of genes x samples
proteinstrAbsolute file path for protein abundance table. Table must be in TSV format of genes x samples
output_dirstrAbsolute file path for output directory. Prediction table and confidence scores will be saved under this directory as prediction.tsv and confidence.tsv
loggingTrueboolPrint progress to stdout

返回值

OutputTypeDescription
prediction_filestrPath to tab-separated file of predicted protein levels in the shape of genes x samples. This file will be saved in the directory passed to the parameter "output_dir" as prediction.tsv

请确保您的Docker守护进程在后台运行。 所有文件路径都必须是绝对路径。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java无法使用JAXB配置Moxy   java如何让我的简单Swing telnet客户端正确显示字符?   java中从可运行线程调用主线程的多线程处理   java数据源。EBJ3会话bean中的getConnection()   使用java和正则表达式从xml文件提取值时出现问题   java定制Jersy胡须Mvc   在Java中,“限制并发”是什么意思?   java有没有更干净的方法可以在这里使用Optional,而不在三个地方返回“NA”?   java Tomcat启动,然后崩溃,除非我打电话   java理解客户机和服务器   java时间戳将在视图对象>实体转换期间丢失   如何在java中返回布尔值(基元)?   java使用spring mvc设置日志记录,希望仅对我的代码进行跟踪/调试   用Jackson解析嵌套对象