生物标志物候选排序的预测能力评价。

epc的Python项目详细描述


https://img.shields.io/badge/python-3.6-blue.svghttps://travis-ci.org/iric-soft/epcy.svg?branch=masterhttps://codecov.io/gh/iric-soft/epcy/branch/master/graph/badge.svg

引用:

简介:

该工具被开发用来评估每个特征的预测能力,以成为候选的生物标志物。在

要求:

  • Python3
  • (可选)virtualenv

安装:

python3 -m venv $HOME/.virtualenvs/epcy
source$HOME/.virtualenvs/epcy/bin/activate
cd[your_epcy_folder]CFLAGS=-std=c99 pip3 install numpy==1.17.0
python3 setup.py install
epcy -h

用法:

概述:

来源:

^{pr2}$

安装后:

epcy -h

一般情况:

  • EPCY设计用于处理任何定量数据,前提是每个特征值在每个样本之间具有可比性(标准化)。在
  • 要进行比较分析,epcy pred需要两个表格文件:
    • 每个样本(列)的定量标准化数据的matrix,用“ID”列标识每个特征。在
    • 描述比较的design表。在
# Run epcy on any normalized quantification data
epcy pred -d ./data/small_for_test/design.tsv -m ./data/small_for_test/exp_matrix.tsv -o ./data/small_for_test/default_subgroup
# If your data require a log2 transforamtion, add --log
epcy pred --log -d ./data/small_for_test/design.tsv -m ./data/small_for_test/exp_matrix.tsv -o ./data/small_for_test/default_subgroup
  • 结果将保存在预测中_能力.xls文件,详情如下。在
  • 您可以使用–subgroup–query对设计文件进行个性化设置
epcy pred_rna -d ./data/small_for_test/design.tsv -m ./data/small_for_test/exp_matrix.tsv -o ./data/small_for_test/subgroup2 --subgroup subgroup2 --query A

  • 要对未进行mormalized的readcounts运行EPCY,请使用pred\u rna工具,如下所示:
  • # To run on read count not normalized, add --cpm --log
    epcy pred_rna --cpm --log -d ./data/small_for_test/design.tsv -m ./data/small_for_test/exp_matrix.tsv -o ./data/small_for_test/default_subgroup
    

    正在进行kallisto量化:

    • EPCY允许使用h5文件直接在kallisto Quantification上工作,以访问引导样本。为此,需要在设计文件中添加一个kallisto列(为每个示例指定查找profentity.h5文件的目录路径)和epcy pred_rna如下所示:
    # To run on kallisto quantification, add --kall (+ --cpm --log)
    epcy pred_rna --kal --cpm --log -d ./data/small_leucegene/5_inv16_vs_5/design.tsv -o ./data/small_leucegene/5_inv16_vs_5/
    # !!! Take care kallisto quantification is on transcript not on gene
    • 为了在基因水平上运行,需要一个基因组注释的gff3文件,以获得转录本和基因之间的对应关系。此文件可在ensembl上下载
    # To run on kallisto quantification and gene level, add --gene --anno [file.gff] (+ --kall --cpm --log)
    epcy pred_rna --kal --cpm --log --gene --anno ./data/small_genome/Homo_sapiens.GRCh38.84.reduce.gff3 -d ./data/small_leucegene/5_inv16_vs_5/design.tsv -o ./data/small_leucegene/5_inv16_vs_5/
    
    • kallisto量化允许在TPM上工作:
    # work on TPM, replace --cpm by --tpm
    epcy pred_rna --kal --tpm --log --gene --anno ./data/small_genome/Homo_sapiens.GRCh38.84.reduce.gff3 -d ./data/small_leucegene/5_inv16_vs_5/design.tsv -o ./data/small_leucegene/5_inv16_vs_5/
    

    输出:

    预测性_能力.xls

    这个文件是主要的输出,其中包含对每个特征(基因,蛋白质,…)的评估。它是一个表格文件9列:

    • 默认列:
      • id:每个功能的id。在
      • l2fc:log2折叠变化。在
      • kernel-mcc:Matthews相关系数(MCC)由预测器使用KDE计算。在
      • kernel_mcc_low,kernel_mcc_high:置信区间的边界(90%)。在
      • 平均值查询:样本的平均值在中指定为查询设计.tsv在
      • mean_ref:样本的平均值指定为ref in设计.ts在
      • bw_query:估计KDE使用的带宽,以计算查询样本的密度
      • bw_-ref:估计KDE使用的带宽,以计算ref样本的密度
    • 使用–正常:
      • 正态分布:用normal分布计算一个预测器。在
    • 使用–auc–utest:
    • 使用–ttest:

    子组_预测.xls

    Using–full一个辅助输出文件(子组_预测.xls)如果样本预测正确,则为每个特征指定。用这个输出构建一个热图可以帮助您探索您的数据。 更多细节即将公布。在

    装袋:

    为了提高计算MCC的稳定性和准确性,可以添加nbagging(使用-bn

    #Take care, it's take n time more longer!!!, use multiprocess (-t) seems a good idea :).
    epcy pred_rna -b 4 -t 4 --cpm --log -d ./data/small_for_test/design.tsv -m ./data/small_for_test/exp_matrix.tsv -o ./data/small_for_test/default_subgroup
    

    欢迎加入QQ群-->: 979659372 Python中文网_新手群

    推荐PyPI第三方库


    热门话题
    编译器构造为什么在Java中允许初始化对Null的引用?   java手动调用javax的actionPerformed。摆动计时器   使用git分支的java Maven版本控制   Java8句子流   java JPA OneToOne和OneToMany实体实例化/创建   java如何将值添加到列表<Map<String,Object>>?   java如何使用ComboBox在一个框架内更改JPanel。getSelectedIndex()   java在比较XML和xmlunit时忽略文本差异   java无法从其他pc连接到本地主机   Java中分配对象id的优雅方式   Java中静态变量的使用   java试图从Neteller获取OAuth访问令牌时产生错误:“服务器返回HTTP响应代码:401表示URL”   Java:基元类型是否会影响性能?   java可以让hasNext()不区分大小写吗?   基于AutoCompleteTextView建议属性或AutoCompleteTextView值的java Android搜索   java流文件到firefox浏览器有时无法打开应用程序对话框   在没有ArrayList的Java中返回数组中的搜索结果   复制java。木卫一。IOException:数据错误(CRC)   java为什么我在尝试删除Facebook测试用户时会出现“方法未实现”错误   java如何使用JNA调用SetProcessReliationPolicy