一个在具有敲除控件的芯片序列数据集中发现基序的包

peako的Python项目详细描述


豌豆

什么是豆子?

Peako在芯片序列数据集中发现了具有敲除控件的基序。peako将成对的wild-type/knockout bam文件以及几个引用文件作为输入。它返回一个排序主题的文件(请参阅我们的论文了解更多详细信息)。

快速启动

依赖性

  1. 康达(小康达或水蟒)
  2. Meme Suite 4.12.0版,带Centrimo二进制文件*(见下文)

安装

  1. 下载peako的environment文件。
  2. 打开终端并在下载目录中运行conda env create -f peako-env.yml。这将创建一个名为“peako”的conda环境。
  3. 运行conda activate peakosource activate peako激活此环境。
  4. 通过运行python3 -m pip install peako,从pypi安装peako。
  5. 您可以通过运行peako --help来测试这是否有效。

修改后的centrimo二进制文件的说明

*我们修改后的centrimo应用程序将并入meme套件的下一个主要版本中。 在此之前,您可以从源代码安装meme套件,并使用我们自己的peako替换它的二进制文件。

  1. MEME Suite Download page下载meme发行版4.12.0。
  2. 按照MEME Suite Installation page上的“快速安装”步骤进行操作,直到make install
  3. 在运行make install之后,将$HOME/meme/bin/centrimo替换为modified CentriMo binary
  4. 确保$HOME/meme/bin位于$PATH上。现在您应该可以调用centrimo --help

用法

peako使用snakemake,这是一个工作流管理系统。 您可以使用slurm作业调度系统在本地或计算集群上运行peako。 要在slurm上运行,必须创建自己的cluster.config文件(template),并通过--sm-cluster-config将其提供给peako。

工作流的每个步骤要么继承自主激活conda环境(“peako”),要么使用自己的独立环境。 如果正在处理计算群集,请首先在具有Internet访问权限的节点上使用--sm-build-envs运行peako,以创建这些附加的conda环境。 然后,您可以在没有Internet的集群上运行它,提供一个slurm配置文件(见上文)。

激活peako的conda环境(conda activate peakosource activate peako)后,可以按如下方式运行peako:

peako <outdir> <wt-bam> <ko-bam> <organism> <chr-sizes> <trf-masked-genome> <motif-database> [options]

有7个必需的参数。请提供文件和目录的完整路径。

    {< CD18> }:输出目录(请确保已存在);所有输出目录和文件将在此处创建
  • wt-bam:野生类型的bam示例文件
  • ko-bam:敲除BAM示例文件
  • organism:有机体的名称(必须是mousehuman
  • chr-sizes:参考基因组的染色体大小文件(txt)
  • trf-masked-genome:trf屏蔽参考基因组文件(fasta)
  • ^ }:JasPar基序数据库(MEME)

以下是可选参数:

概述:

  • {< CD27 > }或^ {CD28>}:访问帮助消息并退出
  • {< CD29 > }或^ {CD30}}:显示程序的版本并退出

Peako子模块:

    {CD31>}:转录因子基序JasPAR标识符(如MA083.3)
  • -m <MOTIF>:转录因子基序公共名(如srf)
  • --extra:输出所有用于打印的中间peako文件
  • --pickle:使用上次运行的pickled peako字典

蛇食动物:

  • {CD14> }:为工作流创建CONDA环境并退出(要求Internet连接)
  • --sm-cluster-config:snakemake集群配置文件(json)

输出

目前,peako为每个步骤生成输出目录和文件。 这些都可以在您提供的outdir目录下找到。 peako的主要输出文件是<outdir>/peako_out/peaKO-rankings.txt,其中包含一个排序的基序列表。

其他资源

源代码位于:https://github.com/hoffmangroup/peako

我们已经把current version of the codeexample HTML and TXT CentriMo outputs,和modified CentriMo binary放在泽诺多。

引文

如果您觉得peako有用,请引用:

丹尼斯科D,维纳C,霍夫曼M。具有敲除控制的芯片序列数据集中的基序说明。biorxiv<;id>;[预印本]。2019年提供自:https://doi.org/<;id>;

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java广播接收器未检测到按键事件   java不为特定列更改创建修订   java采用了更实用的方法   java桌面窗格HTML呈现   java处理internet连接丢失   java在调整JFrame的大小时,如何防止JTable的列调整大小?   如何用Java中的“Scanner.hasNext”完成程序   具有模块名称的java停止IntelliJ项目工具窗口?   执行已编译的Rails-Warbler JAR文件时发生java加载错误   java Spring数据redis存储库不支持集合查询?   每个客户端的java队列请求   获取Java中的JSON嵌套数组元素   java GWT,Vaadin ConcurrentModificationException   firebase存储中的java在保存照片之前,我需要发送两次照片   JavaSpringEleaf如何在容器外使用变量