稳定rna加工产物分析仪

starpa的Python项目详细描述


概述

starpa工作流分为多个连续的任务,可以分别执行, 作为一个自由选择的连续子集或按顺序同时执行的所有任务。 这增加了该工具在不同处理状态下用作输入rna序列数据的灵活性。 例如,starpa可以处理fastq格式的原始数据,但也可以处理修剪读取(fastq格式) 或以sam格式对齐读取。

可接受成对端(PE)和单端(SE)序列读取作为输入。

此外,该工具具有高度可配置性,可以以并行方式(多处理)处理多个库。

任务如下:

  • 修剪

cutadapt用于修剪低质量读取的3'端,然后从3'端拆下适配器 阅读量。

对于SE,排除未修剪3'适配器的读取。 这确保了3'末端读取是稳定的rna处理产品是用较高的 信心。

  • 对齐

bowtie2用于将读操作与基因组对齐。所有与基因组的匹配都被记录下来。

  • 萨姆排序

从对齐读取中,将丢弃未映射和不一致映射的读取。此外,只有属于 当路线得分较低时,保留最佳阶层(路线得分等级) 不包括在内。

  • 伪se

具有太多不匹配的比对和具有太多基因组比对的读取将被丢弃。 所有其他读取get nh tag(如果不存在)描述报告的路线数。 次级路线的序列和质量字段中填充序列和质量数据。 最后,pe读取转换为伪se读取,以简化后续的分析步骤。

  • 确定

flaimapper2用于预测稳定的rna加工产物。以确保所有 在处理共享起始或结束位置的产品时,读数根据 他们的长度。随后,flaimmper2分别对每个读片段运行 根据读取计数(估计 挡板-2)超过设定的阈值。对过滤后的预测加工产品进行量化 更精确地说,通过床具相交。

  • 群集

量化处理产品再次被读取计数过滤(bedtools intersect) 超过阈值和相对覆盖率(分配给处理产品的读取的平均覆盖率 除以与加工产品位置对齐的所有读取的平均覆盖率)。 接下来,将分析的所有库中的加工产品组合起来(识别独特的物种) 聚集在一起。

群集是两步过程:

  1. 按重叠分组。
  2. < > >

    由于flaimapper-2对加工产品的预测是概率的,因此预测的结果是 不同库中的处理产品可能略有不同,真正的结果也是如此。 因此,预测的加工产品有很大的重叠和一定的基础 (可调)不重叠的是成簇的具有代表性的过程集群用天然气产品 已选定。

    1. 按序列聚类
    2. < > >

      因为大多数基因组包含重复区域(重复区域、rrna操作、一些trna基因等) 读取可以映射到多个位置,从而产生多个处理产品 从相同或相似的一组读取。 为了减少相同处理产品的数量,它们按序列标识进行集群 通过CDI-HIT-EST。尽管如此,特定阅读的基因组匹配仍然可以在不同环境的基因组区域中进行。 因此,仅基于序列一致性的聚类可以导致序列/上下文(例如不同的基因) 信息丢失。 为了避免这种情况,必须由 它们重叠的内容的聚类(同样通过cdi-hit-est)以及 已选择群集。

      此外,还标识了contig,并使用wig格式的文件(包含 单独的库)被创建。

      • 量化

      代表性加工产品将使用BEDTools Intersect在每个库中进行量化。 将收集其他特征(相对覆盖率、单个位置水平的覆盖率, 一致序列,一致序列的质量,基因组序列,唯一性)。量化数据 也转换为每百万映射读取(RPM)、生物型RPM和生物型组RPM的读取。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何获取所有链接并使用SeleniumWebDriver逐个单击这些链接   java中数组列表的arraylist移位元素   java如何存储具有不同类型参数的元素   java不能使用List<Future<?>>当从不同位置调用时,在方法参数中   java我应该如何修复代码以避免测试代码出错?   安卓 PreferenceFragment java。lang.RuntimeException   java在运行emulator时发现错误   java取消多个AsyncTask回调的有效方法是什么?如果中途满足条件,这些回调将在将来返回?   有没有办法在运行时将方法动态分配给Java类?   java如何将propertyfile与GlassFish一起使用   如何在PHP中使用bcrypt对密码进行哈希处理?   Java和UDP web服务器   java JPA允许EntityListeners执行JPA操作吗?   java执行do while语句时不会产生错误   java无法在edittext中显示数据库中的数据   java Tomcat中活动会话的数量   java在何处使用@SuppressWarnings(“requestfactory”)   netty连接中的java HornetQ异常