自动DNA微卫星基因分型。

ScaleHDALSPAC的Python项目详细描述


啊!!你可能不想使用这个版本的scalehd,除非你知道自己在做什么。改用香草味的。!!

scalehd-alspac是亨廷顿病数据中微卫星重复序列基因分型过程自动化的软件包。 我们使用机器学习方法来考虑自然数据“人工制品”,如PCR滑动和体细胞 马赛克主义,在处理数据时。这为最终用户提供了一个简单易用的平台,可以从输入数据中可靠地预测基因型。

默认情况下,每个样本的输入是一对未对齐的.fastq序列数据,包括正向和反向读取。我们使用正向和反向 为了减少亨廷顿病多重重复序列遗传结构带来的复杂维数问题。允许反向读取 我们要确定当前样本的ccg状态——这为我们提供了一种更容易调用整个基因型的机制。正向读取 在类似的方法中使用,以确定CAG和干预结构。

本申请的概述如下: 1)如果存在大量读取,则输入fastq文件将被子采样。这可以用-b标志推翻。 2)按用户要求进行工序质量控制。我们建议修剪任何5-质数间隔物+底漆组合,以实现最佳对齐。 3)将这些文件与典型的hd结构(cag_1_1_1_ccg_2)参考进行对齐。 4)用数字信号处理对组件进行扫描,以检测任何可能的非典型结构(例如cag_u 1_u ccg_u 3)。 4.1)如果没有检测到非典型等位基因,继续正常进行。 4.2)如果检测到非典型等位基因,则生成自定义参考,并对此进行重新比对。 5)利用适当的等位基因信息和序列组合,对样本进行基因分型。 6)为当前样本写入输出;为队列中的下一个样本(如果存在)重复该过程。

查看http://scalehd.rtfd.io上的完整文档

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
多线程Java(Android)线程每隔一段时间重复任务,并访问值   算法生成添加到目标的所有数学表达式组合(Java作业/面试)   java XML:从SAX内容处理程序中的xsi:type属性查找命名空间uri   java打印字符类型不会产生任何结果   JavaWebLogic。jdbc。扩展。ConnectionAdSqlException:weblogic。常见的资源库。ResourceDeadException   父类的java JFace数据绑定绑定字段   java Javafx TableView始终为空   java如何使我的J2EE web应用程序脱机工作?   java当我使用Android Studio的意图时,没有弹出“包上下文”   java如何更新jar目录中的文件   Java中的新泛型<T>   使用gradle时,java无法在spring引导测试期间加载驱动程序类:“org.h2.driver”   java从安卓向服务器上传图像字节数组文件?   将C#到C再到Java集成时发生OutOfMemoryError/程序崩溃   java我如何只需按下一个按钮就能获得一次安卓位置?   多线程在Java中传递参数或使用静态变量的速度更快?   java Apache Calcite:ReflectiveSchema似乎不支持Linq4j“where”子句的比较表达式中的ParameterExpression   java在安卓:onClick属性的父上下文或祖先上下文中找不到方法   优化javaxx:+UseParNewGC垃圾收集选项仍然有缺陷吗?