基于自定义内联条形码的BAM文件中重复数据消除读取的命令行工具。
Connor的Python项目详细描述
概述
在分析深部层序天然气数据时,有时很难区分 罕见变异的测序和PCR错误;因此,一些变异可能 被忽略,一些将被识别为不准确的变异频率。到 解决这个问题,研究人员可以在样本期间附加随机条形码序列 准备。在排序时,条形码充当跟踪集合的签名 PCR扩增的分子回到原来的生物分子 从而区分原始分子中的稀有变体 下游引入的错误。
connor接受一个条形码的成对对齐文件(bam),对这些输入进行分组 对齐到族中,将每个族组合到一致对齐中,以及 发出一组重复数据消除一致性对齐(BAM)。
< Buff行情>连接工作流:
排序[FastQ 1/2]->;对齐器[BAM]->;连接器[BAM]->;变异检测[VCF]
Connor First根据原始路线的 对齐位置和通用分子标签(umt)条形码。(康纳假设 传入的对齐序列以umt条形码开始。)每个系列 然后将对齐合并为单个一致对齐;差异 在基本要求和素质是由多数票通过家庭成员。 默认情况下,排除较小的族(<;3对对齐对)。
有关详细信息,请参见: