从高吞吐量顺序读取中修剪适配器
cutadapt的Python项目详细描述
剪切适应
cutadapt查找并删除适配器序列、引物、poly-a尾部和其他 高吞吐量排序读取中不需要的序列类型。
通常需要这样清理数据:从小rna中读取 序列包含3'序列适配器,因为读取的长度超过 被测序的分子。扩增子从引物序列开始读取。 poly-a尾巴对从样本中提取rna很有用,但通常 不想让他们出现在你的书里。
cutadapt通过找到适配器或底漆来帮助完成这些修剪任务 以容错方式的序列。它还可以修改和过滤读取 各种方式。适配器序列可以包含iupac通配符。也, 支持成对的结束读取,甚至支持颜色空间数据。如果你愿意,你可以 另外,只需解复用输入数据,而不必删除适配器序列。
Cutadapt提供了一套广泛的自动化测试,可在 麻省理工学院执照的条款。
如果你使用CutAdapt,请引用 DOI:10.14806/ej.17.1.200。