命令行工具根据底漆位置读取软夹。

Katana的Python项目详细描述


===
katana
=



图片:https://travis-ci.org/umich-brcf-bioinf/katana.svg?分支=开发
:目标:https://travis ci.org/umich brcf bioinf/katana
:alt:构建状态

…图片::https://coveralls.io/repos/github/umich-brcf-bioinf/katana/badge.svg?分支=开发
:目标:https://coveralls.io/github/umich-brcf-bioinf/katana?branch=development
:alt:coverage status

因此,感兴趣的区域通常以这些引物序列开始和结束,这些序列与参考序列完全匹配,并且不反映实际的样本序列。在
一些面板设计中,放大镜可以平铺,使得一个
感兴趣区域的放大镜可以重叠不同放大镜的底漆区域。在这种
排列中,重叠区域应能检测出
落在该引物区域内的变体。然而,引物序列的存在通常会压倒真实的低频变体的特征。





katana根据读取的起始位置将每个读取匹配到相应的引物对。然后,katana从读取序列的边缘软剪辑引物区域,通过重叠的
扩增子来拯救真正变体的信号。该输出在概念上类似于根据序列标识从原始fastq读取的硬剪裁引物,但其优点是在对齐过程中保留引物可以提高对齐质量。

扩增子a[感兴趣的primerregion聚合物]
Amplicon B[PrimerRegion of InterestPrimer]
输入read1序列:tgcatgagtcgtagttgacgtc
输入read2序列:atctaggtagttgacgtcagataatgcagc

输出read1序列:tgcatgagtcgtagttgacgtc(剪裁的Amplicon A引物)
输出读数2序列:ATCTaggtagttgacgtagaatgcagc(剪接的Amplicon B引物)
(小写=软剪接)



标签被添加到每个输出读数中,以帮助解释如何修改:
-x0:关联的引物ID
-x1:原始雪茄串
-x2:original reference start
-x3:原始引用结束(信息性;对反向读取有用)
-x4:排除读取的原因(仅当--preserve_all_alignments时出现)



katana假设:
-输入bam被索引
-引物是有意义的反义对
-primer对位于同一染色体上
-引物染色体与bam区域匹配
-引物文件被制表符分隔;标题行包括以下字段:
*客户目标id
*chr
*检测开始
*反义开始
*检测序列
*反义se序列
-在基于1的坐标中指定引物文件检测和反义启动



----
快速启动
----


1。**安装武士刀(请参见install.rst):**
::
$pip安装武士刀


2。**获取示例目录:**
::
$git clone https://github.com/umich brcf bioinf/katana

>3。**运行katana:**
::
$katana katana/examples/primars.txt katana/examples/chr10.pten.bam clipped.bam

这将读取chr10.pten.bam并生成clipped.bam,其中包含调整为软剪辑(不包括)其各自的底漆区域的读取
。不包括未映射的读操作
或与已知底漆不匹配的读操作。



----
katana help
----




$katana--help


:katana primer_manifest input_bam output_bam

匹配输入bam到primer中的每个对齐,软剪裁primer区域。


位置参数:
primer_manifest path to primer manifest(制表符分隔文本)
input_bam path to input bam
o输出bam的utput_bam路径



ents(即使它们
未映射,也不能与引物匹配,导致
无效雪茄等)


====


电子邮件bfx-katana@umich.edu以获取支持和问题。



===


0.1.2(11/2/2017)
----
-添加/正确更新mc标记
-排除mate时修复错误的mate信息

-正确设置mate start pos为0
-删除mc标记(如果存在)

-清理bam标记的primer名称
-扩展DED支持的Pysam版本包括0.9-0.12



>0.1.1(2/9/2016)
————————————————————————————————————————————————————————————————————————————————————————————————————————————-将BAM标记添加到排除的读取中(在--保留所有读取时有用)
-调整以提高性能(大约快6倍)
-添加对PIP安装的支持
-添加功能测试
-添加对Travis CI的支持
-添加对python3的支持
-添加对pysam 0.8的支持.3

0.1(1/28/2016)
----
-初始版本




katana由密歇根大学编写和维护
brcf生物信息核心;个人贡献者包括:

-chris gates
-peter ulintz


欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java三角测距   java Spring异步任务返回未来   java如何显示数据库中的下一条记录   java这些读取用户输入的方法有什么不同?   java Spring+Spring安全请求只接受contenttype xwwwformurlencoded   checkName()和将用户输入存储到ArrayList和boolean[]的java问题   java如何使用JPA和Facade?   java Neo4j类型不匹配   java如何依赖Maven的系统包?   通过FileChooser保存pdf格式会提示在java中出现第二个对话框   java如何将通量链接到另一个通量/单声道并应用另一个背压?   java如何修复安卓 studio中的权限错误?   尝试清除JavaFX ObservableMap时出现java ConcurrentException   java编辑文本。GetText,返回关于null引用的异常,但已声明该异常   mysql组织。乔达。时间LocalDate在Redhat(Linux)java上显示少一天   在java中通过序列化获取多个对象   有人有java注释“java.lang.Synthetic”的背景吗?