一组脚本,用于将多个breseq分析转换在一起并突出显示感兴趣的变量。

isolateparser的Python项目详细描述


隔离分析器

使用

python isolateset_parser.py [-h] [-i FOLDER] [--no-fasta] [-w WHITELIST]
                            [-b BLACKLIST] [-m SAMPLE_MAP] [--filter-1000bp]

optional arguments:
  -h, --help            show this help message and exit
  -i FOLDER, --input FOLDER
                        The breseq folder to parse.
  --no-fasta            Whether to generate an aligned fasta file of all snps
                        in the breseq VCF file.
  -w WHITELIST, --whitelist WHITELIST
                        Samples not in the whitelist are ignored. Either a
                        comma-separated list of sample ids for a file with
                        each sample id occupying a single line.
  -b BLACKLIST, --blacklist BLACKLIST
                        Samples to ignore. See `--whitelist` for possible
                        input formats.
  -m SAMPLE_MAP, --sample-map SAMPLE_MAP
                        A file mapping sample ids to sample names. Use if the
                        subfolders in the breseqset folder are named
                        differently from the sample names. The file should
                        have two columns: `sampleId` and `sampleName`,
                        separated by a tab character.
  --filter-1000bp       Whether to filter out variants that occur within
                        1000bp of each other. Usually indicates a mapping
                        error.

输入

脚本需要一个单独运行breseq的文件夹,每个文件夹都以isolate/sample命名。 scits只需要每个文件夹中的output.vcfannotated.gd和{}文件。 文件夹示例:

^{pr2}$

输出

这些脚本在breseq run文件夹中生成一个excel文件,包含4个工作表:comparisonvariantcoverage,和{}。 variantcoveragejunction表只是breseq运行中所有示例的串联表。在

比较表

一种表,其中每一行都表示在示例调用集中看到的单个突变 样本由列表示,每一个样本都有交替的序列。在

Sample1Sample2Sample3annotationdescriptiongenelocusTagmutationCategorypositionpresentInpresentInAllSamplesrefseq id
GGGGGGintergenic (+65/+20)putative lipoprotein/putative hydrolasePFLU0045 - / - PFLU0046PFLU0045/PFLU0046small_indel4588131GNC_012660
CCCCCCintergenic (+17/-136)microcin-processing peptidase 1. Unknown type peptidase. MEROPS family U62/hypothetical proteinPFLU0872 - / - PFLU0873PFLU0872/PFLU0873small_indel98533331CNC_012660
intergenic (+57/+21)hypothetical protein/putative helicasePFLU3154 - / - PFLU3155PFLU3154/PFLU3155small_indel344798631NC_012660
AAGM350I (ATG-ATA)putative GGDEF domain signaling proteinPFLU3571 -PFLU3571snp_nonsynonymous395963120GNC_012660
AACT238P (ACC-CCC)hybrid sensory histidine kinase in two-component regulatory system with UvrYPFLU3777 -PFLU3777snp_nonsynonymous417323110ANC_012660
GGGGcoding (322/1476 nt)putative two-component system response regulator nitrogen regulation protein NR(I)PFLU4443 -PFLU4443small_indel490823310GNC_012660

对齐的fasta文件

这些脚本还生成3个fasta文件(breseq.snp.fastabreseq.amino.fastabreseq.codon.fasta) 每个样本中的所有非同义snp都由替换碱基、氨基酸和密码子表示。 示例:

>reference
GA
>Sample1
AA
>Sample2
AA
>Sample3
GC

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
编译器构造为什么在Java中允许初始化对Null的引用?   java手动调用javax的actionPerformed。摆动计时器   使用git分支的java Maven版本控制   Java8句子流   java JPA OneToOne和OneToMany实体实例化/创建   java如何将值添加到列表<Map<String,Object>>?   java如何使用ComboBox在一个框架内更改JPanel。getSelectedIndex()   java在比较XML和xmlunit时忽略文本差异   java无法从其他pc连接到本地主机   Java中分配对象id的优雅方式   Java中静态变量的使用   java试图从Neteller获取OAuth访问令牌时产生错误:“服务器返回HTTP响应代码:401表示URL”   Java:基元类型是否会影响性能?   java可以让hasNext()不区分大小写吗?   基于AutoCompleteTextView建议属性或AutoCompleteTextView值的java Android搜索   java流文件到firefox浏览器有时无法打开应用程序对话框   在没有ArrayList的Java中返回数组中的搜索结果   复制java。木卫一。IOException:数据错误(CRC)   java为什么我在尝试删除Facebook测试用户时会出现“方法未实现”错误   java如何使用JNA调用SetProcessReliationPolicy