用弹簧压缩fastq
crunch的Python项目详细描述
松脆的
围绕spring和cram(samtools)的python包装器将fastq压缩为spring,将bam压缩为cram。当压缩fastqs以spring时,可以使用以下标志执行完整性检查:crunchy compress spring --spring-path <springfile> --first <read_1.fastq> --second <read_2.fastq> --check-integrity
安装
Pip
pip install crunchy
Docker
这将在容器中安装crunchy以及samtools和spring。在
^{pr2}$crunchy跑步使用:
docker run clinicalgenomics/crunchy:0.5 crunchy
开发者
git clone https://github.com/Clinical-Genomics/crunchy
pip install -e .
crunchy --help
Usage: crunchy [OPTIONS] COMMAND [ARGS]...
Base command for crunchy
.---. .---.
: : o : me want cookie!
_..-: o : :-.._ /
.-'' ' `---' `---' " ``-.
.' " ' " . " . ' " `.
: '.---.,,.,...,.,.,.,..---. ' ;
`. " `. .' " .'
`. '`. .' ' .'
`. `-._ _.-' " .' .----.
`. " '"--...--"' . ' .' .' o `.
.'`-._' " . " _.-'`. : o :
.' ```--.....--''' ' `:_ o :
.' " ' " " ; `.;";";";'
; ' " ' . ; .' ; ; ;
; ' ' ' " .' .-'
' " " ' " " _.-'
Options:
--spring-binary TEXT Path to spring binary [default: spring]
--samtools-binary TEXT Path to spring binary [default: samtools]
-t, --threads INTEGER Number of threads to use for spring
compression [default: 8]
-r, --reference TEXT Path to reference genome
--log-level [DEBUG|INFO|WARNING]
Choose what log messages to show
--tmp-dir TEXT If specific temp dir should be used
--help Show this message and exit.
Commands:
auto Run whole pipeline by compressing, comparing and deleting...
compare Compare two files by generating checksums.
compress Compress genomic files
decompress Decompress genomic files
工作流程
每个命令都可以单独运行。要压缩目录下的所有fastq对,请运行crunchy auto spring <path_to_dir>
。在
- 在
递归查找所有fastq对
在 - 在
使用spring压缩所有对
在file_1.fastq + file_2.fastq (spring)-> file.spring
- 在
spring解压缩
在file.spring (spring)-> file_1.spring.fastq + file_2.spring.fastq
- 在
Compare checksum with previous
在file_1.spring.fastq + file_1.fastq (hashlib)-> compare
- 在
Delete fastq(如果压缩是无损的)
在file_1.fastq + file_2.fastq (rm)->
- 项目
标签: