生物信息学文件访问工具
BioUtil的Python项目详细描述
这是用于bioinfomatics文件访问的脚本和模块的集合
模块、类和函数
- xzfile,xzopen()
- 访问各种压缩文件,当前重新组织gzip(.gz), samtools包中的bz2(.bz2)和bgzip(.b gz,.b.gz)
- tsvfile、tsvrecord、tsv
- 选项卡用命名字段分隔文件,用户还可以定义一些预处理 现场读写功能
- vcf,vcf
- VCF文件访问,取决于PyVCF, 提供一个方便灵活的界面
- samfile,萨姆
- 基于pysam的sam文件访问。 pysam还为tabix(带有基因组位置的随机访问tsv文件)提供接口, 可以从bioutil.sam访问
- 快速文件,快速文件:
- fasta/fastq文件IO。基于lh3readfq.
- 缓存fasta
- 从大型fasta文件中获取区域序列。本模块基于faidx 通过pysampysam.fastafile。 来自v0.1.2:旧名称fastareader被弃用,因为它会误导fastafile reader
- faidx
- 实验性,与pyfaidx接口。
更改日志
- v0.4
- 添加记录器类
- v0.3
- 更改fasta/fastq writer方法
- v0.2
- 添加fastqfile,将fastAreader重命名为cachedFasta
- v0.1.1
- 添加FastAreder
- v0.1.0
- 初始版本,支持xzfile、tsvfile、vffile、samfile和faidx
李森斯
本模块位于GPLV2 Lisense下