erv in是一个工具集合,用于帮助在基因组数据中发现erv序列。
ervin的Python项目详细描述
欧文
这是一个允许在基因组片段中检测ERV的工具
这主要是为了在OSX上使用而设计的,与其他基于UNIX的体系结构的交叉兼容性可能存在,但它几乎肯定不会在微软Windows系统
上运行。安装
pip install ervin
要求
- python 3.6+(Download)
- ncbi blast套件必须在本地安装(Download)
- 待查询的本地基因组数据库
- 它可以位于您选择的目录中,但必须在
config.json
文件中命名- 有一个
config.json.templ
文件,如果您不提供自己的config.json
文件,它将用于在第一次运行时使用包含的默认值创建config.json
文件。
- 有一个
- 它可以位于您选择的目录中,但必须在
当前功能
当前欧文:
- 当提供探测序列的
.fasta
文件时- 对指定的基因组数据库运行local
tblastn
,根据比对长度和e值(如果省略,则会导致默认值分别为>;400和<;0.009的可选参数)筛选结果。 - 在适当的地方分析和合并筛选的结果
- 使用
tblastn
对本地病毒refseq数据库运行生成的fasta记录(如果不是用户提供,则会下载一个副本,并保持最新),根据记录的最高点击率将记录分组到最终的输出文件集中
- 对指定的基因组数据库运行local
使用量
参数
Argument | Verbose | Description | Type | Required | Default |
---|---|---|---|---|---|
^{ | ^{ | Source fasta file containing the sample probe records to run through tblastn | ^{ | True | |
^{ | ^{ | Name of the genome database against which the probe records are to be BLASTed (located in the genome db store specified in the config file | ^{ | True | |
^{ | ^{ | Location to which to write the result files | ^{ | False | ^{ |
^{ | ^{ | Minimum length threshold that BLAST result alignment sequence lengths should exceed | ^{ | False | ^{ |
^{ | ^{ | Maximum e-value threshold that BLAST result e-values should exceed | ^{ | False | ^{ |
示例
ervin -f data/fasta_file.fasta -gdb genome_db
ervin -f data/fasta_file.fasta -gdb genome_db -o results/probe_blaster_output
ervin -f data/fasta_file.fasta -gdb genome_db -o results/probe_blaster_output -a 500
ervin -f data/fasta_file.fasta -gdb genome_db -o results/probe_blaster_output -e 0.0008
ervin -f data/fasta_file.fasta -gdb genome_db -o results/probe_blaster_output -a 800 -e 0.01