基因组交互式注释库
genial的Python项目详细描述
这个库提供了交互符号,基因组注释的高级表示, 允许用户轻松提取信息、操作和重新格式化常用注释 诸如bed和gff之类的文件。
该软件包目前处于alpha阶段,只在python3上运行。
支持的格式
- 输入:床,gff3,gtf
- 输出:床
脚本
为了方便起见,我们提供了两个cli实用程序:annotparser.py和annotmergesmallgap.py。
$ annotParser.py -h usage: annotParser.py [-h] [-i INPUT] [-o OUTPUT] [-f {gff3,gtf,bed}] [-t {extb,bed}] [-n MIN_EXON_COUNT] [-igs IGNORE_GAPS_SMALLER_THAN] [-igb IGNORE_GAPS_BIGGER_THAN] [-v] Parse, filter and convert annotation files optional arguments: -h, --help show this help message and exit -i INPUT, --input INPUT input file. to read from pipe, use the argument 'stdin' -o OUTPUT, --output OUTPUT output file -f {gff3,gtf,bed}, --input_format {gff3,gtf,bed} input file format -t {extb,bed}, --output_format {extb,bed} output file format -n MIN_EXON_COUNT, --min_exon_count MIN_EXON_COUNT min number of exons -igs IGNORE_GAPS_SMALLER_THAN, --ignore_gaps_smaller_than IGNORE_GAPS_SMALLER_THAN -igb IGNORE_GAPS_BIGGER_THAN, --ignore_gaps_bigger_than IGNORE_GAPS_BIGGER_THAN -v, --invert_match select non matching annotations (similar to grep -v)
$ annotMergeSmallGaps.py -h usage: annotMergeSmallGaps.py [-h] [-i INPUT] [-o OUTPUT] [-f {gff3,bed,gtf}] [-t {extb,bed}] [-s SMALL_GAP_SIZE] Merge exons separated by small gaps. Can also be used to convert different kinds of annotations. optional arguments: -h, --help show this help message and exit -i INPUT, --input INPUT input file. to read from pipe, use the argument 'stdin' -o OUTPUT, --output OUTPUT output file -f {gff3,bed,gtf}, --input_format {gff3,bed,gtf} input file format -t {extb,bed}, --output_format {extb,bed} output file format -s SMALL_GAP_SIZE, --small_gap_size SMALL_GAP_SIZE gap size.
上述两个脚本也可以用于从不同类型的注释文件转换。 导入库可以实现更高级的使用。
安装说明
对于在ubuntu上的全系统安装:
sudo apt-get install python3-pip sudo pip3 install genial
致谢
我要感谢我的朋友,Lucas Silva和大卫·皮雷,感谢他们对我的帮助和鼓励。 学习python和软件开发。没有它们,我很难找到这么有趣的编码和 这个项目永远不会实现。我还感谢Marcelo Reis为这个库命名的帮助:d