从ucsc ftp站点下载基因组数据的命令行工具。
pygenomes的Python项目详细描述
pygenomes是一个python模块,也是一个命令- 从ucsc ftp站点下载基因组数据的线工具。
使用此工具,您可以轻松检查可用的分类单元或可用的 只需键入工具名或使用组添加-g标志即可分类 名字。
用这个工具下载基因组或染色体数据也很简单。你可以 使用commom name、scientific name甚至特定程序集下载数据 名称(例如human,Homo sapiens,hg38)。
如果ftp站点中有可用的数据,也可以通过 交互模式,允许您选择特定的基因组集合。 执行此操作时,只需为程序集指定一个真值,然后根据 提示您输入感兴趣程序集的可用列表。
仅在python2.7上测试的工具可能在python3上不起作用。
功能
- 安装一个名为pygenomes.py 的python模块
- 安装名为pygenomes 的python命令行脚本
- 轻松检查推荐行中的可用分类群和基因组
- 只需通过comman、scientific或assembly name下载基因组
- 使用交互式模式,只需下载特定的组装基因组
- 以特定的文件格式轻松下载基因组和染色体
- 纯python模块,不依赖第三方
示例
您可以将pygenomes用作python模块,例如 交互式python会话(函数的签名可能仍会更改 未来一点):
>>> from pygenomes import genomes >>> # prints out available taxa in group of mammals >>> genomes(group='mammals') # download human reference genome (hg19) in .2bit format >>> genomes(taxa='human') # interactive mode, ask for inputing and downloading specific assembly >>> genomes(taxa='cow', assembly='1') # try to download chromosome data, per fa.gz file per chromosome >>> genomes(taxa='cow', chrs='1')
此外,还有一个名为pygenomes的脚本,可以使用 从这样的系统命令行中可以更容易地看到 在命令行上键入pygenomes -h时的更多示例:
$ pygenomes -g -1 # prints out all available taxa $ pygenomes -g mammal # prints out all available taxa in group of mammal $ pygenomes -t yeast # download yeast reference genome in .2bit format $ pygenomes -t yeast -a 1 # interactive mode, ask for inputing and downloading specific assembly $ pygenomes -t cow -f fa.gz # try to download cow reference genome in fa.gz format $ pygenomes -t dog -a 1 -o /tmp # interactive mode, ask for inputing, file will be stored in /tmp $ pygenomes -t cat -c 1 # download cat chromosome data, per chromosome per fa.gz file