从python获取酿酒酵母基因组
pygenome的Python项目详细描述
pygenome
通过蟒蛇利用酵母基因的强大力量!pygenome提供了访问Saccharomyces cerevisiae 巨蟒的基因组。Genes, promoters, terminators,和 intergenic,序列 以及由 genome wide deletion project 可通过其系统名称(如YPR080w)或 标准名称(如CYC1)。DNA 序列作为生物密码子返回 SeqRecord对象。感谢SGD让我使用上面的超级酵母标识。
IPython命令行的典型用法如下:
from pygenome import sg
mygene = sg.stdgene["XKS1"]
mygene
Out[3]: Gene XKS1/YGR194C
mygene.short_description
Out[4]: Xylulokinase; converts D-xylulose and ATP to xylulose 5-phosphate and ADP; rate limiting step in fermentation of xylulose; required for xylose fermentation by recombinant S. cerevisiae strains
sg.sysgene["YGR194C"]
Out[5]: Gene XKS1/YGR194C
mygene.cds
Out[6]: SeqRecord(seq=Seq('ATGTTGTGTTCAGTAATTCAGAGACAGACAAGAGAGGTTTCCAACACAATGTCT...TAA', IUPACAmbiguousDNA()), id='BK006941.2', name='BK006941', description='BK006941 REGION: complement(887876..886072)', dbxrefs=[])
mygene.locus()
Out[7]: SeqRecord(seq=Seq('ATCCTGCTGTAGTTATGGCACTAAAGTTTTTTTGTAAATCTTTTTATATGTTAA...GAA', IUPACAmbiguousDNA()), id='BK006941.2', name='BK006941', description='BK006941 REGION: complement(888876..885072)', dbxrefs=[])
mygene.promoter
Out[8]: SeqRecord(seq=Seq('ATGATGATCCTGCTGTAGTTATGGCACTAAAGTTTTTTTGTAAATCTTTTTATA...TTA', IUPACAmbiguousDNA()), id='YGR195W_YGR194C', name='.', description='BK006941.2 REGION: complement(887876..888881)', dbxrefs=[])
mygene.terminator
Out[9]: SeqRecord(seq=Seq('AATATGTTTGAATAATTTATCATGCCCTGACAAGTACACACAAACACAGACACA...AAA', IUPACAmbiguousDNA()), id='YGR194C_YGR195W', name='.', description='Intergenic sequence between upstream gene YGR194C and downstream gene Gene PDX1/YGR193C', dbxrefs=[])
mygene.downstream_gene
Out[10]: Gene PDX1/YGR193C
mygene.upstream_gene
Out[11]: Gene SKI6/YGR195W
mygene.deletion_locus
Out[12]: SeqRecord(seq=Seq('ATCCTGCTGTAGTTATGGCACTAAAGTTTTTTTGTAAATCTTTTTATATGTTAA...GAA', IUPACAmbiguousDNA()), id='ygr194c::KanMX4 locus with 1000 bp up and 1000 bp downstream DNA', name='ygr194c::KanMX4', description='description?', dbxrefs=[])
http://www-sequence.stanford.edu/group/yeast_deletion_project/downloads.html
ver | date | comment |
---|---|---|
2.0.0 | 2017-09-02 | split sg.gene dict into sg.stdgene and sg.sysgene |
1.0.0 | 2017-03-24 | Internal stuff, automativ build & test |
0.9.5 | 2017-01-01 | Python 3 release |
0.9.0 | 2015-05-01 | Changed interface to a more object oriented style |
0.5.0 | 2015-03-03 | Documentation, automatic build, test and deployment |
0.0.6 | 2014-06-17 | Bugfix |
0.0.5 | 2014-06-14 | Simpler api (see example above) |
0.0.1 | 2013-08-01 | first release |
在蟒蛇身上使用conda进行安装
安装和使用pygenome的最好方法是使用 免费的Anaconda或Minicondapython发行版。
Anaconda是一个大型下载(大约400 MB),而Miniconda是大约40-50 MB。
一旦安装了anaconda(或miniconda),conda包管理器就可以用来安装pygenome 从BjornFJohansson包通道。
第一步是输入下面的命令,然后返回:
conda config --append channels BjornFJohansson
然后,输入下面的命令,然后返回:
conda install pygenome
它可以在windows、macosx和linux上工作,并自动安装所有必需的依赖项。
要求
- Python 3.6 or 3.7(pygenome版本0.9.0是最后一个支持python 2.7的版本。)
- pydna
- requests
- appdirs
使用PIP安装
安装pygenome的第二个最佳方法是使用 pip
sudo pip install pygenome
源代码库
pydna源代码托管在Github上。