基于python的祖先序列重建
pyasr的Python项目详细描述
Pyasr
python中的祖先序列重建
Pyasr提供了一个与{a1}(最大似然系统发育分析)的现代Python接口——专门用于重建 祖先的蛋白质/DNA序列。
注意:pyasr目前只支持蛋白质重建。这是一项正在进行的工作。
基本用法
importphylopandasaspdimportdendropyasdimportpyasr# Use phylopandas to read a set of ancestor.sdf_seqs=pd.read_fasta('test.fasta')# Use dendropy to read in tree.tree=d.Tree.get(path='tree.newick',schema='newick')# Reconstruct nodes in tree.tree,df_seqs,df_anc=pyasr.reconstruct(df_seqs,tree,working_dir='test',alpha=1.235)# Write out ancestor dataframe to a CSV file.df_anc.to_csv('ancestors.csv')
我们可以在朱庇特实验室里看到祖先和树并排在一起 多亏了Toytree图书馆。
安装
这个包在pypi上发布。您可以使用pip安装:
pip install pyasr
要获得开发版本:
git clone
cd
pip install -e .
依赖关系
实际的重建计算是使用PAML完成的。这需要paml
已安装并将codeml
/baseml
可执行文件导出到$PATH
环境变量。paml的安装说明可以在paml网站上找到。
pyasr需要以下python依赖项才能工作。
- 熊猫
- 生物圈
- 大熊猫
- 树枝状