大熊猫系统发育学
phylopandas的Python项目详细描述
将PandasDataFrame
带入系统发育学。
Phylopands提供了一个类似熊猫的界面,用于将序列和系统发生树数据读入熊猫数据帧。这样就可以使用熟悉的python/pandas函数轻松地操作系统发育数据。最后,人类的系统发育学!
它是如何工作的?
别担心,我们没有重新发明轮子。phylopandas只是一个DataFrame (非常适合人类访问的数据存储)位于Biopython(非常适合解析/写入序列数据)和DendroPy(非常适合读取树数据)之上的接口。
Phylopands做两件事:
- 它提供了新的
read
函数来将序列/树数据直接读取到数据帧中。 - 它将一个新的
phylo
accessor附加到pandas数据帧。这个访问器提供了用于排序/树数据的写入方法(由生物ython和树状突起提供动力)。
基本用法
序列数据:
读取序列文件。
importphylopandasasphdf1=ph.read_fasta('sequences.fasta')df2=ph.read_phylip('sequences.phy')
写入各种序列文件格式。
df1.phylo.to_clustal('sequences.clustal')
在格式之间转换。
# Read a format.df=ph.read_fasta('sequences.fasta')# Write to a different format.df.phylo.to_phylip('sequences.phy')
树数据:
读取newick树数据
df=ph.read_newick('tree.newick')
可视化系统发育数据(由phylovega提供支持)。
df.phylo.show(height=500,)
贡献
如果你对这个项目有想法,请在项目的Gitter chat上分享。
为Phylopands创建新的读/写函数和方法很容易。如果你 有您想添加的格式,请提交个人简历!还有很多格式 我还没来得及加上自己的名字,所以请不要害怕 添加它们!我提前谢谢你!
测试
Phylopands包含一个小的pytest套件。从基本目录运行这些测试。
$ cd phylopandas
$ pytest
安装
从pypi安装:
pip install phylopandas
从源安装:
git clone https://github.com/Zsailer/phylopandas
cd phylopandas
pip install -e .
依赖关系
- BioPython:用于管理和操作生物数据的库。
- DendroPy:用于系统发育脚本、模拟、数据处理和操作的库
- Pandas:Python 的灵活、强大的数据分析/操作库
- pandas_flavor:使用pandas的新注册api(具有向后兼容性)为pandas对象添加新的访问器。