大熊猫系统发育学

phylopandas的Python项目详细描述


Gitter chatDocumentation StatusBuild StatusBinder

PandasDataFrame带入系统发育学。

Phylopands提供了一个类似熊猫的界面,用于将序列和系统发生树数据读入熊猫数据帧。这样就可以使用熟悉的python/pandas函数轻松地操作系统发育数据。最后,人类的系统发育学!

它是如何工作的?

别担心,我们没有重新发明轮子。phylopandas只是一个DataFrame (非常适合人类访问的数据存储)位于Biopython(非常适合解析/写入序列数据)和DendroPy(非常适合读取树数据)之上的接口。

Phylopands做两件事:

  1. 它提供了新的read函数来将序列/树数据直接读取到数据帧中。
  2. 它将一个新的phyloaccessor附加到pandas数据帧。这个访问器提供了用于排序/树数据的写入方法(由生物ython和树状突起提供动力)。

基本用法

序列数据:

读取序列文件。

importphylopandasasphdf1=ph.read_fasta('sequences.fasta')df2=ph.read_phylip('sequences.phy')

写入各种序列文件格式。

df1.phylo.to_clustal('sequences.clustal')

在格式之间转换。

# Read a format.df=ph.read_fasta('sequences.fasta')# Write to a different format.df.phylo.to_phylip('sequences.phy')

树数据:

读取newick树数据

df=ph.read_newick('tree.newick')

可视化系统发育数据(由phylovega提供支持)。

df.phylo.show(height=500,)

贡献

如果你对这个项目有想法,请在项目的Gitter chat上分享。

为Phylopands创建新的读/写函数和方法很容易。如果你 有您想添加的格式,请提交个人简历!还有很多格式 我还没来得及加上自己的名字,所以请不要害怕 添加它们!我提前谢谢你!

测试

Phylopands包含一个小的pytest套件。从基本目录运行这些测试。

$ cd phylopandas
$ pytest

安装

从pypi安装:

pip install phylopandas

从源安装:

git clone https://github.com/Zsailer/phylopandas
cd phylopandas
pip install -e .

依赖关系

  • BioPython:用于管理和操作生物数据的库。
  • DendroPy:用于系统发育脚本、模拟、数据处理和操作的库
  • Pandas:Python
  • 的灵活、强大的数据分析/操作库
  • pandas_flavor:使用pandas的新注册api(具有向后兼容性)为pandas对象添加新的访问器。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java Clojure关键字在内存中的大小是多少?   Java中有固定长度的通用数组对象吗?   PostgreSQL:通过Java更新我的用户表   错误:使用java解析xml   java Json显示列表中对象的名称   java比较JodaTime时区   与JAVA中的API和包的区别?   java的int值在for循环中不改变   谷歌应用引擎中的java RSA   迁移到spring 5后出现java非法字符错误   java Websphere管理控制台不工作   JavaGSON如何始终在json中包含毫秒?   带有空格和双引号的windows Java ProcessBuilder命令参数失败   java错误:重复的zip条目[43.jar:org/apache/http/annotation/NotThreadSafe.class]