系统发育可视化
empress的Python项目详细描述
Empress仍处于早期开发阶段,目前正在探索添加的新功能。如果你愿意建议 你可以发邮件给kcantrel@ucsd.edu。
#安装 请安装以下软件包以运行empress
` conda create -n empress pip tornado source activate empress conda install -cconda-forgescikit-bio pip install git+https://github.com/biocore/empress.git `
#跑步 有关详细信息,请在终端中键入以下命令
` empress --help `
运行empress之后会进行一些预处理。Empress准备好后,终端将显示以下消息 被使用。
` build web server server started at port 8080 `
然后在浏览器搜索栏中输入以下内容以启动Empress。
` http://localhost:8080/ `
#输入格式 empress将树的newick文件和要素元数据的表格映射文件作为输入。
功能元数据文件的示例如下所示
` ID Genome_size Phyla OTU_1001 100000 Proteobacteria OTU_1002 150201 Firmicutes OTU_2001 502051 Actinobacteria ` 元数据文件的第一列必须与newick文件中的id匹配。在上面的示例中,id是 newick文件将用于命名节点。 如果一个节点在newick文件中没有名字,empress会给它分配“yid”,其中id是与它对应的一个数字 在树上的位置。 注意:为了简化元数据的处理,empress将元数据文件的第一列发回node_id。 上面的示例中,id将在empress中显示为node_id。
#运行示例数据集 要下载示例数据,请在终端中输入以下内容,或进入data/primates并手动下载文件。
` svn export https://github.com/biocore/empress.git/trunk/data `
leaf_metadata.txt和internal_node_metadata.txt均以空格分隔。为了使组合元数据文件更容易, Empress将重命名SequenceID,在Empress中显示为节点ID。
下面是一个示例,说明如何格式化内部节点元数据.txt。
` Node_id Intercept_effect_size Phyl_Group[T.Lemur]_effect_size ... y0 0.02256030930979693 -0.12709112380267737 ... y1 -0.15122058716686135 0.1629544435889327 ... . . . `
要运行empress,请在下载数据文件的目录中键入以下命令
` empress --tree-file tree.nwk --metadata leaf_metadata.txt --additional-metadata internal_node_metadata.txt --clade-field Node_id --main-seperator " " --additional-seperator " " ` –clade field是empress将在其“clade color”功能中使用的。选择node_id以更好地演示此功能。
注意:哪些元数据作为元数据传入,哪些元数据作为附加元数据传入并不重要
几秒钟后,终端将显示以下内容。
` build web server server started at port 8080 `
打开浏览器并在搜索栏中键入以下内容。
` http://localhost:8080/ `