Altair:一个用于Python的声明性统计可视化库。
altair的Python项目详细描述
牵牛星Altair是Python的声明性统计可视化库。有了牵牛星,你可以花更多的时间去理解你的数据和它的意义。牛郎星
api是简单、友好和一致的,并且构建在强大的
vega-litejson规范。这优雅
简单性用最少的代码产生美丽而有效的可视化效果。Altair由brian开发
格兰杰与华盛顿大学密切合作
交互式数据实验室
Altair文档
请参见Altair的文档站点,
a s well a s altair's的教程笔记本
示例
Altair文档
请参见Altair的文档站点, a s well a s altair's的教程笔记本
下面是一个使用Altair的示例,它使用jupyterlab中的原生vega-lite渲染器快速可视化和显示数据集:
啊! <<<<<<Altair从Vega-Lite继承而来的一个独特特性是一种声明性语法,它不仅是可视化的,而且是交互的。 通过对上面例子的一些修改,我们可以创建一个基于散点图的选择进行过滤的链接直方图。 啊!
回答您的问题
如果您有文档中未提及的问题,可以通过以下几种方式提出:
- 打开agithub问题。李>
- 发布astackoverflow问题(确保使用
altair
标记) - 在Altair谷歌集团
我们会尽力让您的问题得到解答
用于统计可视化的python api
Altair提供了一个PythonAPI,用于在声明式 态度。通过统计可视化,我们的意思是:
- 数据源是一个
数据框
由不同数据类型(数量、顺序、标称和日期/时间)的列组成。 数据框
采用atidy格式 其中,行对应于样本,列对应于观察到的变量。- 数据映射到可视属性(位置、颜色、大小、形状, 刻面等)使用按数据转换分组。
Altair API不包含实际的可视化呈现代码,而是 在 vega lite规范。结果 vega-lite json数据可以在以下用户界面中呈现:
- jupyter笔记本(通过安装ipyvega)。
- jupyterlab(不需要其他依赖项)。
- nteract(不需要其他依赖项)。
功能
- 精心设计的声明式python api基于 拖车
- 自动生成的内部python api,确保对可视化进行类型检查,并 完全符合vega lite 规格。
- 从vega lite json规范自动生成altair python代码。
- 在GitHub和 nbviewer
- 将可视化输出到png/svg图像、独立的html页面和 在线vega lite编辑器
- 将可视化序列化为json文件。
- 探索Altair,在示例库中可以找到几十个示例
安装
要使用Altair进行可视化,需要安装两套工具
Altair核心包及其依赖关系
要使用的前端渲染器(即
jupyter notebook
,jupyterlab
或interact
) < > >- 创建一个受约束的、简单的python api(altair),它是纯声明性的
- 使用api(altair)发出遵循vega lite规范的json输出
- 使用现有可视化库渲染该规范 < > >
Altair可以用pip
或conda
安装。
有关完整的安装说明,请参见
https://altair-viz.github.io/getting_started/installation.html
示例和教程笔记本
我们维护一个单独的github jupyter笔记本存储库,其中包含 交互式教程和示例:
https://github.com/altair-viz/altair U笔记本
使用活页夹启动带有这些笔记本的实时笔记本服务器 colab,单击下列徽章之一:
项目理念
python中存在许多优秀的绘图库,包括主要的绘图库:
每个库都能很好地完成一组特定的任务。
用户挑战
然而,这种选项的激增给用户带来了极大的困难 因为他们必须通过所有这些api来查找 最适合手头的任务。这些库都没有针对 高级统计可视化,因此用户必须自己组装 使用混杂的api。对于学习数据科学的人来说 迫使他们专注于学习api而不是探索数据。
另一个挑战是当前的绘图API要求用户编写代码, 即使是为了一个可视化的附带细节。这会导致不幸的 以及不必要的认知负担作为可视化类型(直方图, 散点图等)通常可以使用基本信息(如 感兴趣的列和这些列的数据类型。
例如,如果您对两个数值的可视化感兴趣 纵队,散点图几乎可以肯定是一个很好的起点。如果添加 一个分类列,你可能想用 颜色或面。如果有时很难推断可视化效果,则 简单的用户界面可以在不进行任何编码的情况下构建可视化。 tableau和交互数据 实验室< < polestar和 旅行者就是这种用户界面的优秀例子。
设计方法和解决方案
我们相信,这些挑战不需要 另一个具有编程api和内置的可视化库 致使。Altair构建可视化的方法使用分层设计 利用现有可视化库的全部功能:
这种方法使用户能够使用 简单的api最初,为它们的使用情况选择适当的呈现程序,然后 然后利用渲染器的全部功能进行更高级的绘图 定制。
我们意识到声明式api与 matplotlib、bokeh等的完整编程apiAT是一个深思熟虑的设计 我们认为需要做出选择来简化探索的用户体验 可视化。
开发安装
Altair需要以下依赖项:
如果已克隆存储库,请从存储库的根目录运行以下命令:
pip install -e .[dev]
如果您不想克隆存储库,可以使用:
pip install git+https://github.com/altair-viz/altair
测试
要运行测试套件,必须安装py.test。 要运行测试,请使用
py.test --pyargs altair
(如果从源签出运行测试,则可以省略--pyargs
标志)。
反馈和贡献
引用牵牛星
如果您在学术工作中使用Altair,请考虑引用http://joss.theoj.org/papers/10.21105/joss.01057" rel="nofollow">http://joss.theoj.org/papers/10.21105/joss.01057作为
@article{Altair2018,doi={10.21105/joss.01057},url={https://doi.org/10.21105/joss.01057},year={2018},month={dec},publisher={The Open Journal},author={Jacob VanderPlas and Brian Granger and Jeffrey Heer and Dominik Moritz and Kanit Wongsuphasawat and Arvind Satyanarayan and Eitan Lees and Ilia Timofeev and Ben Welsh and Scott Sievert},title={Altair: Interactive Statistical Visualizations for Python},journal={Journal of Open Source Software}}
牛郎星在哪里?
牛郎星是阿奎拉星座中最亮的恒星。与天津四和织女星一起形成了北半球的星群,称为夏季三角。