基于网格聚合的数据可视化工具链
datashader的Python项目详细描述
精确地将最大的数据转换为图像
Build Status | |
Coverage | |
Latest dev release | |
Latest release | |
Docs |
这是什么?
datashader是用于自动化 创建大量数据的有意义表示。数据采集器 将数据图像的创建分为三个主要步骤:
投影
每个记录被投影到一个标准绘图网格的零个或多个容器中 形状,基于指定的图示符。
聚合
每一个垃圾箱都要计算减量,压缩潜在的大型垃圾箱 数据集变成更小的aggregate数组。
转换
然后进一步处理这些聚合,最终创建一个图像。
使用这个非常通用的管道,许多有趣的数据可视化可以 以性能和可扩展的方式创建。datashader包含易于 以可组合的方式创建这些管道,只使用几行代码。 datashader可以单独使用,但它也可以作为 绘图库中的预处理阶段,允许该库 使用比原来大得多的数据集。
安装
datashader在linux、windows或 Mac,可与Conda一起安装:
conda install datashader
或使用pip:
pip install datashader
为了获得最佳性能,我们建议您使用conda,以便您确信
为您的平台优化数字库。最新的
版本在pyviz频道上可用conda install -c pyviz datashader
,最新的预发布版本在
dev标记的频道conda install -c pyviz/label/dev datashader
。
获取示例
如上所述安装了datashader之后,就可以获取示例:
datashader examples
cd datashader-examples
这将创建一个名为 datashader示例 需要运行示例。
要运行所有示例,您需要一些额外的依赖项。如果你 在conda环境中安装了datashader,具有 环境活动运行:
conda env update --file environment.yml
否则,请创建新环境:
conda env create --name datashader --file environment.yml
conda activate datashader
显影剂说明
如果还没有datashader git存储库,请克隆它:
git clone git://github.com/pyviz/datashader.git
使用所需的所有依赖项设置新的conda环境 运行示例:
cd datashader conda env create --name datashader --file ./examples/environment.yml conda activate datashader
将datashader目录放入 环境:
pip install -e .
了解更多
完成这些示例后,您可以找到链接的其他资源 从datashader documentation, 包括api文档和论文并讨论了该方法。
一些示例
关于pyviz
datashader是pyviz计划的一部分,该计划旨在使基于python的可视化工具能够很好地协同工作。 有关可以与datashader和 status.pyviz.org用于每个pyviz项目的当前状态。