位置数据挖掘的工作流自动化
theto的Python项目详细描述
目标:探索位置数据的工作流自动化
任何可视化都需要大量琐碎的决策,当这些决策加在一起时,会导致非琐碎的
对可视化质量和可用性的影响。地理空间可视化尤其如此,
当需要转换数据以适应特定的地图投影或特定的地图平铺服务时
配置为使绘图上下文化。Theto
抽象了大量的开销,因此可以投入更多的时间
去看和理解数据。一个Theto
实例允许用户:
- 存储API键、选项板和其他静态资源,这些资源在整个典型的可视化过程中反复需要 管道。
- 加载数据源,格式化坐标数据以满足所有可预见的下游需求,并附加元数据。
- 添加小部件以交互方式过滤最终可视化显示的内容,并推断适当的参数 对于那些基于源数据的小部件。
- 以适应数据的方式确定打印边界、大小、地图缩放级别和其他参数。
- 添加可视化层,包括工具提示和其他可视化辅助工具,包括数据点之间的连接。
- 在笔记本中或通过保存到文件(可选地附加交互式图例)渲染绘图。
“theto”是希腊语单词_τω的音译,意思是“i place”或“i situate”,或简单的“i put”。 这就是该工具的作用:它将地理空间数据放在需要的位置,这样用户就可以花时间查找 了解那里的情况。
一个展示了许多Theto
功能的Jupyter笔记本可以在这里找到:
安装
pip
和conda
即将安装。
支持的数据表示
数据可以以多种格式加载(geohase、wkt、shapely对象、geojson或坐标对)。工具
将自动检测格式并对其进行适当处理。同样,任何输入都可以呈现为原始的
形状本身(多边形)或作为形状的质心(点)。多边形使用bokeh的
MultiPolygons
字形。可以使用bokeh的任何标记符号渲染点。
限制
Theto
设计用于交互式探索,因此适合于中小型数据。
一个非常粗略的基准表明,每绘制50000个点(一个多边形可能包含
很多单独的点)在一个笔记本电脑里,而这个笔记本可以冻结在250000点左右。输出到
文件和在单独的浏览器窗口中查看应该允许最多100万个点。对于更大的可视化,
见http://datashader.org/。
贡献
我们欢迎有助于改进各种数据源和绘图元素的问题和请求 支持,它的可用性,以及它在其他工具中的可重用性。
许可证
版权所有(c)2019 Valassis Digital根据BSD 3条款许可的条款