(b)rowser(o)f(a)rbitrary data-python图形用户界面数据浏览器。
boadata的Python项目详细描述
(b)rowser(o)f(a)rbitrary data—数据的python浏览器。 目标是为科学家/数据挖掘者创建一个简单的工具 在一个简单的环境中浏览和绘制各种数据源。
这是一个图书馆,也是一套工具。
大多数焦点都放在类似熊猫的桌子上。
概念
- uri-boadata尝试支持odo uri
- 数据对象-基本数据类型的包装器(也称为odo.resource,但带有包装器)
- 数据树-可浏览,可包含节点(某些节点可以是数据对象)
- 数据转换-不同对象类型之间
- 视图-数据对象的可视化表示
可执行文件
运行命令–帮助查看选项的完整列表
- boadecribe<;uri>;-显示数据对象的基本信息(在命令行中)
- boatree<;uri>;-列出数据树中的节点
- boaplot<;uri>;<;colx>;<;coly>;-两列的散点图(colx,y可以是x**2,sqrt(y+2*exp(-x))等表达式)
- boahist<;uri>;<;col>;-列的直方图
- boadata[<;uri>;]-带有树的完整图形用户界面
- boatable<;uri>;-显示数据对象(gui)的表格表示形式
- boacat<;uri>;-打印数据对象的表格表示(命令行)
- boaconvert<;from+>;<;to>;-将一个数据源转换为另一个数据源
- boaview<;uri>;-显示一个选项卡式窗口,其中包含数据对象的所有可用视图
状态
- 发展缓慢
要求
- Pyqt4(成为PySide/Pyqt5的可选/可替换)
- 奥多
- 熊猫
- 努比
- numexpr
- 单击
- 制表
- 闪光灯(可能要取下)
- h5py(可选)
- sqlalchemy(可选)
- PyqtGraph(待删除)
- matplotlib(变为可选)
- bokeh(变为可选而不是matplotlib)
- 肖伯恩
- pandas_profiling(可选-数据帧摘要)
- datadotworld(可选-用于其数据集)
- Python3.4+
支持的格式和来源
- 文件系统树
- HDF5
- csv(包括web链接)
- 基于sqlalchemy的sql(支持sqlite)
- pydataset数据集
- Seaborn数据集
- matlab.fig文件
- data.world数据集/表(可导入pandas数据帧)
支持的图形用户界面视图
- 表
- 直方图
- 散点图/线图
- 文本视图
- 总结(摘自Pandas悻profiling)