探索和发布数据的工具
datasette的Python项目详细描述
数据集
用于探索和发布数据的工具
dataset是一个用于探索和发布数据的工具。它帮助人们获取任何形状或大小的数据,并将其发布为一个交互式、可探索的网站和附带的API。 dataset的目标是数据记者、博物馆馆长、档案管理员、地方政府和任何其他拥有他们希望与世界共享的数据的人。 探索演示,观看v=ptr1ulqtjne" rel="nofollow">有关项目的视频或通过上传和发布您自己的CSV数据来尝试。
dataset需要python 3.5或更高版本。我们还有详细的安装说明,包括docker等其他选项。 这将在端口8001上启动Web服务器-访问http://localhost:8001/" rel="nofollow">http://localhost:8001/访问Web界面。 在OSX上使用Chrome?您可以根据浏览器历史记录运行数据集,如下所示: 现在访问http://localhost:8001/history/downloads" rel="nofollow">http://localhost:8001/history/downloads将显示一个Web界面来浏览下载数据: 如果要在生成的数据集网站中包含许可和源信息,可以使用类似以下内容的json文件来完成此操作: 将其保存在metadata.json中,然后像这样运行dataset: 许可证和源信息将显示在索引页和页脚中。它们还将包含在api生成的json中。 如果您已经配置了heroku、google cloud run或zeit now v1,datasette可以将一个或多个sqlite数据库部署到internet,并使用一个siNGLE命令: 或: 这将创建一个docker映像,其中包含dataset应用程序和指定的sqlite数据库文件。然后,它会将该图像部署到heroku或cloud run,并为您提供一个访问结果网站和api的url。 有关详细信息,请参见文档中的发布数据。新闻
.json
和.csv
数据集插件
命令,换行分隔的JSON导出选项,新文档rel="nofollow">数据集生态系统/-/versions
现在显示sqlite编译选项。数据集立即发布--别名
参数。安装
pip3 install datasette
基本用法
datasette serve path/to/database.db
serve
是默认子命令,如果愿意,可以省略它。 datasette ~/Library/Application\ Support/Google/Chrome/Default/History
数据集服务选项
$ datasette serve --help
Usage: datasette serve [OPTIONS] [FILES]...
Serve up specified SQLite database files with a web UI
Options:
-i, --immutable PATH Database files to open in immutable mode
-h, --host TEXT host for server, defaults to 127.0.0.1
-p, --port INTEGER port for server, defaults to 8001
--debug Enable debug mode - useful for development
--reload Automatically reload if database or code change detected -
useful for development
--cors Enable CORS by serving Access-Control-Allow-Origin: *
--load-extension PATH Path to a SQLite extension to load
--inspect-file TEXT Path to JSON file created using "datasette inspect"
-m, --metadata FILENAME Path to JSON file containing license/source metadata
--template-dir DIRECTORY Path to directory containing custom templates
--plugins-dir DIRECTORY Path to directory containing custom plugins
--static STATIC MOUNT mountpoint:path-to-directory for serving static files
--memory Make :memory: database available
--config CONFIG Set config option using configname:value
datasette.readthedocs.io/en/latest/config.html
--version-note TEXT Additional note to show on /-/versions
--help-config Show available config options
--help Show this message and exit.
metadata.json
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
datasette serve fivethirtyeight.db -m metadata.json
数据集发布
datasette publish heroku database.db
datasette publish cloudrun database.db
推荐PyPI第三方库