将洛杉矶企业最新数据库保存为CSV和KML。
la-businesses的Python项目详细描述
洛杉矶商业
说明
此脚本下载并处理所有活动业务的列表 目前在洛杉矶市金融办公室注册。 “活跃”企业是指所有者没有 通知财务处停止营业。 更新间隔:每月一次。
数据源:https://data.lacity.org/A-Prosperous-City/Listing-of-Active-Businesses/6rrh-rzua
此脚本获取数据并将其本地保存为CSV文件它还选择 最近一个星期内开始营业的业务子集 (默认值30)并将其另存为一个单独的CSV文件最后,它创造了 从子集中保存kml文件,用于导入到google地图或 类似的软件可以可视化最近在 洛杉矶地区。
安装
用PIP安装。该包作为命令行脚本安装
pip install la-businesses
用法
从命令行运行(它作为脚本安装)。全部下载并 生成的文件将存储在当前 工作目录。
usage: la-businesses [-h] [-u] [-d NDAYS]
optional arguments:
-h, --help show this help message and exit
-u, --update update data (default: False)
-d NDAYS, --days NDAYS started since NDAYS days ago (default: 30)
已知问题
在kml文件中省略坐标缺失的位置
脚本依赖于下载的数据集中已提供的坐标数据。 有些企业包含地址,但没有坐标;在这些情况下, 创建KML时忽略业务(但包含在任何保存的CSV中 文件)。未来的实现应该包括一个查找位置的函数 给定地址的坐标(例如,使用开放式街道地图api)。
没有dba名称的位置只在kml文件中显示nan
该脚本可以更好地处理业务名称/dba组合,以便 当kml没有商业名称时,省略nan。
没有电话号码
数据不包括任何电话或电子邮件联系信息;合并此 包含联系人信息的数据集对于 市场调查