探索并下载来自人口普查api的数据
cenp的Python项目详细描述
探索和查询美国人口普查api并返回panda的接口 数据帧。此包用于探索性数据 从类似于sqlalchemy的接口和 acs.R。为应用程序开发人员和 只想快速无痛苦地获取数据,cenpy应该满足 大多数想从python中获取人口普查数据的人的需求。
可以从our website:
获得一些示例- getting data quickly using Cenpy。
- analyzing segregation over time & across space using cenpy and segregation
- a road to frictionless urban data science using cenpy and osmnx
- developer building blocks。
- piecing together the developer building blocks (by @dfolch)
安装
使用科学python常用的包管理器conda最容易安装cenpy。首先,install Anaconda。
然后,cenpy在conda-forge频道上可用:
conda install -c conda-forge cenpy
或者,如果您已经安装了geopandas和rtree:
pip install cenpy
对于用户
大多数时候,用户想要一个简单直接的界面到美国人口普查局的主要产品:2010年人口普查和美国社区调查。幸运的是,cenpy提供了这些产品的直接接口。例如,美国社区调查的最新5年估计数可通过以下方式获取:
import cenpy acs = cenpy.products.ACS() acs.from_place('Chicago, IL')
同样,十年一次的人口普查也可以使用:
import cenpy decennial = cenpy.products.Decennial2010() decennial.from_place('Seattle, WA')
有关产品api如何工作的更多信息,请参阅notebook on the topic。
对于开发人员
api引用可在cenpy-devs.github.io/cenpy获得。products通常是大多数最终用户希望与之交互的。如果您想要对uscb api进行更细粒度的访问,那么您可能需要构建在APIConnection和TigerConnection之上。
创建连接:
cxn = cenpy.remote.APIConnection('DECENNIALSF12010')
检查所需的变量和支持的地理位置:
cxn.variables #is a pandas dataframe containing query-able vbls cxn.geographies #is a pandas dataframe containing query-able geographies
请注意,某些地理区域(如TRACT)有更高的要求 要使查询工作,您必须指定。
查询函数的结构映射到Census API使用的 get、for和in。查询函数的主要参数 分别是cols、geo_unit和geo_filter,并映射回这些谓词。如果 搜索时,它们可以作为关键字参数添加到查询的末尾。
参数cols必须是要从 数据集。然后,必须指定geo_unit和geo_filter, 它们提供了what聚合单元应该是和where的 单位应该是。geo_unit必须是包含 分析和标识符。例如,如果你想让所有的县 亚利桑那州,指定geo_unit = 'county:*'和geo_filter = {'state':'04'}。
待办事项:
- 县域商业统计的cenpy.products产品