用于检索bls数据集的python库
bls-datasets的Python项目详细描述
BLS数据集
使数据集易于被python脚本访问。
集成的数据集包括:
- Occupational Employment Statistics (OES)
- Quarterly Census of Employment and Wages (QCEW)
- 即将推出:就业预测和定义文件
要通过序列id查找查找bls数据,请查看oliversherouse的库:BLS
用法
>>> from bls_datasets import oes, qcew
# OES example:
>>> df_oes = oes.get_data(year=2017)
>>> df_oes.columns
Index(['OCC_CODE', 'OCC_TITLE', 'OCC_GROUP', 'TOT_EMP', 'EMP_PRSE', 'H_MEAN',
'A_MEAN', 'MEAN_PRSE', 'H_PCT10', 'H_PCT25', 'H_MEDIAN', 'H_PCT75',
'H_PCT90', 'A_PCT10', 'A_PCT25', 'A_MEDIAN', 'A_PCT75', 'A_PCT90',
'ANNUAL', 'HOURLY'],
dtype='object')
# Which occupation had the highest total employment in 2017?
>>> detailed = df_oes[df_oes.OCC_GROUP == 'detailed']
>>> detailed[detailed.TOT_EMP == detailed.TOT_EMP.max()].OCC_TITLE
772 Retail Salespersons
# QCEW example:
>>> df_qcew = qcew.get_data('industry', rtype='dataframe', year='2017',
... qtr='1', industry='10')
>>> df_qcew.columns
Index(['area_fips', 'own_code', 'industry_code', 'agglvl_code', 'size_code',
'year', 'qtr', 'disclosure_code', 'qtrly_estabs', 'month1_emplvl',
'month2_emplvl', 'month3_emplvl', 'total_qtrly_wages',
'taxable_qtrly_wages', 'qtrly_contributions', 'avg_wkly_wage',
'lq_disclosure_code', 'lq_qtrly_estabs', 'lq_month1_emplvl',
'lq_month2_emplvl', 'lq_month3_emplvl', 'lq_total_qtrly_wages',
'lq_taxable_qtrly_wages', 'lq_qtrly_contributions', 'lq_avg_wkly_wage',
'oty_disclosure_code', 'oty_qtrly_estabs_chg',
'oty_qtrly_estabs_pct_chg', 'oty_month1_emplvl_chg',
'oty_month1_emplvl_pct_chg', 'oty_month2_emplvl_chg',
'oty_month2_emplvl_pct_chg', 'oty_month3_emplvl_chg',
'oty_month3_emplvl_pct_chg', 'oty_total_qtrly_wages_chg',
'oty_total_qtrly_wages_pct_chg', 'oty_taxable_qtrly_wages_chg',
'oty_taxable_qtrly_wages_pct_chg', 'oty_qtrly_contributions_chg',
'oty_qtrly_contributions_pct_chg', 'oty_avg_wkly_wage_chg',
'oty_avg_wkly_wage_pct_chg'],
dtype='object')
# What were the average weekly earnings in Fresno County for 2017 Q1?
# FIPS code, area title
# 06019, Fresno County, California
>>> fresno = df_qcew[(df_qcew.own_code == 0) & (df_qcew.area_fips == '06019')]
>>> fresno.avg_wkly_wage.values[0]
803
安装
pip install bls-datasets
文档
文件马上就来。请暂时引用源代码中的docstrings。
数据集注释
oes
职业统计包括职业统计,主要是:就业、年龄和工资。若要了解有关此调查的详细信息,请访问此link。
请注意,由于早期oes数据集的特性,此包仅允许从2014年开始访问数据。早期的文件是可用的,尽管它们被赋予了不同的命名模式,但由于旧版excel的大小限制,它们通常被分解成多个excel电子表格,并且它们并不总是由相同的数据剪切组成。我不会集成任何较早的年份,除非我认为有必要,或收到足够的用户请求。
qview
qcew包括雇主报告的职业统计数据。数据可以按区域、行业或公司大小进行剪切/切片。要了解有关此调查的更多信息,您可以访问此link
使用qcew数据的常见问题:
- 数据类型并不总是你所期望的那样执行数据帧操作时参考下表
- 由于雇主保密,有些数字可能无法获得在进行更细粒度的数据剪切时尤其如此为此,请检查
disclosure_code
列。