熊猫查找将远程查找表添加到熊猫数据帧。
pandas-lookup的Python项目详细描述
熊猫查找
agate-lookup的端口,它在pandas数据帧而不是agate表中提供查找。
这使用wireservice的lookup项目中的查找表。
安装
pip install pandas-lookup
从查找表中查找列
当数据中的键与查找表中的键相同时:
>>> import pandaslookup
>>> import pandas as pd
>>> df = pd.DataFrame({'usps': ['CT', 'NY', 'NJ']})
>>> print(df)
state_abbr
0 CT
1 NY
2 NJ
>>> df.pipe(pandaslookup.lookup, 'usps', 'state')
usps state
0 CT Connecticut
1 NY New York
2 NJ New Jersey
当数据中的键与查找表中的键不同时:
>>> import pandaslookup
>>> import pandas as pd
>>> df = pd.DataFrame({'state_abbr': ['CT', 'NY', 'NJ']})
>>> print(df)
state_abbr
0 CT
1 NY
2 NJ
>>> df.pipe(pandaslookup.lookup, 'state_abbr', 'state', lookup_key='usps')
usps state
0 CT Connecticut
1 NY New York
2 NJ New Jersey
在不连接的情况下检索表
>>> import pandaslookup
>>> table = pandaslookup.from_lookup(['usps', 'year'], 'population')
>>> print(table.head())
usps year population
0 AL 1970 3454557
1 AL 1971 3497349
2 AL 1972 3540003
3 AL 1973 3580759
4 AL 1974 3627778
安装以进行开发
pipenv install --dev -e .
运行测试
pipenv run python -m unittest
现有技术
- harbolkn/pandas-lookup:这是相同的想法,但它依赖于
agate-lookup
包,该包创建了对玛瑙的不必要依赖。另外,我不喜欢猴子补丁。