我有两个数据帧,需要将pmdf中的值与所有代码. 你知道吗
如果pmdf代码在所有代码,我需要一个包含jcrdf和pmdf计数. 你知道吗
数据帧:
pmdf = pd.DataFrame(
{
'code': ['0567-8315','0007-4977','0096-0225','1365-2133','8675-309J'],
'count':['6','7','10','2','1']
}
)
jcrdf = pd.DataFrame(
{
'jobtitle': ['manager','technician','noob','retiree'],
'location': ['loc1','loc3','loc4','loc2'],
'jcode' : ['4444-4444','3333-3333','2222-2222','1111-1111'],
'All_codes': ['0096-0225,0096-0225','1820-7448,0567-8315,0567-8315','0007-4977,0007-4977','0007-0963,0007-0963,0366-077X,1365-2133']
})
我有一个允许差异的查找:
jcrdf_lookup = pd.DataFrame(jcrdf['All_codes'].str.split(',').tolist(),
index=jcrdf.jcode).stack(level=0).reset_index(level=0)
matches = jcrdf_lookup[jcrdf_lookup[0].isin(pmdf.code)]
jcrdfmatch = jcrdf[jcrdf.jcode.isin(matches.jcode)]
jcrdfnomatch = pmdf[~pmdf.code.isin(matches[0])]
但我不知道怎么包括pmdf计数. 你知道吗
我尝试从匹配中生成唯一代码的df,但不管这些值必须是什么所有代码. 你知道吗
像往常一样,提前谢谢你的帮助。你知道吗
一种方法是展开jcrdf All\ u codes列,然后使用merge
你得到了吗
如果你想要原始格式的数据
相关问题 更多 >
编程相关推荐