我有两个数据帧:
dfA
Alpha Beta Gamma
1 apple bana
1 gin vodka
dfB
Teta heta hofa
1 apple bana
1 apple vodka
如何找到具有最大匹配实体数的列对?对于两列,合并或使用集合非常容易,是否需要为其编写For循环
我还尝试了:dfA.where(dfA.values==dfB.values).notna()
,这会导致ValueError: Array conditional must be same shape as self
我期望的结果是:
Columns Nr
(Alpha, Teta) 2
(Alpha, heta) 0
(Alpha, hofa) 0
(Beta, Teta) 0
(Beta, heta) 1
(Beta, hofa) 0
(Gamma, Teta) 0
(Gamma, heta) 0
(Gamma, hofa) 2
背景:我必须检查条目是否匹配两个系统,但不幸的是,这些系统使用不同的命名,我需要识别前导列
在元组的列表理解中,使用两个} 测试成员身份,通过
columns
名称的product
,通过^{sum
计数True
,并传递给DataFrame
构造函数:输出中3列的解决方案非常相似:
相关问题 更多 >
编程相关推荐