对于Web抓取应用程序,我将比较数据库中的一些数据和从网站中抓取的一些数据。我将数据保存在数据框的两个不同列中
比较很有效!我得到两列中具有相同值的行数。 但随着我的项目不断增长,我还想知道哪个索引的比较结果为真。我该怎么做
一些附加信息
我的数据帧:
df_single["Database"]:
Schloss Haindorf Hotelbetriebs GmbH
1. Aichfelder Druck Gesellschaft m.b.H.
Rössler Elektro Korbel
Elektro Schefbänker
AWESOME X e.U.
df_single["Scraped"]:
Schloss Haindorf Hotelbetriebs GmbH
1. Aichfelder Druck Gesellschaft m.b.H.
Elektro Rössler OG
Elektro Schefbänker KG
AWESOME X e.U.
我与.eq()
的比较
same_single = df_single["Database"].str.lower().eq(df_single["Scraped"].str.lower()).sum()
我的输出:
[IN:] print(same_single)
[OUT:] 3
想要的输出:
[IN:] print(index where comparison = true)
[OUT:]Comparison was true at Index: 3,5 and 7
首先通过掩码将索引值过滤到
idx
,然后使用分隔符将值连接在一起:或:
相关问题 更多 >
编程相关推荐