我试图找出将数据帧与一系列值(几乎180个值)进行比较的最佳方法,例如,如下所示
['bizservice.consulting','bizservice.datamgmt','bizservice.hr']
针对另一个具有4m记录的数据帧,字段值如下所示
['consumerservices?5', 'hospitality?5', 'hospitality.travel?5']
['bizservice?12', 'bizservice.hr?12']
['hospitality?83', 'hospitality.lodging?83']
['bizservice.techconsulting?16', 'bizservice?16', 'software?16']
不确定如何进行比较,并根据没有数字代码的第一个数据帧从第二个数据帧检索匹配记录
这就是我试过的
import pandas as pd
industry = pd.read_csv('industry.csv')
data= pd.read_csv('rawdata.csv')
datafilter=data[data["industry"].isin (industry)]
但只有当数据中的列表与行业数据框完全匹配,并且我尝试了“contains”,但它只能用于字符串时,这才有帮助
目前没有回答
相关问题 更多 >
编程相关推荐