Python数据帧对另一个数据帧的搜索

2024-04-28 20:12:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图找出将数据帧与一系列值(几乎180个值)进行比较的最佳方法,例如,如下所示

['bizservice.consulting','bizservice.datamgmt','bizservice.hr'] 针对另一个具有4m记录的数据帧,字段值如下所示

['consumerservices?5', 'hospitality?5', 'hospitality.travel?5']
['bizservice?12', 'bizservice.hr?12']
['hospitality?83', 'hospitality.lodging?83']
['bizservice.techconsulting?16', 'bizservice?16', 'software?16']

不确定如何进行比较,并根据没有数字代码的第一个数据帧从第二个数据帧检索匹配记录

这就是我试过的

import pandas as pd
industry = pd.read_csv('industry.csv')
data= pd.read_csv('rawdata.csv') 
datafilter=data[data["industry"].isin (industry)]

但只有当数据中的列表与行业数据框完全匹配,并且我尝试了“contains”,但它只能用于字符串时,这才有帮助


Tags: csv数据方法readdataservice记录hr