python比较两个excel文件并删除重复数据

2024-04-28 14:40:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我想删除email.xlsx中的取消订阅电子邮件 这是我的密码


import pandas as pd

data_1 = pd.read_excel (r'email.xlsx')

email_data = pd.DataFrame(data_1, columns= ['email'])

email_col = len(email_data)

data_2 = pd.read_excel (r'unsubscribe.xlsx')

unsubscribe_data = pd.DataFrame(data_2, columns= ['unsubscribe'])

unsubscribe_col = len(unsubscribe_data)


for email_num in range(email_col): 

    for unsub_num in range(unsubscribe_col):

            if unsubscribe_data.iloc[unsub_num,0] == email_data.iloc[email_num,0]:

                data_1 = data_1.drop(data_1.index[[email_num]])

                email_data = pd.DataFrame(data_1)    

                print(email_data)


当我运行这段代码时,我得到了“单位置索引器超出范围” 你能解释一下为什么会这样吗? 谢谢


Tags: columnsindataframeforreaddatalenemail
1条回答
网友
1楼 · 发布于 2024-04-28 14:40:36

您可以尝试的一件事是使用这两列创建一个新的数据帧,并对其应用pandas.DataFrame.drop_duplicates以删除重复项

相关问题 更多 >