在计算值之前从成对行中删除重复项

2024-05-21 08:33:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个Python程序,我正试图从CSV转换到SQLite,我已经设法做了一切除了删除重复计数条目。我的数据库已加入。我是这样读取数据库的:

df = pd.read_sql_query("SELECT d.id AS is, mac.add AS mac etc etc

我试过df.drop_duplicates('tablename1','tablename2')

以及

 df.drop_duplicates('row[1],row[3]') 

但似乎不起作用。你知道吗

下面的代码是我在CSV版本中使用的代码&我想为pythonsqlite脚本复制它。你知道吗

for row in reader:
    key = (row[1], row[2])

    if key not in entries:
        writer.writerow(row)
        entries.add(key)

del writer

Tags: csvkey代码inadd数据库dfmac
3条回答

你试过先运行SELECT DISTINCT col1,col2 FROM table吗?你知道吗

在您的例子中,这可能很简单,只需将DISTINCT关键字放在列名之前。你知道吗

谢谢piRSquared,缺少的子集就是我所需要的,谢谢。你知道吗

您需要使用subset参数 df.drop\u副本(子集=['tablename1','tablename2'])

我们还将研究selectdistinct,但目前,subset是有效的。你知道吗

您需要使用subset参数

df.drop_duplicates(subset=['tablename1','tablename2'])

相关问题 更多 >