在不同类型的大型数据帧中删除重复项的高效时间方法

3条回答

网友

1楼 · 编辑于 2024-05-13 03:20:24

您可以使用^{}：

In [1447]: df
Out[1447]: 
  col1     col2
0  'a'  [1,2,3]
1  'a'  [1,2,3]
2  'b'  [4,5,6]

In [1448]: df.drop_duplicates()
Out[1448]: 
  col1     col2
0  'a'  [1,2,3]
2  'b'  [4,5,6]

网友

2楼 · 编辑于 2024-05-13 03:20:24

您可以尝试转换为可散列的内容，然后删除

inplace=True将覆盖您的数据库

df["col2"] = df["col2"].transform(lambda k: tuple(k))
df.drop_duplicates(inplace=True)

网友

3楼 · 编辑于 2024-05-13 03:20:24

有关删除重复项的信息和示例，请参阅Here

编程相关推荐

javai是JAXB的新手。如何将两个具有不同名称空间的不同xml合并为一个具有根元素的xml并将其解组？
JDO中的java应该是可传递的DefaultFetchGroup吗
java服务器配置问题
java在理解JList时遇到困难
java何时将RequestContextFilter用于Jersey？
java从数据库中读取文本文件。jar文件
Java正则表达式，仅适用于不包括零的正数
爪哇番石榴。类路径中的jar
JavaEE：关于设计的问题
java GUI，在面板中排列按钮

相关问题更多 >

编程相关推荐

热门问题

热门文章

在不同类型的大型数据帧中删除重复项的高效时间方法

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >