如何在pandas dataframe中移除重复的分组？问题的回答

如何在pandas dataframe中移除重复的分组？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我想删除数据帧中的重复集。你知道吗 <pre><code>import pandas as pd import pdb filename = "result_4_tiling_116.csv" chunksize = 10 ** 6 for chunk in pd.read_csv(filename, names=['id', 'tileID', 'x', 'y', 'h', 'w'], chunksize=chunksize): pdb.set_trace() </code></pre> 前31行数据的示例： <pre><code>chunk.head(31) tileID x y h w 0 0 0 0.0 1 8.0 1 1 0 8.0 1 8.0 2 0 0 8.0 1 8.0 3 1 0 0.0 1 4.0 4 2 0 4.0 1 4.0 5 0 0 0.0 1 4.0 6 1 0 4.0 1 4.0 7 2 0 8.0 1 4.0 8 3 0 12.0 1 4.0 9 0 0 4.0 1 4.0 10 1 0 8.0 1 4.0 11 2 0 12.0 1 4.0 12 3 0 0.0 1 2.0 13 4 0 2.0 1 2.0 14 0 0 8.0 1 4.0 15 1 0 12.0 1 4.0 16 2 0 0.0 1 2.0 17 3 0 2.0 1 2.0 18 4 0 4.0 1 2.0 19 5 0 6.0 1 2.0 20 0 0 12.0 1 4.0 21 1 0 0.0 1 2.0 22 2 0 2.0 1 2.0 23 3 0 4.0 1 2.0 24 4 0 6.0 1 2.0 25 0 0 8.0 1 4.0 26 1 0 12.0 1 4.0 27 2 0 0.0 1 2.0 28 3 0 2.0 1 2.0 29 4 0 4.0 1 2.0 30 5 0 6.0 1 2.0 </code></pre> 我想把重复的过滤掉。数据包含一组组（从tileID=0开始的每个组），如下所示： 1你知道吗 <pre><code>0 0 0 0.0 1 8.0 1 1 0 8.0 1 8.0 </code></pre> 2。你知道吗 <pre><code>2 0 0 8.0 1 8.0 3 1 0 0.0 1 4.0 4 2 0 4.0 1 4.0 </code></pre> 三。你知道吗 <pre><code>5 0 0 0.0 1 4.0 6 1 0 4.0 1 4.0 7 2 0 8.0 1 4.0 8 3 0 12.0 1 4.0 </code></pre> 第四条。你知道吗 <pre><code>9 0 0 4.0 1 4.0 10 1 0 8.0 1 4.0 11 2 0 12.0 1 4.0 12 3 0 0.0 1 2.0 13 4 0 2.0 1 2.0 </code></pre> 五。你知道吗 <pre><code>14 0 0 8.0 1 4.0 15 1 0 12.0 1 4.0 16 2 0 0.0 1 2.0 17 3 0 2.0 1 2.0 18 4 0 4.0 1 2.0 19 5 0 6.0 1 2.0 </code></pre> 六。你知道吗 <pre><code>20 0 0 12.0 1 4.0 21 1 0 0.0 1 2.0 22 2 0 2.0 1 2.0 23 3 0 4.0 1 2.0 24 4 0 6.0 1 2.0 </code></pre> 七。你知道吗 <pre><code>25 0 0 8.0 1 4.0 26 1 0 12.0 1 4.0 27 2 0 0.0 1 2.0 28 3 0 2.0 1 2.0 29 4 0 4.0 1 2.0 30 5 0 6.0 1 2.0 </code></pre> 在本例中，5和7是重复数据。我尝试使用<code>drop_duplicates</code>，但还没有成功。你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何在pandas dataframe中移除重复的分组？

1 个回答

相关Python问题