数据帧如何只保留唯一的行和打印cu

2024-04-20 10:49:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我有下面的数据框,我试图实际绘制一条曲线,但问题是它有多个对应的值,每个值在精确度和召回率。在

       precision  recall
1       0.000000       0
7       0.000000       0
23      0.000000       0
28      0.000000       0
34      0.000000       0
35      0.000000       0
40      0.000000       0
50      0.000000       0
60      0.000000       0
17859   0.133333  0.009050
13159   0.066667  0.012195
9232    0.133333  0.012500
6131    0.066667  0.013333
7900    0.066667  0.014085
11671   0.066667  0.014925
20317   0.066667  0.014925

考虑到上述数据集保持唯一行,我对unique的解释是:

^{pr2}$

如何转换原始数据帧以获得上述唯一行?在

我尝试了分组方法:

grouped = df.groupby(cols_to_consider)
index = [gp_keys[0] for gp_keys in grouped.groups.values()]
unique_df = df.reindex(index)

但没用。在


Tags: 数据方法df原始数据index绘制keys曲线
1条回答
网友
1楼 · 发布于 2024-04-20 10:49:32

{可以使用^ a1删除重复的行。在

In [49]: df.drop_duplicates()
Out[49]:
       precision    recall
1       0.000000  0.000000
17859   0.133333  0.009050
13159   0.066667  0.012195
9232    0.133333  0.012500
6131    0.066667  0.013333
7900    0.066667  0.014085
11671   0.066667  0.014925

还有,你的方法应该行得通,我猜列名一定搞错了吧?在

^{pr2}$

相关问题 更多 >