删除由列中的值赋予优先级的重复索引

>>> import pandas as p >>> df = p.DataFrame({'id':['a','a','b', 'b'], 'test':['e','y','g', 's'], 'data':['re','rf','rg', 'rn']}) >>> df.set_index('id') test data id a e re a y rf b g rg b s rn

1条回答

网友

1楼 · 发布于 2024-04-24 23:23:07

我喜欢你的groupby方法。也许有一个更简单或更多的方法，但这个畜生似乎完成了：

df2 = p.DataFrame()

for name, group in gb:
    if len(group) > 1:
        group['keeper'] =  group.test.isin(preferred_values)
        newindex = group[ group.keeper==True ].head(1).copy()
        if len(newindex) < 1:
            newindex = group.head(1).copy()
        df2 = df2.append(newindex[['data','id','test']])

里面有一些潜规则。如果“首选值”列表中有多个索引，则采用第一个索引。如果首选列表中没有索引，则使用第一个索引。我认为这符合你的逻辑。你知道吗

感谢您提供示例数据，它使事情变得更加简单。你知道吗

编程相关推荐

java下载并将位图设置为列表视图
java有用于MyBatis XML sqlmaps的Javadoc样式的文档工具吗？
放置属性文件的位置，以便java命令在类路径中看到它
使用jschexception验证false的java SSH有时会失败
java如何在Android中使用MPAndroidChart定制饼图？
java如何使用R.String初始化字符串。文本
BeanValidation的java上下文相关验证
java反射：通过反射加载的类中的常量变量
安卓 Java使用相同的规则压缩多个字符串
公告命令中的java换行符不工作

相关问题更多 >

编程相关推荐

热门问题

热门文章

删除由列中的值赋予优先级的重复索引

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >