对列中的数字字符串进行排序

import pandas as pd import csv words = ["Autor1","Max Mustermann","Max Mustermann","Autor1","Bertha Musterfrau","Author2"] pages = [15,13,5,1,17,20] str_pages = list(map(str, pages)) df = pd.DataFrame({"Autor":words,"Pages":str_pages}) df = df.drop_duplicates().sort_values(by="Autor").reset_index(drop=True) df = df.groupby("Autor")['Pages'].apply(lambda x: ','.join(x)).reset_index() df

2条回答

网友

1楼 · 编辑于 2024-05-13 04:43:24

如果您想使用现有的方法

df.Pages = (
    df.Pages.str.split(",")
        .apply(lambda x: sorted(x, key=lambda x: int(x)))
)

               Autor    Pages
0            Author2     [20]
1             Autor1  [1, 15]
2  Bertha Musterfrau     [17]
3     Max Mustermann  [5, 13]

网友

2楼 · 编辑于 2024-05-13 04:43:24

str.split返回字符串列表。所以lambda x: sorted(x)仍然按字符串排序，而不是按整数排序

您可以尝试：

df['Pages'] = (df.Pages.str.split(',')
   .explode().astype(int)
   .sort_values()
   .groupby(level=0).agg(list)
)

输出：

               Autor    Pages
0            Author2     [20]
1             Autor1  [1, 15]
2  Bertha Musterfrau     [17]
3     Max Mustermann  [5, 13]

相关问题更多 >

编程相关推荐

热门问题

热门文章