试着转一转，但不是真的？

Data = {'codes': ['123456', '789654789', '789654789', '54126', '123456'], 'names': ['google.com', 'reddit.com', 'bbc.com', 'google.com', 'google.com'] } df = pd.DataFrame(Data, columns = ['codes','names'])

Data = {'codes': ['123456', '789654789', '54126'], 'names': ['(2)google.com', '(1)reddit.com|(1)bbc.com', '(1)google.com'] } df = pd.DataFrame(Data, columns = ['codes','names'])

2条回答

网友

1楼 · 编辑于 2024-05-13 21:59:52

Data = {'codes': ['123456', '789654789', '789654789', '54126', '123456'],
        'names': ['google.com', 'reddit.com', 'bbc.com', 'google.com', 'google.com']
        }
df = pd.DataFrame(Data, columns = ['codes','names'])

df=df.groupby(df.columns.tolist()).size().reset_index().rename(columns={0:'count'})
df['count']=df['count'].astype(str)+' '+df['names']
df = df.sort_values('names') .groupby('codes', sort=False)['count'].agg(lambda x: ','.join(x.astype(str))).reset_index()
print(df)
       codes                   count
0  789654789  1 bbc.com,1 reddit.com
1     123456            2 google.com
2      54126            1 google.com

网友

2楼 · 编辑于 2024-05-13 21:59:52

首先使用crosstab进行计算，然后将非零和与列名连接起来。最后一行只是根据您的问题将结果序列转换为数据帧：

ct = pd.crosstab(df.codes, df.names)
result = ct.apply(lambda row: '|'.join(list(filter(None,map((lambda value,colName: '({}){}'.format(value, colName) if value > 0 else ''), row, ct.columns.values)))), axis = 1)
res_df = result.reset_index().rename(columns = {0: 'names'})

结果如下：

       codes                     names
0     123456             (2)google.com
1      54126             (1)google.com
2  789654789  (1)bbc.com|(1)reddit.com

相关问题更多 >

编程相关推荐

热门问题

热门文章