如何计算Pandas中共享唯一字段的行数

df = pd.DataFrame({ 'person' : [1,1,2,2,3,3], 'book' : ['dracula', 'frankenstein', 'dracula', 'frankenstein', 'dracula', 'rebecca'], 'score':[10,11,12,13,14,15] }) df book person score 0 dracula 1 10 1 frankenstein 1 11 2 dracula 2 12 3 frankenstein 2 13 4 dracula 3 14 5 rebecca 3 15

2条回答

网友

1楼 · 编辑于 2024-05-23 19:39:19

另一个带有^{}的解决方案：

df = pd.crosstab(df.book, df.person)
print (df.dot(df.T))
book          dracula  frankenstein  rebecca
book                                        
dracula             3             2        1
frankenstein        2             2        0
rebecca             1             0        1

或含有^{}和^{}的溶液：

df = df.groupby(['book','person'])['person'].size().unstack().fillna(0).astype(int)
print (df.dot(df.T))
book          dracula  frankenstein  rebecca
book                                        
dracula             3             2        1
frankenstein        2             2        0
rebecca             1             0        1

网友

2楼 · 编辑于 2024-05-23 19:39:19

可以构造透视表并将其与转置相乘：

pvt = pd.pivot_table(df, index='book',  columns='person', aggfunc=len, fill_value=0)
pvt.dot(pvt.T)
Out: 
book          dracula  frankenstein  rebecca
book                                        
dracula             3             2        1
frankenstein        2             2        0
rebecca             1             0        1

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何计算Pandas中共享唯一字段的行数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >