从dataframe对象创建二维数组

'Name' 'Book' 'Rating' 'John' 'Moby Dick' 5 'John' 'The Alchemist' 3 'John' 'The Da Vinci Code' 4 'Peter' 'Moby Dick' 4 'Peter' 'Lolita' 5 'Mike' 'The Alchemist' 4 'Mike' 'The Da Vinci Code' 3

import pandas import numpy df = read_from_file uName = df['Name'].unique().tolist() uBook = df['Book'].unique().tolist() m = numpy.zeros((len(uName), len(uBook))) for i in range(0, len(uName)): for j in range(0, len(uBook)): x = df.loc[(df['Name'] == uName[i]) & (df['Book'] == uBook[j])] if x.empty: m[i][j] = 0 else: m[i][j] = x.Rating

2条回答

网友

1楼 · 编辑于 2024-05-23 18:31:37

数据（temp.csv）：

Name,Book,Rating
John,Moby Dick, 5
John,The Alchemist, 3
John,The Da Vinci Code, 4
Peter,Moby Dick, 4
Peter,Lolita, 5
Mike,The Alchemist, 4
Mike,The Da Vinci Code, 3

代码：

df = pd.read_csv('temp.csv')
print(df)
print(df.pivot(values='Rating', columns='Book', index='Name').fillna(0))

输出

Book   Lolita  Moby Dick  The Alchemist  The Da Vinci Code
Name                                                      
John      0.0        5.0            3.0                4.0
Mike      0.0        0.0            4.0                3.0
Peter     5.0        4.0            0.0                0.0

网友

2楼 · 编辑于 2024-05-23 18:31:37

>>> import pandas as pd
>>> data = pd.DataFrame({'x': ['A', 'A', 'B','B', 'C'], 'y':['q','p','q', 'p', 'q'], 'r': [1, 2, 3, 4, 5]})
>>> data.pivot(values='r', columns='Name', index='Book')
x    A    B    C
y               
p  2.0  4.0  NaN
q  1.0  3.0  5.0

或者

>>> data.pivot(values='r', columns='x', index='y').fillna(0).values
array([[2., 4., 0.],
       [1., 3., 5.]])

对于您的数据帧，代码应该是这样的：

data.pivot(values='Rating', columns='x', index='y').fillna(0).values

相关问题更多 >

编程相关推荐

热门问题

热门文章