添加一列依赖于字符串的浮点

2024-06-16 11:54:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试根据熊猫数据框中的名称绘制带有颜色的matplotlib绘图。在x,y图中,不同的名称点有不同的颜色。你知道吗

数据帧:

    id  x   y   Names   
0   MAC004524   29.137983   11.864633   ACORN-M     
1   MAC004525   28.14       11.80       ACORN-M 
2   MAC004526   24.14       12.80       ACORN-C 
....

代码:

names = set(df['Names'])
colors = list(cmap(np.linspace(0, 1, len(names))))
df['color']=0
for a, c in zip(names, colors):
    mask = df.loc[df['Names'] == a]
    df.loc[mask, 'color'] = c
#but get an error here KeyError: "[('i', 'd') ('x',) ('y',) ('A', 'c', 'o', 'r', 'n')\n ('A', 'c', 'o', 'r', 'n', '_', 'g', 'r', 'o', 'u', 'p', 'e', 'd')\n ('c', 'o', 'l', 'o', 'r')] not in index"

那我就来策划

x = df['x']
y = df['y']
c= df['color']
plt.scatter(x, y, c=c, s=1)

所需df:

    id  x   y   Names    color
0   MAC004524   29.137983   11.864633   ACORN-M    [0.267004 0.004874 0.329415 1.      ] 

Tags: 数据in名称iddfnames颜色绘制
2条回答

问题应该出在试图在单元格上放置一个列表上。如here所示,应该使用.at而不是.loc。你知道吗

可能不是最有效的方法,但它可以完成任务:

for a, c in zip(names, colors):
    mask = df[df['Names'] == a].index
    for value in mask:
        df.at[value, 'color'] = c

我添加了索引,并对它的每个值进行迭代,以用指定的颜色替换,因为我还没有找到一种方法将多个值添加到.at命令的行索引中。你知道吗

你调查过海伯恩的阴谋吗?您可以立即从原始数据帧进行绘图:

import seaborn as sns
sns.scatterplot(x='x', y='y', hue='Names', data=df)

相关问题 更多 >