使用分类值时，如何保持散点图中轴的顺序？

2条回答

网友

1楼 · 编辑于 2024-06-17 15:35:08

有时，最好升级当前的开发包。因为您的virtual-env安装了本地matplotlib。寻源激活后，升级matplotlib

为此，请使用管理权限打开terminal或command prompt，并尝试使用以下命令升级版本pip和matplotlib：

python -m pip install upgrade pip
python -m pip install upgrade matplotlib

另一方面，使用matplotlib，您可以获取或设置任一轴的当前标记位置和标签（即x-axis或y-axis）

我给你一个非常简单的例子，你的给定数据沿着两个轴以顺序绘制。要保留沿axes的顺序，只需使用：

您可以使用此技术解决升级matplotlib和不升级matplotlib时的问题。特别是对于指定的matplotlib==2.1.1版本

import matplotlib.pyplot as plt

x_axis_values = ['(-68.18100000000001, 89.754]', '(89.754, 130.42]', '(130.42, 165.601]', '(165.601, 205.456]',
                 '(205.456, 371.968]']

y_axis_values = ['(-0.123, 0.749]', '(0.749, 0.922]', '(0.922, 1.068]', '(1.068, 1.253]', '(1.253, 2.14]']

# Try to sort the values, before passing to [xticks, yticks]
# or in which order, you want them along axes
plt.xticks(ticks=range(len(x_axis_values)), labels=x_axis_values)
plt.yticks(ticks=range(len(y_axis_values)), labels=y_axis_values)

# plt.scatter(x_axis_values, y_axis_values)
plt.xlabel('Values')
plt.ylabel('Indices')

plt.show()

下面是这个简单示例的输出。您可以看到沿着x-axis和y-axis的值。给定图的目的只是指定values以及axes：

对于您给定的代码，我已将您的一些代码更新如下：

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.colors
import numpy as np

n_tile = 5
np.random.seed(0)
x = np.random.normal(150, 70, 3000, )
y = np.random.normal(1, 0.3, 3000)
r = np.random.normal(0.4, 0.1, 3000)

plot_data = pd.DataFrame({
    'x': x,
    'y': y,
    'r': r
})
plot_data['x_group'] = pd.qcut(plot_data['x'], n_tile, duplicates='drop')
plot_data['y_group'] = pd.qcut(plot_data['y'], n_tile, duplicates='drop')
plot_data_grouped = plot_data.groupby(['x_group', 'y_group'], as_index=False).agg({'r': ['mean', 'count']})
plot_data_grouped.columns = ['x', 'y', 'mean', 'count']

cmap = plt.cm.rainbow
norm = matplotlib.colors.Normalize(vmin=0, vmax=1)

########################################################
##########  Updated Portion of the Code ################

x_axis_values = [str(x) for x in plot_data_grouped['x']]
y_axis_values = [str(x) for x in plot_data_grouped['y']]

plt.figure(figsize=(10, 10))
# Unique Values have only length == 5
plt.xticks(ticks=range(5), labels=sorted(np.unique(x_axis_values)))
plt.yticks(ticks=range(5), labels=sorted(np.unique(y_axis_values)))

plt.scatter(x=x_axis_values,
            y=y_axis_values,
            s=plot_data_grouped["count"],
            c=plot_data_grouped['mean'], cmap="RdYlGn", edgecolors="black")

plt.show()
########################################################

现在您可以看到输出符合要求：

网友
2楼 · 编辑于 2024-06-17 15:35:08

这里有两种解决方案。更简单（也是更好的解决方案）的方法是简单地将matplotlib升级到新版本
如果这不是一个选项，首选的替代方案是分别处理散点打印和勾号标记，这可以非常简单地完成。例如：
import pandas as pd import matplotlib.pyplot as plt import matplotlib.colors import numpy as np n_tile = 5 np.random.seed(0) x = np.random.normal(150, 70, 3000,) y = np.random.normal(1, 0.3, 3000) r = np.random.normal(0.4, 0.1, 3000) plot_data = pd.DataFrame({'x': x, 'y': y, 'r': r}) plot_data['x_group'] = pd.qcut(plot_data['x'], n_tile, duplicates='drop') plot_data['y_group'] = pd.qcut(plot_data['y'], n_tile, duplicates='drop') plot_data_grouped = plot_data.groupby(['x_group','y_group'], as_index=False).agg({'r':['mean','count']}) plot_data_grouped.columns = ['x','y','mean','count'] cmap = plt.cm.rainbow norm = matplotlib.colors.Normalize(vmin=0, vmax=1) plt.figure(figsize=(10,10)) x = range(len(plot_data_grouped['x'])) y = range(len(plot_data_grouped['y'])) X, Y = np.meshgrid(x, y) plt.scatter(x=X.flatten(), y=Y.flatten(), s=plot_data_grouped["count"], c=plot_data_grouped['mean'], cmap="RdYlGn", edgecolors="black") plt.xticks(x, [str(e) for e in plot_data_grouped['x']]) plt.yticks(y, [str(e) for e in plot_data_grouped['y']]) plt.show()

相关问题更多 >

编程相关推荐

热门问题

热门文章