使用adjustText避免Python prince对应分析中的标签重叠

import pandas as pd import prince from adjustText import adjust_text pd.set_option('display.float_format', lambda x: '{:.6f}'.format(x)) X=pd.DataFrame(data=[ ... my data ... ], columns=pd.Series([ ... my data ... ]), index=pd.Series([ ... my data ...]), ) ca = prince.CA(n_components=2,n_iter=3,copy=True,check_input=True,engine='auto',random_state=42) ca = ca.fit(X) ca.row_coordinates(X) ca.column_coordinates(X) ax = ca.plot_coordinates(X=X,ax=None,figsize=(6, 6),x_component=0,y_component=1,show_row_labels=True,show_col_labels=True) ax.get_figure().savefig('figure.png')

2条回答

网友

1楼 · 编辑于 2024-04-25 04:21:11

首先，通过plot_coordinates()禁用标签显示：

ax = ca.plot_coordinates(X=X,ax=None,figsize=(6, 6),x_component=0,y_component=1,show_row_labels=False,show_col_labels=False)

然后，提取列和行的坐标：

COLS=ca.column_coordinates(X).to_dict()
XCOLS=COLS[0]
YCOLS=COLS[1]
ROWS=ca.row_coordinates(X).to_dict()
XROWS=ROWS[0]
YROWS=ROWS[1]

结构XCOLS、YCOLS、XROWS、YROWS是具有浮点值（坐标）的字典。让我们将两个x轴字典合并到一个x轴字典中，我将称之为XGLOBAL，y轴字典也是如此，合并到YGLOBAL：

XGLOBAL={ k : XCOLS.get(k,0)+XROWS.get(k,0) for k in set(XCOLS) | set(XROWS) }
YGLOBAL={ k : YCOLS.get(k,0)+YROWS.get(k,0) for k in set(YCOLS) | set(YROWS) }

现在我只应用adjust_text()，如文档中所述：

fig = ax.get_figure()
texts=[plt.text(XGLOBAL[x],YGLOBAL[x],x,fontsize=7) for x in XGLOBAL.keys()]
adjust_text(texts,arrowprops=dict(arrowstyle='-', color='red'))
fig.savefig('newfigure.png')

结果是：

请注意，虽然在没有adjust_text的情况下图像生成是即时的，但是使用adjust_text大约需要40秒

网友

2楼 · 编辑于 2024-04-25 04:21:11

你也可以在文本迭代中放置一个小角度。我发现它有助于调整文本例程

texts=[plt.text(XGLOBAL[x],YGLOBAL[x],x,fontsize=7, 
rotation = -XGLOBAL.keys()+2*x) for x in XGLOBAL.keys()]

相关问题更多 >

编程相关推荐

热门问题

热门文章