Python:很多变量的非常大的相关热图

2024-04-26 12:15:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经编写了以下代码来显示Pandas数据帧的相关矩阵/热图。它适用于具有20个或更少变量的数据帧。但是,我正在寻找一种智能的方法/函数,它可以轻松地处理许多变量,比如生成多个热图,这样所有变量都可以相互比较。在

例如,一个包含100个变量的数据帧不会在一个单独的相关热图中一致地显示出来。在

import seaborn as sns
fig, ax = plt.subplots(figsize=(15, 15))                   # Sample figsize in inches

cmap = sns.diverging_palette( 220 , 10 , as_cmap = True )  # color map
sns.heatmap(data      = df.corr(), 
            cmap      = cmap, 
            square    = True, 
            cbar_kws  = {'shrink': .3}, 
            annot     = True, 
            annot_kws = {'fontsize': 12},
            ax        = ax
           )

下面是一个将这个问题形象化的方法。让我们举一个玩具的例子。假设我们有一个包含6个变量的数据帧:[a, b, c, d, e, f],但并非所有6个变量都能适合一个热图。我猜解决方案必须将列划分为多个分区,比如[a, b][c, d]和{}。在

enter image description here


Tags: 数据方法函数代码truepandas智能as