我已经编写了以下代码来显示Pandas数据帧的相关矩阵/热图。它适用于具有20个或更少变量的数据帧。但是,我正在寻找一种智能的方法/函数,它可以轻松地处理许多变量,比如生成多个热图,这样所有变量都可以相互比较。在
例如,一个包含100个变量的数据帧不会在一个单独的相关热图中一致地显示出来。在
import seaborn as sns
fig, ax = plt.subplots(figsize=(15, 15)) # Sample figsize in inches
cmap = sns.diverging_palette( 220 , 10 , as_cmap = True ) # color map
sns.heatmap(data = df.corr(),
cmap = cmap,
square = True,
cbar_kws = {'shrink': .3},
annot = True,
annot_kws = {'fontsize': 12},
ax = ax
)
下面是一个将这个问题形象化的方法。让我们举一个玩具的例子。假设我们有一个包含6个变量的数据帧:[a, b, c, d, e, f]
,但并非所有6个变量都能适合一个热图。我猜解决方案必须将列划分为多个分区,比如[a, b]
、[c, d]
和{
尝试切片数据帧。假设你有100个变量可以分成两部分,每部分50个
相关问题 更多 >
编程相关推荐