利用pyplot和pandas绘制大数据集等高线图

2024-04-25 05:39:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有大量的数据样本,需要可视化。使用pandas,我可以创建一个包含相关变量的数据帧-3个长度为2千万的数组。在

这是x,y的几何坐标和那个点上的z值。在

我需要一张z在每个(x,y)点的“热图”。但是pyplot函数不能处理这么大的数字。在

最好的办法是什么?在


Tags: 数据函数pandas可视化数字数组热图样本
1条回答
网友
1楼 · 发布于 2024-04-25 05:39:07

虚拟数据

使用200000行进行测试

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
df=pd.DataFrame(np.random.rand(200000,2), columns=['X','Y'])
df['Z']=df.apply(lambda x: x.X+x.Y*2, axis=1)

代码

创建bin区间和groupby将mean应用于Z列的数据帧,因此要绘制每个X,Y bin对的mean Z。最后,散点图

^{pr2}$

enter image description here

相关问题 更多 >