从.csv文件读取X和Y坐标,在Python MatPlotLib中生成频率热图

3 投票
2 回答
5856 浏览
提问于 2025-04-16 16:55

我最近看到一个类似的问题,关于如何在Python中使用MatPlotLib模块生成频率热图

这篇文章对我很有帮助,我能够让单独的脚本运行,并为代码生成的随机测试数据创建热图。不过,我在调整代码以适应我正在处理的数据时遇到了困难。我的数据是以逗号分隔的格式(.csv)存储的。

我目前在这个.csv文件中有3788对平均质量评分。这些平均质量评分的范围都是从0到5。我想创建一个热图,将数据按0.5的增量分组,x轴和y轴都是这样(0-.499, .5-.999, 1-1.499等等)。

我想把.csv文件的第一列(webqualityratings)作为热图的x值,第二列(inpersonqualityratings)作为热图的y值。

我试图调整的代码是由“ptomato”发布,并由Mike Graham编辑的,代码如下:

import numpy as np   
import numpy.random   
import matplotlib.pyplot as plt  

# Generate some test data  
x = np.random.randn(8873)  
y = np.random.randn(8873)  

heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)  
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]  
plt.clf()  
plt.imshow(heatmap, extent=extent)  
plt.show() 

如果有人能帮我调整这段代码,使其能够读取我指定的.csv文件中的数据,我将非常感激!

2 个回答

-2

Python有一个非常棒的处理csv文件的库:

http://docs.python.org/library/csv.html

虽然我对matplotlib不太了解,但下面的代码会遍历一个用制表符分隔的csv文件,并在每一行的第一列和第二列上执行你的代码。

import numpy as np
import numpy.random
import matplotlib.pyplot as plt
import csv

with open(yourInputFile, "rb") as mycsv:
    reader = csv.DictReader(mycsv, dialect='excel-tab')

    for row in reader:
        x = row['name of first column']
        y = row['name of second column']
        heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
        extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
        plt.clf()
        plt.imshow(heatmap, extent=extent)

plt.show()

需要注意的是,我使用的是DictReader这个版本,它需要文件的开头有一个标题行,或者在创建时提供标题。如果你愿意,也可以使用普通的reader,但它是用列的编号来处理的,这在字段超过100个时会很麻烦。

你可以根据自己的csv文件来更改方言,甚至在必要时创建自己的方言。

最后,我要说明的是,我对matplotlib一无所知,所提供的那段代码很可能是错的。

5

既然你有了 numpy 这个工具,并且假设你的 csv 文件格式正常,那么你可以使用 numpy.loadtxt() 来读取这些文件。

import numpy as np   
import matplotlib.pyplot as plt  

dat = np.loadtxt('mydata.csv')

x, y = dat[:,0], dat[:,1]

heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)  
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]  
plt.clf()  
plt.imshow(heatmap, extent=extent)  
plt.show() 

撰写回答