从.csv文件读取X和Y坐标,在Python MatPlotLib中生成频率热图
我最近看到一个类似的问题,关于如何在Python中使用MatPlotLib模块生成频率热图。
这篇文章对我很有帮助,我能够让单独的脚本运行,并为代码生成的随机测试数据创建热图。不过,我在调整代码以适应我正在处理的数据时遇到了困难。我的数据是以逗号分隔的格式(.csv)存储的。
我目前在这个.csv文件中有3788对平均质量评分。这些平均质量评分的范围都是从0到5。我想创建一个热图,将数据按0.5的增量分组,x轴和y轴都是这样(0-.499, .5-.999, 1-1.499等等)。
我想把.csv文件的第一列(webqualityratings)作为热图的x值,第二列(inpersonqualityratings)作为热图的y值。
我试图调整的代码是由“ptomato”发布,并由Mike Graham编辑的,代码如下:
import numpy as np
import numpy.random
import matplotlib.pyplot as plt
# Generate some test data
x = np.random.randn(8873)
y = np.random.randn(8873)
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.clf()
plt.imshow(heatmap, extent=extent)
plt.show()
如果有人能帮我调整这段代码,使其能够读取我指定的.csv文件中的数据,我将非常感激!
2 个回答
-2
Python有一个非常棒的处理csv文件的库:
虽然我对matplotlib不太了解,但下面的代码会遍历一个用制表符分隔的csv文件,并在每一行的第一列和第二列上执行你的代码。
import numpy as np
import numpy.random
import matplotlib.pyplot as plt
import csv
with open(yourInputFile, "rb") as mycsv:
reader = csv.DictReader(mycsv, dialect='excel-tab')
for row in reader:
x = row['name of first column']
y = row['name of second column']
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.clf()
plt.imshow(heatmap, extent=extent)
plt.show()
需要注意的是,我使用的是DictReader这个版本,它需要文件的开头有一个标题行,或者在创建时提供标题。如果你愿意,也可以使用普通的reader,但它是用列的编号来处理的,这在字段超过100个时会很麻烦。
你可以根据自己的csv文件来更改方言,甚至在必要时创建自己的方言。
最后,我要说明的是,我对matplotlib一无所知,所提供的那段代码很可能是错的。
5
既然你有了 numpy
这个工具,并且假设你的 csv 文件格式正常,那么你可以使用 numpy.loadtxt()
来读取这些文件。
import numpy as np
import matplotlib.pyplot as plt
dat = np.loadtxt('mydata.csv')
x, y = dat[:,0], dat[:,1]
heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
plt.clf()
plt.imshow(heatmap, extent=extent)
plt.show()