Python解析csv数据算法

import csv import matplotlib.pyplot as plt f = open('2014.csv', 'rb') try: reader = csv.reader(f) avgK = 0 avgD = 0 date = 0 mon = 1 avergK = [] avergD = [] count_date = 1 for row in reader: if row[2] == 'TAVG': count_date +=1 date = (int(row[1]) % 10000) if row[0] == 'UPM00033345': avgK += float(row[3])/10.0 elif row[0] == 'UPM00034504': avgD += float(row[3])/10.0 if (date//100 > mon): print date //100, mon, date%100, avgK, avgD avergK.append(avgK/count_date) avergD.append(avgD/count_date) mon += 1 avgK = 0 avgD = 0 count_date = 1 continue finally: f.close() plt.subplot(2, 1, 1) plt.plot(avergK) plt.xlabel('Month') plt.ylabel('Average Temperature') plt.title('AVG in Kiev 2014') plt.grid(True) plt.subplot(2, 1, 2) plt.plot(avergD) plt.xlabel('Month') plt.ylabel('Average Temperature') plt.title('AVG in DNIPROPETROVSK 2014') plt.grid(True) plt.show()

1条回答

网友

1楼 · 发布于 2024-04-19 07:44:34

也许你可以在这里使用熊猫，但你不需要它们来解决当前的问题。所发生的是，你存储一个月平均只有当你找到一个新的一个月行。但当你到达文件的末尾时，你应该在上个月完成这个过程。你知道吗

你的循环应该是：

for row in reader:
    if row[2] == 'TAVG':
        count_date +=1
        date = (int(row[1]) % 10000)

        if row[0] == 'UPM00033345':    
            avgK += float(row[3])/10.0

        elif row[0] == 'UPM00034504':
            avgD += float(row[3])/10.0

    if (date//100 > mon):
        print date //100, mon, date%100, avgK, avgD
        avergK.append(avgK/count_date)
        avergD.append(avgD/count_date)
        mon += 1
        avgK = 0
        avgD = 0
        count_date = 1
        continue

# store values for last month
avergK.append(avgK/count_date)
avergD.append(avgD/count_date)

相关问题更多 >

编程相关推荐

热门问题

热门文章