如何对文件中的条目进行迭代，生成具有唯一值的字典，并为可能多次出现的每个值计算平均值？

2条回答

网友

1楼 · 编辑于 2024-04-20 11:01:01

以下是从^{}开始的一种方法：

from collections import defaultdict

mylist=[('AGA' ,0.211), ('AGA' ,0.433), ('AGA' ,0.123), ('AGH' ,0.002), 
        ('DHI', 0.063), ('DHI' ,0.193), ('DHI' ,0.004), ('KHI' ,0.543),
        ('KHI' ,0.064), ('HID' ,0.234)]

mydict = defaultdict(list)
for key, val in mylist:
    mydict[key].append(val)

summary = {}
for key, val in mydict.items():
    summary[key] = len(val), sum(val), sum(val)/len(val)

print summary
#Output:
{'KHI': (2, 0.60699999999999998, 0.30349999999999999), 
 'HID': (1, 0.23400000000000001, 0.23400000000000001), 
 'AGA': (3, 0.76700000000000002, 0.25566666666666665), 
 'DHI': (3, 0.26000000000000001, 0.08666666666666667), 
 'AGH': (1, 0.002, 0.002)}

网友

2楼 · 编辑于 2024-04-20 11:01:01

由于表中的数据似乎是经过排序的，因此实际上不需要首先将所有内容都放在字典中，但这样可能会使事情更清楚。但我猜你的桌子可能会变得很大，所以再次存储所有东西是一个资源杀手。。。你知道吗

def sum_up(id, list):
    counted = len(list)
    summed = sum(list)
    avrg = summed/counted
    # print, insert or do whatever needed with the lines:
    print counted, summed, avrg

last_id = None
current = []
for line in file:
    (id, value) = line.split()
    if last_id != id:
        if last_id is not None:
            # evaluate last id
            sum_up(last_id, current)
            current = []
        # remember id
        last_id = id
    # append to current ids entries
    current.append(value)

# do the last id, if there is any:
if len(current) > 0:
    sum_up(last_id, current)

我没有测试代码，但你应该知道。它看起来有点复杂，但是当您有超过10万行左右的代码时，您应该会感觉到一种不同：首先在内存中加载所有内容，然后再进行处理

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何对文件中的条目进行迭代，生成具有唯一值的字典，并为可能多次出现的每个值计算平均值？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >