从CSV fi获取值的总和

Unnamed: 0 Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 4 Unnamed: 5 0 HDB 1 NaN NaN NaN NaN 1 NaN NaN NaN NaN NaN NaN 2 NaN NaN NaN NaN NaN NaN 3 HDB 1 NaN NaN NaN NaN 4 NaN NaN NaN NaN NaN NaN 5 NaN NaN NaN NaN NaN NaN 6 NaN NaN NaN NaN NaN NaN 7 LPO 1 VLPO 1 NaN NaN 8 LPO 1 NaN NaN NaN NaN 9 LGP 1 NaN NaN NaN NaN 10 NaN NaN NaN NaN NaN NaN

2条回答

网友

1楼 · 编辑于 2024-05-23 17:37:20

temp = []
d = {}
with open('data', 'r') as f:
    for line in f:
        line=line.strip()
        # remove first column
        line = line.split(',')[1:]
        # get rid of "Nan"
        line = [x for x in  line if x != "NaN"]
        # put data into sublists of 2
        if line:
            line =  [line[i:i + 2] for i in range(0, len(line), 2)]
            temp.extend(line)

# unpack sublists and put into dictionary 
for  el in temp:
    k, v = el
    if k in d.keys():
        d[k]  += int(v)
    else:
        d[k] = int(v)

with open('data.csv', 'w', newline='') as fp:
    a = csv.writer(fp, delimiter=',')
    for t in d.items():
        a.writerows([t])

data.csv contains now:

LGP,1
HDB,2
VLPO,1
LPO,2

网友

2楼 · 编辑于 2024-05-23 17:37:20

使用内置函数的单行程序是：

reader.stack().value_counts()

stack将数据帧透视成一个带有层次索引的序列，然后允许我们使用value_counts函数。这是必要的，因为数据帧不支持value_counts。你知道吗

请注意，这会计算值1的频率，该值出现在示例中。您可以很容易地过滤非字符串索引以获得预期的输出。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章