Pandas：按数字列名聚合，替换时给出错误

import pandas as pd import numpy as np df = pd.DataFrame(data= np.arange(0,10000,1).reshape(100,100)) df.columns = np.arange(0,10,0.1) print(df.head()) df.columns = df.columns.astype(float) temp = df.columns.values for n in np.arange(1, 9, 1): l = n - 0.1 m = n + 0.1 calc_n = temp[np.where((temp >= l) & (temp <= m))] calc = np.sum(df[df.columns.intersection(calc_n)], axis=1) n_position = temp[np.where(temp == n)] df[n_position] = calc.values

1条回答

网友

1楼 · 发布于 2024-04-27 03:59:06

ValueError是因为n_position是一个数组。所以df[n_position]给你一个数据帧而不是一个列。你知道吗

使用浮点作为索引通常不是一个好主意。在比较浮动时要小心。这行calc_n = temp[np.where((temp >= l) & (temp <= m))]并不总是给出准确的结果。你知道吗

对于初学者，请尝试：

for n in np.arange(1, 9, 1):
    margin = 0.101     # set your own margin
    calc_n = np.where(np.abs(temp-n) < margin)
    df[n] = df.iloc[:,calc_n[0]].sum(axis=1)

相关问题更多 >

编程相关推荐

热门问题

热门文章