输入:
[
[1,2,3,4,5],
[5,4,3,2,1],
[3,3,3,3,3]
]
输出:
[3,3,3,3,3]
暴力解决方案:
def calculate_col_mean(matrix):
mean = []
num_row = len(matrix)
num_col = len(matrix[0])
result = [0] * num_col
for i in range(num_row):
for j in range(num_col):
result[j] += matrix[i][j]
for i in range(num_col):
result[i] = result[i] / num_row
return result
这适用于小型数据集。想象一下,如果我们的数据集真的很大(1GB++),我如何优化它?穿线?我该怎么做呢
PS:使用蛮力方法在1GB数据上运行大约需要2个多小时
强烈建议使用NumPy进行类似的操作
转到命令行并激活python环境
在命令行或使用Jupyter笔记本打开Python(首选)
平均值(#)中的0表示希望对其执行平均值的轴
相关问题 更多 >
编程相关推荐