在Python中高效遍历数组元素
我正在尝试高效地根据特征对不同的数据数组中的元素进行求和。我有三个特征(年龄、年份和原因),每个特征在一个数组中都有1000个值。我的目标是,当这些特征相同的时候,把这些值加到另一个数据数组中。目前,我的做法是这样的,每个数据集大约是(80000, 1000):
import numpy as np
datasets = np.vstack(dataset1, dataset2)
for a in ages:
for y in years:
for c in causes:
output = np.sum(datasets[(age==a) & (year==y) & (cause==c)], axis = 0)
但是,经过60000次迭代后,这个过程非常慢。问题在于,这些数组的形状不一定都是一样的。有没有什么好的建议?
2 个回答
0
请看下面的链接
我不太确定怎么把另一个答案正确地链接到这个答案上。当我尝试用一句话加上链接时,它把我的答案变成了评论。现在我在这里啰嗦,希望让Stack Overflow觉得这段文字足够长,可以算作一个答案。这里有一个关于这个问题的很好的答案链接。