假设我有一个11523维的浮动向量s
,也就是说,它的形状是1x11523。(是的,没有那么紧凑。)
我还有108000个向量要比较。其中,我想得到最接近s
的向量。(换句话说,我在11523d中有108000个质心,并且我希望有最接近s
的质心。)
当然,108000x11523浮动矩阵太大,无法保存在一个文件中。所以每36个中心点都被保存。(例如,c0000.pickle
、c0001.pickle
、c0002.pickle
、c2999,pickle
,每一个都是36x11523矩阵)。你知道吗
我正在浏览每个文件:
best_so_far = 1e10 # or, infinity
for file in files:
centeroids = load(file) # eg, `c0001.pickle`
dist = distance_measure(s, centeroids)
if dist < best_so_far:
# update best
这个过程现在很慢。有没有更好的办法?我应该加载几个文件到某个特定的内存使用和计算的措施?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐