超大阵列的Numpy点积

import numpy as np start = time.time() import warnings warnings.filterwarnings("ignore", message='genfromtxt', category=UserWarning) np.set_printoptions(threshold=np.nan) fin = open('E:/myscripts/Abin.txt', 'rb') # input file (170544X22 binary matrix) fin1 = open('E:/myscripts/AbinT.txt', 'rb') # input file (22X170544 binary matrix the transpose of Abin) fout = open('E:/myscripts/RPartial.txt', 'w+b') # output file FW = np.genfromtxt(fin,delimiter=',', dtype=int) WF = np.genfromtxt(fin1,delimiter=',', dtype=int) r = np.dot(FW,WF) #r calculation np.savetxt(fout, r, fmt='%i' ,delimiter=',', newline='\r\n') fin.close() fin1.close() fout.close()

([1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0], [1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,1,0,0,0,0,0,0], [1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,0,0,0,0,0], [1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,1,0,0,0,0], [1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,0,1,0,0,0])

2条回答

网友

1楼 · 编辑于 2024-04-26 13:25:38

这听起来像是一个sparse matrix问题，scpy为其提供了一个package。这些是包含许多0元素的矩阵（如您的示例中所示）。操作将考虑稀疏性，矩阵将占用较少的内存空间。记住要做矩阵运算，比如FW.dot(WF)（使用这个而不是np.dot）。在

网友

2楼 · 编辑于 2024-04-26 13:25:38

正如我在注释中所写的，输出数组的大小将是232GB（int64）。如果您不想将结果存储到磁盘上，那么使用h5py执行此任务将是一个合适的解决方案。在

对第一个轴的求和稍微简化了问题。如果你不想纯点积，我可以更新我的答案。但这会更复杂，更慢。在

res=np.zeros(WF.shape[1])
for i in range(WF.shape[1]):
  a=np.copy(WF[:,i])
  r=np.dot(FW,a)
  res[i] = np.sum(r)

相关问题更多 >

编程相关推荐

热门问题

热门文章