基于Numpy的大规模矩阵乘法

def sim_phe_g(geno, betas, chunk_size): num_indv = geno.row_count num_snps = geno.col_count num_settings = betas.shape[1] phe_g = np.zeros([num_indv, num_settings]) # divide individuals into chunks for i in range(0, num_indv, chunk_size): sub_geno = geno[i : i + chunk_size, :] sub_geno = sub_geno.read().val phe_g[i : i + chunk_size, :] = np.dot(sub_geno, betas) return phe_g

2条回答

网友

1楼 · 编辑于 2024-06-05 23:56:08

如果适用，尝试使用tensorflow进行大矩阵乘法，正如您从这个article中看到的，在许多情况下，tensorflow在大矩阵的情况下表现得更好。同样的原因很可能是它主要是为了高效地处理大型矩阵而构建的。在

有关矩阵乘法具体用法的详细信息，请参阅documentation。在

我在（10001000）矩阵上测试了它的乘法运算：

对于numpy.matmul=60ms±5.35

对于tensorflow.matmul=42.5 ms±2.47 m

平均每人进行100次共享和stdev测试

p.S.Tensorflow的cpu版本仅使用

网友

2楼 · 编辑于 2024-06-05 23:56:08

尝试使用TensowFlow进行GPU优化，这对矩阵乘法非常好，因为它允许您并行化每个操作。在

相关问题更多 >

编程相关推荐

热门问题

热门文章