我正在计算一个模型,它需要在一个大矩阵中进行大量计算,表示家庭(编号N,大约10E4)和公司(编号M,大约10E4)之间的相互作用。特别是,我要执行以下步骤:
这些步骤必须在模型模拟与数据匹配的上下文中执行1000次。目前,我有一个使用大型nxmnumpy数组并使用矩阵代数运算来执行上述步骤的实现。你知道吗
我希望能够通过消除距离大于某个临界值r的所有“单元格”来减少计算次数。
在执行所有需要执行的操作(指数运算、行/列求和、跨行和列广播)时,如何组织数据来执行此操作?你知道吗
我想到的解决方案类似于以“长格式”存储距离矩阵,每一行代表一个家庭/公司对,而不是N x M矩阵,删除所有无效行以获得长度小于NM的数组,然后以这种格式执行所有计算。在这个解决方案中,我想知道是否可以使用pandas数据帧使“broadcasts”和“row sums”正常(快速)工作。我怎样才能做到?你知道吗
(或者,如果有更好的方法我应该去探索,我很想知道!)你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐