并行递增地计算基本统计数据
parallel-statistics的Python项目详细描述
概述
此软件包收集工具,用于计算并行增量数据的加权统计信息,即多个处理器一次读取一个数据块。在
可用的工具有:
ParallelSum
ParallelMean
ParallelMeanVariance
ParallelHistogram
SparseArray
所有这些都假设mpi4py正在进程之间使用,并传递一个通信器对象(通常是mpi4py.MPI.COMM_WORLD
)。在
安装
目前,您可以使用以下方法安装此软件包:
pip install parallel_statistics
文件
文档可以在https://parallel-statistics.readthedocs.io/找到
示例
这三个工具ParallelSum
、ParallelMean
和{
它们和ParallelHistogram
的使用模式是:
- 在每个MPI进程中创建一个并行计算器对象
- 让每个进程读入自己的数据块,并使用
add_data
方法添加它 - 完成后,调用
collect
方法以获得组合结果。在
下面是一个从HDF5文件中分离数据的示例,使用的是DESC断层扫描挑战。您可以单独运行它,也可以使用不同数量的处理器在MPI下运行,结果应该相同:
^{pr2}$- 项目
标签: