共享内存数据集并行分析工具
ParallelRegression的Python项目详细描述
并行回归是一组python工具,用于使用并行进程分析共享内存中的数据集。mathdict是一组工具,用于在单个共享内存块中组装矩阵,然后创建不同的矩阵视图,这些视图将共享内存中的列与用于分析的进程本地列组合在一起。termset()和更通用的categorizedsetdict()和setlist()是便于跟踪与所分析的数据集相关的元数据的类。例如,浮点数学中的回归对项的顺序很敏感。使用建立在有序集类setlist()上的工具来跟踪术语元数据有助于结果的可复制性。并行回归还包括一些函数,这些函数可以简化对包含括起来的子字符串(如公式)的字符串的处理。