joblib并向dataframe添加新行

1条回答

网友

1楼 · 发布于 2024-04-26 11:15:48

您可以对dataframe进行分组并在组上迭代，将每个组传递给函数，并将函数的结果存储到一个列表中，您可以在最后连接该列表

这里我们有一些名字和年龄，我们将按年龄分组并传递一个并行函数，取平均值并将结果返回到一个列表中，该列表被连接为最终产品

import pandas as pd
from joblib import Parallel, delayed
import multiprocessing

df = pd.DataFrame({'name':['john','john','chris','chris'],
                  'age':[23,46,32,56]})

def applyParallel(dfGrouped, func):

    retLst = Parallel(n_jobs=multiprocessing.cpu_count())(delayed(func)(name, data) for name, data in dfGrouped)

    return pd.concat(retLst)


def my_function(name,data):
    ### Process data here
    data = data.groupby('name').mean()
    return data

# Group by some column in your dataframe
output = applyParallel(df.groupby(['name']), my_function)

输出

         age
name    
chris   44.0
john    34.5

相关问题更多 >

编程相关推荐

热门问题

热门文章

joblib并向dataframe添加新行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >