从序列中获取特定列表元素

1条回答

网友

1楼 · 发布于 2024-04-20 01:53:09

最后我以不同的方式解决了这个问题

做完之后

result = df.apply(
    lambda row: (do_something(row), do_something_else(row)),
    axis=1)

我没有把它们分成两个系列，而是这样做了

new_result = pandas.DataFrame(
    result.values.tolist(),
    index=df.index,
    columns=('column1', 'column2'))

实际上，我将原始的df分解为多个可处理的块（使用concurrent.futures），因此实际调用的示例应该如下所示

with concurrent.futures.ProcessPoolExecutor(max_workers=4) as pool:
    jobs = []

    for i in range(njobs * 10):
        bounds = (ceil(i * data.shape[0] / float(njobs * 10)),
                  ceil((i + 1) * data.shape[0] / float(njobs * 10)))

        jobs.append(pool.submit(
            df[bounds[0]:bounds[1]].apply,
            some_func_returning_tuple_of_two,
            axis=1))

    result = pandas.DataFrame(
        list(itertools.chain.from_iterable([job.result() for job in jobs])),
        index=data.index,
        columns=('result', 'meta') if has_meta else ('result'))

相关问题更多 >

编程相关推荐

热门问题

热门文章

从序列中获取特定列表元素

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >