我写了一个函数,它接受一个系列(浮点数或整数),排序,然后为每个成员x计算系列中大于x的值的比例。我用tqdm来计时。你知道吗
import pandas as pd
from tqdm import tqdm, tqdm_pandas
tqdm.pandas()
def my_func(data):
data.sort_values(inplace=True)
n = len(data)
# return data.apply(lambda x: len(data[data > x]) / n) # if not using tdqm
return data.progress_apply(lambda x: len(data[data > x]) / n)
这需要几分钟才能在一个约300000行的序列上运行。我能做些什么来加快速度吗?你知道吗
使用^{} :
退货
相关问题 更多 >
编程相关推荐