有没有一种方法可以对当前在数据帧中的行上迭代的代码进行矢量化？

1条回答

网友

1楼 · 发布于 2024-04-29 14:07:33

如果所有其他操作都失败，您可以在每一行上使用.apply()

totalSum = df.apply(lambda row: row.distance[row.schoolChoice] ** 2 * row.students, axis=1).sum()

要加快速度，您可以导入numpy

totalSum = (numpy.stack(df.distance)[range(len(df.schoolChoice)), df.schoolChoice] ** 2 * df.students).sum()

numpy方法要求每行的距离长度相同，但是如果需要，可以将它们填充到相同的长度。（尽管这可能会影响任何收益。）

在150000行df上测试，如：

         distance  schoolChoice  students
0       [1, 2, 3]             0         4
1       [4, 5, 6]             2         5
2       [7, 8, 9]             2         6
3       [1, 2, 3]             0         4
4       [4, 5, 6]             2         5

时间：

         method    time
0      for loop   15.9s
1      df.apply    4.1s
2         numpy    0.7s

编程相关推荐

java有没有工具可以将zephyr转换为velocity模板？
java在安卓 studio中从JSON响应中获取值
jvm如何在Java中设计一个好的permgen空间字符串？
java如何防止Rest webservice使用被盗令牌进行身份验证
java无法遍历列表JSTL
找不到用于ResourceServerTokenServices的java Bean SpringSecurityOauth2
java子字符串替换问题
爪哇玻璃鱼3。十、以编程方式处理任意HTTPSession的终止
java如何检查输入是否为整数，并在最后添加一个命令来重新启动while循环？
引发java ical4j 1.0.6不可解析日期异常

相关问题更多 >

编程相关推荐

热门问题

热门文章

有没有一种方法可以对当前在数据帧中的行上迭代的代码进行矢量化？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >