Pandas数据帧是如何存储在内存中的？

1条回答

网友

1楼 · 发布于 2024-04-23 23:42:21

一个快速测试表明，成本在concat中，而不是在dereference中。所以，BLUF，df['s1']是O（1），而concat是O（n）。在

从每个系列的1个项目运行到每个系列的4000万个项目，取消引用所需的时间相似，而concat时间似乎呈线性增加。在

使用以下简单代码：定义函数（frange）：

a1 = []
a2 = []
for x in numpy.arange(frange):
    a1.append(x)
    a2.append(-x)

s1 = pd.Series(a1, index=a1, name='s1')
s2 = pd.Series(a2, index=a1, name='s2')
cstart =  time.perf_counter();
df = pd.concat([s1, s2], axis=1)
cend = time.perf_counter();

tstart =  time.perf_counter();
for y in range(100):
    series = df['s1']
    series2 = df['s2']
tend = time.perf_counter();

print (frange,',', cend-cstart,tend-tstart)

结果是：

编程相关推荐

Java SOAP请求，创建主体
java如何将Logj4日志级别转换为JUL日志级别？
java为什么我可以将浮点传递给Double的构造函数？
java从特定的持久性Tibco EMS订阅中删除消息
java为什么会出现“xxx已定义”编译器错误？
如何在java中编写用于用户注册的web服务
java如何在不使用position的情况下打开不同的活动
java My数据库已经更新，但我的安卓 studio仍然没有更新，仍然显示以前获取的数据库
java缺少类型为Long的方法参数的URI模板变量“usuarioEntidade”
java从浏览器中删除jsessionid cookie，此时会话将失效

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas数据帧是如何存储在内存中的？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >