包含iterab的拆分数据帧列

newdata = DataFrame(data["x"].apply(lambda x: (x, x*2)).tolist(), columns = ["x", "x2"]) data.drop("x", axis = 1, inplace = True) data = concat((data, newdata), axis = 1) print(data) label x x2 0 a 0 0 1 b 1 2 2 c 2 4 3 d 3 6 4 e 4 8

1条回答

网友

1楼 · 发布于 2024-04-18 17:06:36

这是可能的，但是用apply和Series不是那么快：

tup = data["x"].apply(lambda x: (x, x*2))
data[["x", "x2"]] = tup.apply(pd.Series)

print (data)
  label  x  x2
0     a  0   0
1     b  1   2
2     c  2   4
3     d  3   6
4     e  4   8

更快的是使用DataFrame构造函数：

tup = data["x"].apply(lambda x: (x, x*2))
data[["x", "x2"]] = pd.DataFrame(tup.values.tolist())
print (data)
  label  x  x2
0     a  0   0
1     b  1   2
2     c  2   4
3     d  3   6
4     e  4   8

时间安排：

data = pd.DataFrame({"label": [a for a in "abcde"], "x": range(5)})
data = pd.concat([data]*1000).reset_index(drop=True)
tup = data["x"].apply(lambda x: (x, x*2))


data[["x", "x2"]] = tup.apply(pd.Series)
data[["y", "y2"]] = pd.DataFrame(tup.values.tolist())
print (data)

In [266]: %timeit data[["x", "x2"]] = tup.apply(pd.Series)
1 loop, best of 3: 836 ms per loop

In [267]: %timeit data[["y", "y2"]] = pd.DataFrame(tup.values.tolist())
100 loops, best of 3: 3.1 ms per loop

相关问题更多 >

编程相关推荐

热门问题

热门文章

包含iterab的拆分数据帧列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >