In [1]: %timeit [column for column in df]
1000 loops, best of 3: 81.6 µs per loop
In [2]: %timeit df.columns.values.tolist()
10000 loops, best of 3: 16.1 µs per loop
In [3]: %timeit list(df)
10000 loops, best of 3: 44.9 µs per loop
In [4]: % timeit list(df.columns.values)
10000 loops, best of 3: 38.4 µs per loop
有一种内置的方法最有效:
.columns
返回一个索引,.columns.values
返回一个数组,这个数组有一个助手函数.tolist
返回一个列表。如果性能对您不那么重要,
Index
对象定义了一个可以直接调用的.tolist()
方法:性能上的差异是显而易见的:
对于那些讨厌打字的人,你可以在
df
上调用list
,这样:可以通过执行以下操作以列表形式获取值:
也可以简单地使用:(如Ed Chum's answer所示):
做了一些快速的测试,也许毫不奇怪使用
dataframe.columns.values.tolist()
的内置版本是最快的:(不过,我还是很喜欢
list(dataframe)
,所以谢谢埃德楚!)相关问题 更多 >
编程相关推荐