从我的研究中,我发现我只能使用apply
来格式化Pandas中的字符串,这在大型数据集中非常慢,因为apply
实际上是整个数据的一个循环。理论上,format
是一个可向量化函数,因为它不依赖于其他行。因此,我们有没有办法把它矢量化?在
例如,我的一项工作就是要这样做:
joined["timestamp"] = joined.apply(lambda row: args.date + " {:0>2d}:{:0>2d}:00".format(row["tid"]/6, row["tid"]%6*10), axis=1)
其中tid
是一个整数。一些示例数据(joined
):(date="20170101"
)
我相信通过格式化其他一些列来附加一个新的字符串列是一种常见的情况。在
谢谢你!在
我相信您需要^{} 并将分区改为楼层分区(
//
):相关问题 更多 >
编程相关推荐