使用pandas.to_datetim时只保留日期部分

网友

1楼 · 编辑于 2024-04-26 14:44:49

简单解决方案：

df['date_only'] = df['date_time_column'].dt.date

网友

2楼 · 编辑于 2024-04-26 14:44:49

虽然我对EdChum的答案投了更高的票，这是对OP提出的问题最直接的答案，但它并不能真正解决性能问题（它仍然依赖于pythondatetime对象，因此对它们的任何操作都不会矢量化——也就是说，它会很慢）。

A better performing alternative是使用df['dates'].dt.floor('d')。严格地说，它不“只保留日期部分”，因为它只是将时间设置为00:00:00。但它确实可以按照OP的要求工作，例如：

。。。而且由于操作是矢量化的，所以效率更高。

编辑：事实上，操作人员更希望得到的答案可能是“最新版本的pandas如果所有观察都是00:00:00，请不要将时间写入csv”。

网友

3楼 · 编辑于 2024-04-26 14:44:49

由于版本0.15.0，现在可以使用^{}轻松完成此操作，只需访问日期组件：

df['just_date'] = df['dates'].dt.date

上面返回一个datetime.date数据类型，如果您想要有一个datetime64，那么您可以将时间组件^{}设置为午夜，以便将所有值设置为00:00:00：

df['normalised_date'] = df['dates'].dt.normalize()

这将使dtype保持为datetime64，但显示的只是date值。