我正在寻找建议,以插值可用的数据与每小时的频率为基础的时间频率的其他数据源。你知道吗
例如:
我有一个数据帧包含以下提到的每小时频率的天气测量值,以及间隔约为4到5分钟的传感器读数。因此,我想根据其他数据源传感器读数的时间频率转换我的天气测量值。你知道吗
熊猫可以用来代替Pypark吗?我知道那里有一些特点。谢谢你 天气测量:
+----------+----------------------+
|Wind_speed|Forecast_Time |
+----------+----------------------+
|22 |2019-01-29T15:00:00+00|
|17 |2019-01-29T16:00:00+00|
|23 |2019-01-29T17:00:00+00|
|11 |2019-01-29T18:00:00+00|
|10 |2019-01-29T19:00:00+00|
+----------+----------------------+
传感器读数:
+----------------------+-----------+------+
|DateTime |Total count|Avail |
+----------------------+-----------+------+
|2019-01-29T15:24:02+00|45 |350 |
|2019-01-29T15:20:19+00|511 |710 |
|2019-01-29T15:24:02+00|131 |352 |
|2019-01-29T15:24:02+00|134 |376 |
|2019-01-29T15:24:02+00|69 |436 |
|2019-01-29T15:20:24+00|472 |935 |
|2019-01-29T15:24:06+00|138 |330 |
|2019-01-29T15:24:06+00|415 |749 |
|2019-01-29T15:29:02+00|45 |350 |
|2019-01-29T15:20:19+00|511 |710 |
+----------------------+-----------+------+
结果可能是这样的:
+----------+----------------------+
|Wind_speed|Forecast_Time |
+----------+----------------------+
|22 |2019-01-29T15:24:02+00|
|17 |2019-01-29T15:20:01+00|
|17 |2019-01-29T15:24:00+00|
|11 |2019-01-29T15:29:06+00|
|10 |2019-01-29T15:20:00+00|
+----------+----------------------+
如果您知道如何在pandas中实现,那么只需创建函数并使用pandas\u udf
相关问题 更多 >
编程相关推荐