我有一个类似这样的数据帧:
+---------+---------+
| Value A | Value B |
+---------+---------+
| 10 | 1 |
| 20 | 2 |
| 30 | 3 |
| 40 | 4 |
| 50 | 5 |
| 60 | NaN |
| 70 | NaN |
| 80 | NaN |
| 90 | NaN |
| 100 | NaN |
+---------+---------+
我想用之前的值来填充这些缺失的值,但是像下面所示的那样移动。你知道吗
+---------+---------+
| Value A | Value B |
+---------+---------+
| 10 | 1 |
| 20 | 1 |
| 30 | 2 |
| 40 | 2 |
| 50 | 3 |
| 60 | 3 |
| 70 | 4 |
| 80 | 4 |
| 90 | 5 |
| 100 | 5 |
+---------+---------+
问题是,我发现这些缺少的值可能在任一列中。我试着手工做,但那要花很多时间。填充值也依赖于A列的len()
。我的方法是这样的:
missing_data_len = len(valueA)-len(valueB)
df['ValueB'].shift(missing_data_len)
然后用ffill
填写NaN vlaues。但结果并不准确。有没有更好的方法来解决这个问题。你知道吗
用途:
相关问题 更多 >
编程相关推荐