假设我有这样的数据帧:
Data: Lat Long Postal Code
0 41 32 01556
1 32 31 01023
2 31 33 01023
3 NaN NaN 01023
4 33 42 01775
5 40 44 01999
如您所见,第1、2、3行的邮政编码相同。因此,为了填充nan,最好只使用这两行(1,2)的平均值。
如何将其推广到大型数据集?你知道吗
- 对于NaN数据为Lat/Long的每一行,
- 查找具有相同邮政编码的其他行
- 然后计算平均值
- 并用它来代替NAN
Tags:
IIUC公司
groupby
,transform
,fillna()
我们首先选择数据帧的一个片段并使用
fillna
来只填充缺少的值,我们不想覆盖任何现有的数据。你知道吗然后,我们利用
groupby
函数根据您的请求按邮政编码分组。你知道吗我们使用
transform
方法返回数据及其原始索引和长度。你知道吗我们将其分配给您的列,结果如下。你知道吗
相关问题 更多 >
编程相关推荐