用平均值和中位数填充

2024-06-08 00:29:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我从python和数据科学开始,我有一个.csv文件,有5000多行。 我想用数据科学家的均值和数据工程师的中值来代替Exerience NaN值。我怎样才能把这个分组并使用fillna。 enter image description here

每次尝试将fillna与mean()一起使用时,都会出现以下错误:

TypeError: can only concatenate str (not "int") to str NaN


Tags: 文件csv数据错误科学nanmeancan
1条回答
网友
1楼 · 发布于 2024-06-08 00:29:16

假设这个表在Pandas中加载到一个名为df的变量中。
假设你说meanmedian是指Experience列。你知道吗

df.loc[
    (df["Metier"] == "Data scientist") & (df["Experience"].isnull()), "Experience"
] = df["Experience"].mean()

df.loc[
    (df["Metier"] == "Data engineer") & (df["Experience"].isnull()), "Experience"
] = df["Experience"].median()

相关问题 更多 >

    热门问题