如何用另一列的模式正确地填充这些NaN值？

def inpute_end_station(df): for index, row in df.iterrows(): if pd.isnull(df.loc[index, 'end_station']): start_st = df.loc[index, 'start_station'] mode = df.loc[df['start_station'] == start_st].end_station.mode() df.loc[index, 'end_station'].fillna(mode, inplace=True)

1条回答

网友

1楼 · 发布于 2024-04-19 13:01:41

在我看来，当您希望像这样迭代pandas中的列时，最佳实践是使用apply()函数。在

对于这种特殊情况，我建议使用以下方法，这在下面的示例数据中显示。我没有太多经验使用mode()方法，所以我使用value_counts()方法和first_valid_index()方法来确定模式值。在

# import pandas
import pandas as pd

# make a sample data
list_of_rows = [
  {'start_station': 1, 'end_station': 1},
  {'start_station': None, 'end_station': 1},
  {'start_station': 1, 'end_station': 2},
  {'start_station': 1, 'end_station': 3},
  {'start_station': 2, 'end_station': None},
  {'start_station': 2, 'end_station': 3},
  {'start_station': 2, 'end_station': 3},
]

# make a pandas data frame
df = pd.DataFrame(list_of_rows)

# define a function
def fill_NaNs_in_end_station(row):
    if pd.isnull(row['end_station']):
        start_station = row['start_station']
        return df[df['start_station']==start_station].end_station.value_counts().first_valid_index()
    return row['end_station']

# apply function to dataframe
df['end_station'] = df.apply(lambda row: fill_NaNs_in_end_station(row), axis=1)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何用另一列的模式正确地填充这些NaN值？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >