替换空Pandas的中值

Organization Days_of_Reservations Profission or3 4 Doctor 0r3 Nan Doctor or2 2 Teacher or1 3 Teacher or5 Nan Dentist

2条回答

网友

1楼 · 编辑于 2024-05-15 21:13:59

假设每个非NaN条目只需要第一个字符：

import numpy as np

df['Room'] = np.where(df[0].notnull(), df[0].astype(str).str[0], np.nan)

参见：^{} documentation

网友

2楼 · 编辑于 2024-05-15 21:13:59

在您的第一个数据帧中，Reservation列应该已经是一个对象，因此在删除nan之后，您应该能够像这样获得第一个非nan字符：

df['Room'] = df['Reservation'].dropna().str.get(0)

你的第二个问题。您正在反向使用groupby。分组列放在groupby方法中，聚合列放在外部，如下所示。在

^{pr2}$

然后可以使用以下内容填充缺少的值

df.set_index(['Organization', 'Profission'])['Days_of_Reservations'].fillna(med)

编辑：根据您的评论，请使用以下代码进行测试

# create data for first question
df = pd.DataFrame({'Reservation': [np.nan, np.nan, 'B57 B59 B63 B66']})

# get first letter of non na
df['Room'] = df['Reservation'].dropna().str.get(0)
print(df)

输出

       Reservation Room
0              NaN  NaN
1              NaN  NaN
2  B57 B59 B63 B66    B

第二个问题

测试此代码

s=''' Organization    Days_of_Reservations     Profission
    or3               4                   Doctor
    or3               Nan                 Doctor
    or2               2                   Teacher
    or1               3                   Teacher
    or1               Nan                 Dentist
'''
df = pd.read_csv(StringIO.StringIO(s), sep='\s+')
df['Days_of_Reservations'] = df.Days_of_Reservations.astype(float)
med = df.groupby(['Organization', 'Profission'])['Days_of_Reservations'].median()
df.set_index(['Organization', 'Profission'])['Days_of_Reservations'].fillna(med).reset_index()

输出

  Organization Profission  Days_of_Reservations
0          or3     Doctor                     4
1          or3     Doctor                     4
2          or2    Teacher                     2
3          or1    Teacher                     3
4          or1    Dentist                   NaN

第二个问题

相关问题更多 >

编程相关推荐

热门问题

热门文章

替换空Pandas的中值

第二个问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >