如何使用np.where从数据帧分配值

sum_d = source.groupby('Country')['Deaths'].sum() sum_c = source.groupby('Country')['Confirmed'].sum() Deaths = pd.DataFrame(sum_d) Confirmed = pd.DataFrame(sum_c) frames = [Deaths, Confirmed] Grouped = pd.concat(frames, axis=1) Grouped.loc[:,'Mortality Rate Country'] = Grouped['Deaths']/Grouped['Confirmed']

Grouped.head() Deaths Confirmed Mortality Rate Country Country Afghanistan 1 40 0.025000 Albania 2 89 0.022472 Algeria 17 201 0.084577 Andorra 1 113 0.008850 Angola 0 2 0.000000 source.head() Country Last Update Confirmed Deaths Recovered Province/State Hubei China 2020-03-22 09:43:06 67800 3144 59433 NaN Italy 2020-03-22 18:13:20 59138 5476 7024 NaN Spain 2020-03-22 23:13:18 28768 1772 2575 NaN Germany 2020-03-22 23:43:02 24873 94 266 NaN Iran 2020-03-22 14:13:06 21638 1685 7931

source['Mortality Rate Country'] = np.where(source['Country'] == Grouped['Country'], Grouped['Mortality Rate Country'], source['Mortality Rate'])

1条回答

网友

1楼 · 发布于 2024-04-25 22:35:06

如果有独特的国家：

source['Mortality Rate Country'] = source['Deaths']/source['Confirmed']

如果存在重复的国家/地区：

对于原始数据中由聚合值填充的新列，您的代码应简化为^{}：

source['Deaths1'] = source.groupby('Country')['Deaths'].transform('sum') 
source['Confirmed1'] = source.groupby('Country')['Confirmed'].transform('sum') 

source['Mortality Rate Country'] = source['Deaths1']/source['Confirmed1']

相关问题更多 >

编程相关推荐

热门问题

热门文章