如何创建一个新列，将前5行和其余的行合并为杂项？

In[]: car_sales['car'].unique() Out[]: array(['Ford', 'Mercedes-Benz', 'Nissan', 'Honda', 'Renault', 'BMW', 'Land Rover', 'Volkswagen', 'Audi', 'Chrysler', 'Jaguar', 'Mitsubishi', 'Kia', 'Porsche', 'Toyota', 'Hyundai'], dtype=object)

2条回答

网友
1楼 · 编辑于 2024-05-14 05:55:05

您可以使用^{}来处理这些类型的问题categorical类型还有一个额外的好处，就是内存效率更高
示例：
cars = ['Ford', 'Mercedes-Benz', 'Nissan', 'Honda', 'Renault', 'BMW', 'Land Rover', 'Volkswagen', 'Audi', 'Chrysler', 'Jaguar', 'Mitsubishi', 'Kia', 'Porsche', 'Toyota', 'Hyundai'] df = pd.DataFrame({'cars': np.random.choice(cars, 100)}) top_5 = ['Ford', 'Mercedes-Benz', 'Nissan', 'Audi', 'Jaguar', 'Miscellaneous'] df['cars_refined'] = pd.Categorical(df['cars'], categories=top_5).fillna('Miscellaneous') print(df.head(10)) cars cars_refined 0 Mercedes-Benz Mercedes-Benz 1 Mercedes-Benz Mercedes-Benz 2 Volkswagen Miscellaneous 3 Ford Ford 4 Mitsubishi Miscellaneous 5 Toyota Miscellaneous 6 Porsche Miscellaneous 7 Honda Miscellaneous 8 Kia Miscellaneous 9 Jaguar Jaguar

网友
2楼 · 编辑于 2024-05-14 05:55:05

我不完全确定我理解你在做什么，但我猜你可以这样做：
[x for x in car_sales['car'] if x not in my_dict['Miscellaneous']] + ['Miscellaneous']
假设my_dict定义如下（注意dict中的值是一个集合）：
my_dict = {'Miscellaneous': {'Nissan', 'Honda', 'Renault', 'BMW', 'Land Rover', 'Volkswagen', 'Audi', 'Chrysler', 'Jaguar'}}
所以您可以有这样的结果（我假设您使用的是numpy，并且希望结果是numpy数组）：
new_array = np.array([x for x in car_sales['car'] if x not in my_dict['misc']] + ['Miscellaneous'])
我希望这有帮助

示例：

相关问题更多 >

编程相关推荐

热门问题

热门文章