我在数据集中有两列,一列是国家,另一列是性别,性别有一些NaN或N/A值。在熊猫身上看起来是这样的:
import pandas as pd
Country = ['United Kingdom', 'Bosnia and Herzegovina', 'Thailand', 'United States', 'Ukraine', 'Canada', 'Ukraine', 'India', 'New Zealand', 'India', 'Antigua and Barbuda', 'Canada', 'United States', 'Germany', 'India', 'United Kingdom', 'Australia', 'Russian Federation', 'Brazil', 'Lithuania']
Gender = ['Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', nan, 'Man', 'Woman', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man']
我想在一个国家类别中,将缺失的价值标绘为所有性别价值的一个比例。我首先使用了groupby on Country专栏,该专栏只提供了一个国家内的性别总数,将缺失值绘制为一个国家内总性别值的比例的最佳方法是什么:
编辑:在评论中回答此问题,请查看解决方案,如果您认为解决方案可能更好,请在解决方案评论下进行评论
嗨,这里是我为它创建了一个解决方案
相关问题 更多 >
编程相关推荐