下面有一个代码,它在数据框的每一列中创建一个缺失值的汇总表。我希望我可以构建一个类似的表来计算唯一值,但是DataFrame没有unique()方法,只有每列独立。在
def missing_values_table(df):
mis_val = df.isnull().sum()
mis_val_percent = 100 * df.isnull().sum()/len(df)
mis_val_table = pd.concat([mis_val, mis_val_percent], axis=1)
mis_val_table_ren_columns = mis_val_table.rename(
columns = {0 : 'Missing Values', 1 : '% of Total Values'})
return mis_val_table_ren_columns
(来源:https://stackoverflow.com/a/39734251/7044473)
对于唯一值,如何实现相同的目标?在
您可以使用
pd.unique
函数创建一系列唯一的值计数。例如:如果您确实希望每个值在每列中出现的次数,可以使用
^{pr2}$pd.value_counts
执行类似的操作:这并不是您所要求的,但可能对您的分析有用。在
^{pr2}$但是,您总是可以直接返回分集系列,并且只会获得计数。在
相关问题 更多 >
编程相关推荐