我如何使用多个自变量的多个Z分数得出0100综合或指数分数?

2024-04-16 08:54:08 发布

您现在位置:Python中文网/ 问答频道 /正文

我对指数分数很感兴趣,比如human development indexeconomic freedom index,他们根据一系列不同的变量(如新闻自由、产权等)按0-100的等级对事物进行排序。我想用Python笔记本中多个列的z分数来实现这一点

我可以使用scipy计算Z分数:

from scipy.stats import zscore
no_income_data_important_columns_only.apply(zscore)

比如:enter image description here我知道这些z-分数告诉我这些值相对于平均值有多高或多低。但现在我想能够理解所有度量值/列中每行的高低

我真的不知道如何处理所有的Z分数来计算指数或综合分数(在0到100的范围内)。我是将它们相乘还是相加,还是做一些其他的事情来聚合它们


Tags: fromindex排序笔记本scipy指数分数事物
1条回答
网友
1楼 · 发布于 2024-04-16 08:54:08

这仍然存在您先前发布的致命概念缺陷。但是,您现在已经足够清楚地描述了问题,以解决该问题

Z分数只是一个标准化数据的工具:将各种范围和偏差放在一个类似的尺度上,以便于real处理步骤。它不能解决你的核心问题:什么是重要的

每一个这样的“索引”仅仅是一个研究团队关于什么是重要的,功能如何相互作用等的意见。你的帖子本质上要求我们盲目地确定什么对阅读你的索引报告的人是重要的。这显然行不通

您必须确定这些物品的重量。请注意,您的Z分数只是每个特征的线性刻度。这是否与某人内心的自由感呈线性相关?如果一个实体控制和审查所有媒体,是否会减少其他因素的影响?100%的财产自由和没有新闻自由与50%的自由相比如何

在你决定这些因素如何相互影响,以及它们如何与你的读者的感受相关联之前,你没有足够的组织能力来解决你提出的问题。 您试图将多维测量简化为线性度量。要有一个可重用的算法,您首先必须有一个可复制的上下文[对Ralph E.Johnson在“设计模式”中的解释]。这不是一个可复制的上下文,您还没有研究您的特定用例

相关问题 更多 >