Skip to content

熵值法教程

数据处理

讲清楚指标方向、缺失值策略和熵值法得分写回逻辑,帮助你生成综合指标得分。

常用 Stata 命令egen / 自定义加权流程
在 STATAU 中打开此功能
熵值法综合指标客观赋权

这个页面解决什么问题

熵值法适合在多个指标之间客观赋权,生成一个综合得分。STATAU 的重点不是让你手工写出整套标准化和加权代码,而是把“指标方向”“缺失值策略”“得分命名”这些最容易出错的输入集中到一个卡片里。

适用数据与前提

所有指标应尽量在同一批样本上观测到;如果存在正向与负向指标,需要先在页面里逐个确认方向。缺失值较多时要提前决定是删样本还是均值填充。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
指标变量参与综合得分的原始指标通常是一组同属一个维度或多个维度的数值变量。
方向设置正向 / 负向用于统一指标方向,避免得分解释相反。
新变量名综合得分列名默认会写回 `entropy_score`。
缺失值策略删除样本 / 均值填充决定缺失指标对最终得分的影响。

Stata 等效代码

* Stata 没有单一官方熵值法命令,通常按以下流程手工实现
* 1. 统一指标方向
* 2. 标准化指标
* 3. 计算比重、熵值与冗余度
* 4. 计算权重并生成综合得分
Stata 代码位置STATAU 网站对应位置应放入什么
统一指标方向方向设置把成本型指标设为负向,其余设为正向。
标准化与权重计算生成熵值法得分点击按钮后由后端按熵值法流程完成。

在 STATAU 中操作步骤

  1. 勾选参与熵值法的指标变量。
  2. 逐个确认每个指标是正向还是负向。
  3. 设置得分列名和缺失值策略后,执行熵值法。
  4. 生成后查看权重与得分分布,再决定是否同步到分析页。

结果怎么看

  • 首先看每个指标的权重是否符合研究直觉,避免某个异常指标权重过高。
  • 再看得分分布是否过于集中或极端离散,这通常反映指标标准化或缺失处理策略有问题。
  • 如果后续要做回归,建议把综合得分和原始指标的描述性统计一起留档。
论文表述示例
  • 可以写成:“按照熵值法对各指标客观赋权后,构造综合得分变量用于后续回归分析。”

常见使用误区

  • 负向指标方向设反,会直接导致得分含义反过来。
  • 均值填充虽然保留样本量,但可能弱化真实离散度,需在论文里说明。
  • 熵值法不是因果识别工具,只是综合指标构造方法。

相关页面