外观
熵值法教程
讲清楚指标方向、缺失值策略和熵值法得分写回逻辑,帮助你生成综合指标得分。
常用 Stata 命令
egen / 自定义加权流程 在 STATAU 中打开此功能
熵值法综合指标客观赋权
这个页面解决什么问题
熵值法适合在多个指标之间客观赋权,生成一个综合得分。STATAU 的重点不是让你手工写出整套标准化和加权代码,而是把“指标方向”“缺失值策略”“得分命名”这些最容易出错的输入集中到一个卡片里。
适用数据与前提
所有指标应尽量在同一批样本上观测到;如果存在正向与负向指标,需要先在页面里逐个确认方向。缺失值较多时要提前决定是删样本还是均值填充。
STATAU 页面中每个位置应该放什么变量
| 网站位置 | 应放入的变量 | 说明 |
|---|---|---|
| 指标变量 | 参与综合得分的原始指标 | 通常是一组同属一个维度或多个维度的数值变量。 |
| 方向设置 | 正向 / 负向 | 用于统一指标方向,避免得分解释相反。 |
| 新变量名 | 综合得分列名 | 默认会写回 `entropy_score`。 |
| 缺失值策略 | 删除样本 / 均值填充 | 决定缺失指标对最终得分的影响。 |
Stata 等效代码
* Stata 没有单一官方熵值法命令,通常按以下流程手工实现
* 1. 统一指标方向
* 2. 标准化指标
* 3. 计算比重、熵值与冗余度
* 4. 计算权重并生成综合得分| Stata 代码位置 | STATAU 网站对应位置 | 应放入什么 |
|---|---|---|
统一指标方向 | 方向设置 | 把成本型指标设为负向,其余设为正向。 |
标准化与权重计算 | 生成熵值法得分 | 点击按钮后由后端按熵值法流程完成。 |
在 STATAU 中操作步骤
- 勾选参与熵值法的指标变量。
- 逐个确认每个指标是正向还是负向。
- 设置得分列名和缺失值策略后,执行熵值法。
- 生成后查看权重与得分分布,再决定是否同步到分析页。
结果怎么看
- 首先看每个指标的权重是否符合研究直觉,避免某个异常指标权重过高。
- 再看得分分布是否过于集中或极端离散,这通常反映指标标准化或缺失处理策略有问题。
- 如果后续要做回归,建议把综合得分和原始指标的描述性统计一起留档。
论文表述示例
- 可以写成:“按照熵值法对各指标客观赋权后,构造综合得分变量用于后续回归分析。”
常见使用误区
- 负向指标方向设反,会直接导致得分含义反过来。
- 均值填充虽然保留样本量,但可能弱化真实离散度,需在论文里说明。
- 熵值法不是因果识别工具,只是综合指标构造方法。