Skip to content

固定效应模型教程

回归分析

说明 STATAU 中个体、时间与多维固定效应的填写方式,以及 `reghdfe` 风格的 Stata 对照。

常用 Stata 命令reghdfe y x controls, absorb(id year) cluster(id)
在 STATAU 中打开此功能
固定效应reghdfe双向固定效应

这个页面解决什么问题

固定效应最适合回答这样的问题:同一家企业、同一个城市或同一个人,在时间推移中发生变化时,核心解释变量的变化和结果变量的变化有没有一起动。它会把“不同主体天生不一样”这部分差异先吸收掉,所以特别适合面板数据。

一图看懂

STATAU 固定效应配置页真实截图STATAU 固定效应配置页真实截图
固定效应配置页先看哪里

固定效应页先确认谁是个体 ID、谁是时间 ID,再勾选要吸收的固定效应维度;第一次不要把所有维度都勾上。

固定效应原理示意图
固定效应到底在控制什么

把企业自身长期不变的差异先吸收掉,再比较同一家企业在不同年份里的变化,这就是固定效应最核心的识别思路。

方法原理

固定效应会先扣掉每个主体自身不变的平均特征,再看主体内部随时间变化的部分。对用户来说,最重要的理解是:它不再拿“甲企业和乙企业谁更高”做比较,而是看“同一家企业前后怎么变”。

核心公式

双向固定效应常见写法

yit=βxit+γcontrolsit+αi+λt+εit

αi 表示个体固定效应,λt 表示时间固定效应。页面里勾选的“固定效应变量”,本质上就是在决定这两部分要不要进模型。

适用数据与前提

至少先想清楚两列:谁、什么时候。也就是个体 ID 和时间 ID。只要这两列没设稳,固定效应结果就很容易解释跑偏。即使你目前只想吸收其中一个维度,也建议先把面板结构完整设好。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
因变量 (Y)被解释变量政策结果、绩效、产出等因变量。
自变量 (X)核心解释变量随时间变化的核心自变量。
控制变量其他控制变量与核心变量一同进入回归。
个体ID / 时间ID面板结构字段例如企业代码、年份。
固定效应变量 (多选)要吸收的维度例如企业、年份、行业。
聚类变量聚类标准误维度通常选个体维度或地区维度。

Stata 等效代码

reghdfe [被解释变量] [解释变量] [控制变量], absorb([固定效应]) cluster([聚类变量])
Stata 代码位置STATAU 网站对应位置应放入什么
[被解释变量]因变量 (Y)固定效应回归中的因变量。
[解释变量]自变量 (X)核心解释变量。
[控制变量]控制变量控制变量列表。
absorb([固定效应])固定效应变量 (多选)要吸收的个体、年份或其他维度。
cluster([聚类变量])聚类变量仅在聚类标准误时填写。
可删除代码段提示
  • 如果不需要聚类标准误,删除整个 `cluster([聚类变量])` 片段。
  • 如果只吸收年份固定效应,`absorb()` 里只保留年份变量。

在 STATAU 中操作步骤

  1. 先设置个体 ID 和时间 ID。
  2. 勾选要吸收的固定效应维度,例如企业和年份。
  3. 根据研究设计选择稳健或聚类标准误。
  4. 运行后重点核对核心变量系数与固定效应设定是否一致。

结果怎么看

  • 固定效应结果主要利用个体内部随时间变化的信息,解释时应围绕“同一主体的变化”展开。
  • 若核心变量几乎不随时间变化,固定效应模型可能会得到不稳定甚至被吸收掉的结果。
  • 聚类标准误通常建议按个体或政策实施层级聚类。
论文表述示例
  • 可以写成:“在控制企业和年份固定效应后,核心解释变量的系数仍然显著为正。”

常见使用误区

  • 把不随时间变化的解释变量放进双向固定效应模型时,可能直接被吸收。
  • 固定效应维度勾选过多会增加计算负担,也会改变识别来源。