固定效应模型教程

回归分析

说明 STATAU 中个体、时间与多维固定效应的填写方式，以及 `reghdfe` 风格的 Stata 对照。

常用 Stata 命令reghdfe y x controls, absorb(id year) cluster(id)

在 STATAU 中打开此功能

固定效应reghdfe双向固定效应

这个页面解决什么问题

固定效应最适合回答这样的问题：同一家企业、同一个城市或同一个人，在时间推移中发生变化时，核心解释变量的变化和结果变量的变化有没有一起动。它会把“不同主体天生不一样”这部分差异先吸收掉，所以特别适合面板数据。

一图看懂

STATAU 固定效应配置页真实截图 — **固定效应配置页先看哪里**
固定效应页先确认谁是个体 ID、谁是时间 ID，再勾选要吸收的固定效应维度；第一次不要把所有维度都勾上。

固定效应原理示意图 — **固定效应到底在控制什么**
把企业自身长期不变的差异先吸收掉，再比较同一家企业在不同年份里的变化，这就是固定效应最核心的识别思路。

方法原理

固定效应会先扣掉每个主体自身不变的平均特征，再看主体内部随时间变化的部分。对用户来说，最重要的理解是：它不再拿“甲企业和乙企业谁更高”做比较，而是看“同一家企业前后怎么变”。

核心公式

双向固定效应常见写法

y_{i t} = β x_{i t} + γ c o n t r o l s_{i t} + α_{i} + λ_{t} + ε_{i t}

$α_{i}$ 表示个体固定效应， $λ_{t}$ 表示时间固定效应。页面里勾选的“固定效应变量”，本质上就是在决定这两部分要不要进模型。

适用数据与前提

至少先想清楚两列：谁、什么时候。也就是个体 ID 和时间 ID。只要这两列没设稳，固定效应结果就很容易解释跑偏。即使你目前只想吸收其中一个维度，也建议先把面板结构完整设好。

STATAU 页面中每个位置应该放什么变量

网站位置	应放入的变量	说明
因变量 (Y)	被解释变量	政策结果、绩效、产出等因变量。
自变量 (X)	核心解释变量	随时间变化的核心自变量。
控制变量	其他控制变量	与核心变量一同进入回归。
个体ID / 时间ID	面板结构字段	例如企业代码、年份。
固定效应变量 (多选)	要吸收的维度	例如企业、年份、行业。
聚类变量	聚类标准误维度	通常选个体维度或地区维度。

Stata 等效代码

reghdfe [被解释变量] [解释变量] [控制变量], absorb([固定效应]) cluster([聚类变量])

Stata 代码位置	STATAU 网站对应位置	应放入什么
`[被解释变量]`	因变量 (Y)	固定效应回归中的因变量。
`[解释变量]`	自变量 (X)	核心解释变量。
`[控制变量]`	控制变量	控制变量列表。
`absorb([固定效应])`	固定效应变量 (多选)	要吸收的个体、年份或其他维度。
`cluster([聚类变量])`	聚类变量	仅在聚类标准误时填写。

可删除代码段提示

如果不需要聚类标准误，删除整个 `cluster([聚类变量])` 片段。
如果只吸收年份固定效应，`absorb()` 里只保留年份变量。

在 STATAU 中操作步骤

先设置个体 ID 和时间 ID。
勾选要吸收的固定效应维度，例如企业和年份。
根据研究设计选择稳健或聚类标准误。
运行后重点核对核心变量系数与固定效应设定是否一致。

结果怎么看

固定效应结果主要利用个体内部随时间变化的信息，解释时应围绕“同一主体的变化”展开。
若核心变量几乎不随时间变化，固定效应模型可能会得到不稳定甚至被吸收掉的结果。
聚类标准误通常建议按个体或政策实施层级聚类。

论文表述示例

可以写成：“在控制企业和年份固定效应后，核心解释变量的系数仍然显著为正。”

常见使用误区

把不随时间变化的解释变量放进双向固定效应模型时，可能直接被吸收。
固定效应维度勾选过多会增加计算负担，也会改变识别来源。

固定效应模型教程 ​

这个页面解决什么问题 ​

一图看懂 ​

方法原理 ​

核心公式 ​

双向固定效应常见写法 ​

适用数据与前提 ​

STATAU 页面中每个位置应该放什么变量 ​

Stata 等效代码 ​

在 STATAU 中操作步骤 ​

结果怎么看 ​

常见使用误区 ​