外观
混合效应模型(Pooled OLS)教程
说明 STATAU 当前“混合效应模型”入口更接近 pooled OLS,用来作为面板模型的基准比较表。
常用 Stata 命令
xtset id time
reg y x controls, robust 在 STATAU 中打开此功能
混合效应模型pooled OLS面板基准回归模型对照
这个页面解决什么问题
在 STATAU 当前版本里,这个入口最适合把它理解成“面板数据上的基准回归表”,也就是不吸收固定效应、不做随机效应假设修正,先把所有观测直接放在一起估计一张 pooled OLS 表。它的最大价值,不是最终一定要拿来当主结论,而是给后面的固定效应、随机效应和 Hausman 比较提供一个清晰起点。
方法原理
Pooled OLS 会把不同主体、不同年份的观测直接合在一起估计,因此它不会自动控制个体长期不变差异。好处是结果直观、试跑快;代价是如果主体异质性很强,系数容易混入组间差异。
适用数据与前提
虽然页面里仍要求你设置个体 ID 和时间 ID,但这一步更多是为了和后续 FE / RE 保持同一套面板结构,方便你做模型对照,而不是因为 pooled OLS 本身会吸收这些维度。
STATAU 页面中每个位置应该放什么变量
| 网站位置 | 应放入的变量 | 说明 |
|---|---|---|
| 因变量 (Y) | 被解释变量 | 与你后续 FE / RE 对照时保持一致。 |
| 自变量 (X) | 核心解释变量 | 先建立最基础的方向和量级判断。 |
| 控制变量 | 其他控制变量 | 建议和后续面板模型保持同一组控制变量。 |
| 个体ID / 时间ID | 面板结构字段 | 主要用于与 FE / RE 页面保持一致的面板口径。 |
| 标准误计算方式 | IID / Robust / Cluster | 第一次试跑通常先看稳健标准误。 |
Stata 等效代码
xtset [个体ID] [时间ID]
reg [被解释变量] [解释变量] [控制变量], robust| Stata 代码位置 | STATAU 网站对应位置 | 应放入什么 |
|---|---|---|
xtset [个体ID] [时间ID] | 个体ID / 时间ID | 让你后面能直接切到 FE / RE 做同口径比较。 |
[被解释变量] | 因变量 (Y) | 面板基准回归里的结果变量。 |
[解释变量] [控制变量] | 自变量 (X) + 控制变量 | 保持和后续 FE / RE 一致,便于横向比对。 |
robust | 标准误计算方式 | 对应页面里的稳健标准误选项。 |
可删除代码段提示
- 如果你只想先看最基础结果,可先不使用聚类标准误。
- 如果当前并不打算和 FE / RE 做对照,个体 ID 和时间 ID 仍建议填好,避免后面切模型时重新返工。
在 STATAU 中操作步骤
- 先把因变量、自变量和控制变量按与你计划中的 FE / RE 模型相同的口径填好。
- 设置个体 ID 和时间 ID,确保后面切换模型时样本结构保持一致。
- 先用稳健标准误跑出第一张 pooled 表,再决定是否继续切到固定效应或随机效应。
- 如果 pooled、FE、RE 三张表方向差异很大,不要急着下结论,先回头检查模型设定和数据口径。
结果怎么看
- 这张表最适合做“基准表”或“对照表”,先看核心变量方向和量级,再和 FE / RE 结果比较。
- 如果 pooled 结果和 FE 结果差异很大,往往说明个体异质性不能忽略。
- 如果 pooled、RE 很接近而 FE 差别明显,后续通常要结合 Hausman 检验一起判断。
论文表述示例
- 可以写成:“表 1 先报告 pooled OLS 基准结果,随后进一步引入固定效应和随机效应模型进行稳健比较。”
常见使用误区
- 不要因为 pooled 表最先跑出来,就直接把它当成最终主结论。
- 如果你的研究对象本身有很强的主体异质性,pooled OLS 往往会把组间差异混进系数里。