Skip to content

混合效应模型(Pooled OLS)教程

回归分析

说明 STATAU 当前“混合效应模型”入口更接近 pooled OLS,用来作为面板模型的基准比较表。

常用 Stata 命令xtset id time reg y x controls, robust
在 STATAU 中打开此功能
混合效应模型pooled OLS面板基准回归模型对照

这个页面解决什么问题

在 STATAU 当前版本里,这个入口最适合把它理解成“面板数据上的基准回归表”,也就是不吸收固定效应、不做随机效应假设修正,先把所有观测直接放在一起估计一张 pooled OLS 表。它的最大价值,不是最终一定要拿来当主结论,而是给后面的固定效应、随机效应和 Hausman 比较提供一个清晰起点。

方法原理

Pooled OLS 会把不同主体、不同年份的观测直接合在一起估计,因此它不会自动控制个体长期不变差异。好处是结果直观、试跑快;代价是如果主体异质性很强,系数容易混入组间差异。

适用数据与前提

虽然页面里仍要求你设置个体 ID 和时间 ID,但这一步更多是为了和后续 FE / RE 保持同一套面板结构,方便你做模型对照,而不是因为 pooled OLS 本身会吸收这些维度。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
因变量 (Y)被解释变量与你后续 FE / RE 对照时保持一致。
自变量 (X)核心解释变量先建立最基础的方向和量级判断。
控制变量其他控制变量建议和后续面板模型保持同一组控制变量。
个体ID / 时间ID面板结构字段主要用于与 FE / RE 页面保持一致的面板口径。
标准误计算方式IID / Robust / Cluster第一次试跑通常先看稳健标准误。

Stata 等效代码

xtset [个体ID] [时间ID]
reg [被解释变量] [解释变量] [控制变量], robust
Stata 代码位置STATAU 网站对应位置应放入什么
xtset [个体ID] [时间ID]个体ID / 时间ID让你后面能直接切到 FE / RE 做同口径比较。
[被解释变量]因变量 (Y)面板基准回归里的结果变量。
[解释变量] [控制变量]自变量 (X) + 控制变量保持和后续 FE / RE 一致,便于横向比对。
robust标准误计算方式对应页面里的稳健标准误选项。
可删除代码段提示
  • 如果你只想先看最基础结果,可先不使用聚类标准误。
  • 如果当前并不打算和 FE / RE 做对照,个体 ID 和时间 ID 仍建议填好,避免后面切模型时重新返工。

在 STATAU 中操作步骤

  1. 先把因变量、自变量和控制变量按与你计划中的 FE / RE 模型相同的口径填好。
  2. 设置个体 ID 和时间 ID,确保后面切换模型时样本结构保持一致。
  3. 先用稳健标准误跑出第一张 pooled 表,再决定是否继续切到固定效应或随机效应。
  4. 如果 pooled、FE、RE 三张表方向差异很大,不要急着下结论,先回头检查模型设定和数据口径。

结果怎么看

  • 这张表最适合做“基准表”或“对照表”,先看核心变量方向和量级,再和 FE / RE 结果比较。
  • 如果 pooled 结果和 FE 结果差异很大,往往说明个体异质性不能忽略。
  • 如果 pooled、RE 很接近而 FE 差别明显,后续通常要结合 Hausman 检验一起判断。
论文表述示例
  • 可以写成:“表 1 先报告 pooled OLS 基准结果,随后进一步引入固定效应和随机效应模型进行稳健比较。”

常见使用误区

  • 不要因为 pooled 表最先跑出来,就直接把它当成最终主结论。
  • 如果你的研究对象本身有很强的主体异质性,pooled OLS 往往会把组间差异混进系数里。