Skip to content

运行第一个回归

快速入门

用最短路径跑通一次 OLS 回归,理解因变量、自变量、控制变量与稳健标准误的基本填法。

常用 Stata 命令reg y x controls, robust
在 STATAU 中打开此功能
第一个回归OLS 教程稳健标准误reg robust

这个页面解决什么问题

这页只做一件事:让你第一次就把回归跑出来。你现在不用先懂很多回归术语,只要记住 4 个位置就够了:因变量、1 个核心自变量、控制变量、标准误。先把整条链路跑通,后面再慢慢升级模型。

一图看懂

STATAU OLS 配置页面截图STATAU OLS 配置页面截图
第一次跑回归先看这 4 个位置

第一次跑回归先只管 4 个位置:因变量、1 个核心自变量、控制变量、标准误;其他展示项先保持默认就够了。

第一个回归流程图
第一张回归表的最小闭环

先确认数据,再填 Y、X、控制变量,最后看系数方向和显著性,先把整条链路跑通。

核心公式

你现在估计的是哪条关系

yi=β0+β1xi+γcontrolsi+εi

不用死记公式。你只要把它理解成“结果变量 = 核心解释变量 + 其他控制因素 + 还没解释掉的部分”。页面里的因变量、自变量和控制变量,就是在分别填写这三块。

适用数据与前提

先准备一份结构化数据,并确保至少有一个结果变量、一个核心解释变量和若干控制变量。第一次试跑尽量都用数值型变量,先别急着把固定效应、聚类、很多展示项一次性全打开。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
因变量 (Y)被解释变量论文里你要解释的结果变量,例如绩效、收入、产出。
自变量 (X)核心解释变量你最关心的影响因素,可以选择一个或多个。
控制变量其他影响因变量的变量用于降低遗漏变量偏误,支持勾选和手动补充。
标准误计算方式IID / Robust / Cluster第一次试用通常先选稳健标准误。

Stata 等效代码

reg [因变量] [自变量] [控制变量], robust
Stata 代码位置STATAU 网站对应位置应放入什么
[因变量]因变量 (Y)被解释变量,例如企业绩效、就业率、销量。
[自变量]自变量 (X)核心解释变量,例如政策变量、投入强度、处理变量。
[控制变量]控制变量控制变量列表,支持面板右侧勾选或手动输入。
robust标准误计算方式选择“稳健标准误 (Robust)”。
可删除代码段提示
  • 如果你只想看最基础的普通标准误,把 `, robust` 整段去掉即可。
  • 如果当前没有控制变量,可以先不放 `[控制变量]`,但结果解读时要说明是简化模型。

在 STATAU 中操作步骤

  1. 进入“数据分析”页,确认数据已经上传成功。
  2. 第一次先只管 4 个位置:因变量、1 个核心自变量、控制变量、标准误。
  3. 在左侧选择“OLS 回归”,依次填写因变量、自变量和控制变量。
  4. 把标准误计算方式切到“稳健标准误 (Robust)”,其余展示项先保留默认值。
  5. 点击“开始新分析”,等结果表生成后,再用“查看原始输出”核对模型摘要。

结果怎么看

  • 先看核心解释变量系数是正还是负,它告诉你方向大致往哪边走。
  • 再看有没有显著性标记或星号,先判断这个关系是不是足够稳定。
  • 最后看样本量是不是异常少;如果样本突然掉很多,通常要回头检查缺失值或筛选条件。
  • 如果结果表为空或报错,先返回配置区检查因变量是不是数值型、有没有误选文本字段。
论文表述示例
  • 可以写成:“在采用稳健标准误的 OLS 设定下,核心解释变量系数为正且达到 5% 显著水平。”
  • 不要直接写“显著所以存在因果关系”,除非你已经完成因果识别或稳健性检验。

常见使用误区

  • 第一次试跑不要一上来就同时加固定效应、聚类和很多控制变量,否则排错成本会很高。
  • 手动输入控制变量时要用空格或逗号分隔,避免和变量原名混在一起。
  • 如果同一个变量既在“自变量 (X)”又在“控制变量”里出现,会影响结果可读性。

相关页面