外观
运行第一个回归
用最短路径跑通一次 OLS 回归,理解因变量、自变量、控制变量与稳健标准误的基本填法。
常用 Stata 命令
reg y x controls, robust 在 STATAU 中打开此功能
第一个回归OLS 教程稳健标准误reg robust
这个页面解决什么问题
这页只做一件事:让你第一次就把回归跑出来。你现在不用先懂很多回归术语,只要记住 4 个位置就够了:因变量、1 个核心自变量、控制变量、标准误。先把整条链路跑通,后面再慢慢升级模型。
一图看懂


第一次跑回归先只管 4 个位置:因变量、1 个核心自变量、控制变量、标准误;其他展示项先保持默认就够了。
先确认数据,再填 Y、X、控制变量,最后看系数方向和显著性,先把整条链路跑通。
核心公式
你现在估计的是哪条关系
不用死记公式。你只要把它理解成“结果变量 = 核心解释变量 + 其他控制因素 + 还没解释掉的部分”。页面里的因变量、自变量和控制变量,就是在分别填写这三块。
适用数据与前提
先准备一份结构化数据,并确保至少有一个结果变量、一个核心解释变量和若干控制变量。第一次试跑尽量都用数值型变量,先别急着把固定效应、聚类、很多展示项一次性全打开。
STATAU 页面中每个位置应该放什么变量
| 网站位置 | 应放入的变量 | 说明 |
|---|---|---|
| 因变量 (Y) | 被解释变量 | 论文里你要解释的结果变量,例如绩效、收入、产出。 |
| 自变量 (X) | 核心解释变量 | 你最关心的影响因素,可以选择一个或多个。 |
| 控制变量 | 其他影响因变量的变量 | 用于降低遗漏变量偏误,支持勾选和手动补充。 |
| 标准误计算方式 | IID / Robust / Cluster | 第一次试用通常先选稳健标准误。 |
Stata 等效代码
reg [因变量] [自变量] [控制变量], robust| Stata 代码位置 | STATAU 网站对应位置 | 应放入什么 |
|---|---|---|
[因变量] | 因变量 (Y) | 被解释变量,例如企业绩效、就业率、销量。 |
[自变量] | 自变量 (X) | 核心解释变量,例如政策变量、投入强度、处理变量。 |
[控制变量] | 控制变量 | 控制变量列表,支持面板右侧勾选或手动输入。 |
robust | 标准误计算方式 | 选择“稳健标准误 (Robust)”。 |
可删除代码段提示
- 如果你只想看最基础的普通标准误,把 `, robust` 整段去掉即可。
- 如果当前没有控制变量,可以先不放 `[控制变量]`,但结果解读时要说明是简化模型。
在 STATAU 中操作步骤
- 进入“数据分析”页,确认数据已经上传成功。
- 第一次先只管 4 个位置:因变量、1 个核心自变量、控制变量、标准误。
- 在左侧选择“OLS 回归”,依次填写因变量、自变量和控制变量。
- 把标准误计算方式切到“稳健标准误 (Robust)”,其余展示项先保留默认值。
- 点击“开始新分析”,等结果表生成后,再用“查看原始输出”核对模型摘要。
结果怎么看
- 先看核心解释变量系数是正还是负,它告诉你方向大致往哪边走。
- 再看有没有显著性标记或星号,先判断这个关系是不是足够稳定。
- 最后看样本量是不是异常少;如果样本突然掉很多,通常要回头检查缺失值或筛选条件。
- 如果结果表为空或报错,先返回配置区检查因变量是不是数值型、有没有误选文本字段。
论文表述示例
- 可以写成:“在采用稳健标准误的 OLS 设定下,核心解释变量系数为正且达到 5% 显著水平。”
- 不要直接写“显著所以存在因果关系”,除非你已经完成因果识别或稳健性检验。
常见使用误区
- 第一次试跑不要一上来就同时加固定效应、聚类和很多控制变量,否则排错成本会很高。
- 手动输入控制变量时要用空格或逗号分隔,避免和变量原名混在一起。
- 如果同一个变量既在“自变量 (X)”又在“控制变量”里出现,会影响结果可读性。