Probit 教程

回归分析

说明 Probit 与 Logit 在页面填法上基本一致，但解释基于正态分布链接函数。

常用 Stata 命令probit y x controls, vce(cluster id)

在 STATAU 中打开此功能

Probit二值选择模型边际效应

这个页面解决什么问题

Probit 与 Logit 都服务于 0/1 因变量分析，区别主要在链接函数。页面填法上几乎一致，因此你主要需要关注研究习惯、解释方式和是否要继续输出边际效应。

方法原理

Probit 使用标准正态分布函数把线性预测值映射到概率区间，因此原始系数同样不直接等于概率变化，解释时通常配合边际效应。

适用数据与前提

被解释变量同样必须是 0/1 二值变量，其他输入项与 Logit 页面保持一致。

STATAU 页面中每个位置应该放什么变量

网站位置	应放入的变量	说明
因变量 (Y)	0/1 二值变量	与 Logit 页面完全一致。
自变量 (X)	核心解释变量	用于解释事件发生概率。
控制变量 / 聚类变量	常规控制与标准误设置	填法与 Logit 页面一致。
边际效应设置	AME / MEM / Median	建议作为最终解释的主要依据。

Stata 等效代码

probit [被解释变量] [解释变量] [控制变量], vce(cluster [聚类变量])

Stata 代码位置	STATAU 网站对应位置	应放入什么
`probit [被解释变量] [解释变量] [控制变量]`	因变量、自变量、控制变量	基本结构与 Logit 一致。
`vce(cluster [聚类变量])`	聚类变量	仅在聚类标准误时出现。

可删除代码段提示

如果不做聚类标准误，去掉 `vce(cluster [聚类变量])`。
如果不看边际效应，先只保留原始 Probit 系数即可。

在 STATAU 中操作步骤

按 Logit 页相同逻辑填写因变量、自变量和控制变量。
根据需要选择稳健或聚类标准误。
若要解释概率变化，勾选边际效应并选择计算方式。

结果怎么看

Logit 和 Probit 的原始系数反映的是潜在线性指标变化，不要直接把它当概率变化解释。
如果勾选了边际效应，优先使用边际效应表解释经济含义，再把原始系数当作方向参考。
Pseudo-R²、Log Likelihood 和样本量更适合用来比较模型设定，而不是单独判断模型好坏。

常见使用误区

不要把 Probit 原始系数直接写成“概率提高了多少个百分点”。
如果只是因为页面相似就随意在 Logit 和 Probit 间切换，后续结果比较会缺少理论依据。