Skip to content

Probit 教程

回归分析

说明 Probit 与 Logit 在页面填法上基本一致,但解释基于正态分布链接函数。

常用 Stata 命令probit y x controls, vce(cluster id)
在 STATAU 中打开此功能
Probit二值选择模型边际效应

这个页面解决什么问题

Probit 与 Logit 都服务于 0/1 因变量分析,区别主要在链接函数。页面填法上几乎一致,因此你主要需要关注研究习惯、解释方式和是否要继续输出边际效应。

方法原理

Probit 使用标准正态分布函数把线性预测值映射到概率区间,因此原始系数同样不直接等于概率变化,解释时通常配合边际效应。

适用数据与前提

被解释变量同样必须是 0/1 二值变量,其他输入项与 Logit 页面保持一致。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
因变量 (Y)0/1 二值变量与 Logit 页面完全一致。
自变量 (X)核心解释变量用于解释事件发生概率。
控制变量 / 聚类变量常规控制与标准误设置填法与 Logit 页面一致。
边际效应设置AME / MEM / Median建议作为最终解释的主要依据。

Stata 等效代码

probit [被解释变量] [解释变量] [控制变量], vce(cluster [聚类变量])
Stata 代码位置STATAU 网站对应位置应放入什么
probit [被解释变量] [解释变量] [控制变量]因变量、自变量、控制变量基本结构与 Logit 一致。
vce(cluster [聚类变量])聚类变量仅在聚类标准误时出现。
可删除代码段提示
  • 如果不做聚类标准误,去掉 `vce(cluster [聚类变量])`。
  • 如果不看边际效应,先只保留原始 Probit 系数即可。

在 STATAU 中操作步骤

  1. 按 Logit 页相同逻辑填写因变量、自变量和控制变量。
  2. 根据需要选择稳健或聚类标准误。
  3. 若要解释概率变化,勾选边际效应并选择计算方式。

结果怎么看

  • Logit 和 Probit 的原始系数反映的是潜在线性指标变化,不要直接把它当概率变化解释。
  • 如果勾选了边际效应,优先使用边际效应表解释经济含义,再把原始系数当作方向参考。
  • Pseudo-R²、Log Likelihood 和样本量更适合用来比较模型设定,而不是单独判断模型好坏。

常见使用误区

  • 不要把 Probit 原始系数直接写成“概率提高了多少个百分点”。
  • 如果只是因为页面相似就随意在 Logit 和 Probit 间切换,后续结果比较会缺少理论依据。