Skip to content

Logit 教程

回归分析

解释二值因变量、聚类标准误、固定效应 Logit 提示和边际效应设置的填法。

常用 Stata 命令logit y x controls, vce(cluster id)
在 STATAU 中打开此功能
Logit二值因变量边际效应

这个页面解决什么问题

Logit 适用于因变量是 0/1 的离散选择场景,例如是否违约、是否就业、是否创新。STATAU 会在同一模块里提供聚类标准误、固定效应提示和边际效应开关。

方法原理

Logit 用 logistic 分布把线性预测值映射到 0 到 1 的概率区间,因此原始系数反映的是对对数胜算的影响,而不是对概率的直接影响。

适用数据与前提

被解释变量必须是 0/1 二值变量。若你打算加入固定效应,要特别注意样本规模和完全分离问题。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
因变量 (Y)0/1 二值变量例如是否违约、是否参与、是否披露。
自变量 (X)核心解释变量影响事件发生概率的变量。
控制变量其他控制变量控制共同影响因素。
聚类变量聚类标准误维度需要聚类标准误时填写。
边际效应设置是否计算边际效应、AME / MEM / Median用于把结果转成更直观的概率变化解释。

Stata 等效代码

logit [被解释变量] [解释变量] [控制变量], vce(cluster [聚类变量])
Stata 代码位置STATAU 网站对应位置应放入什么
[被解释变量]因变量 (Y)只能是 0/1 二值变量。
[解释变量]自变量 (X)核心解释变量。
vce(cluster [聚类变量])聚类变量选择聚类标准误时对应。
可删除代码段提示
  • 如果不做聚类标准误,可删除 `vce(cluster [聚类变量])`。
  • 如果只想先看原始系数,不必同时勾选边际效应。

在 STATAU 中操作步骤

  1. 确认因变量是 0/1 变量。
  2. 填写自变量、控制变量和标准误类型。
  3. 如果需要直观概率解释,再打开边际效应设置。
  4. 运行后先看原始系数方向,再结合边际效应解释概率变化。

结果怎么看

  • Logit 和 Probit 的原始系数反映的是潜在线性指标变化,不要直接把它当概率变化解释。
  • 如果勾选了边际效应,优先使用边际效应表解释经济含义,再把原始系数当作方向参考。
  • Pseudo-R²、Log Likelihood 和样本量更适合用来比较模型设定,而不是单独判断模型好坏。

常见使用误区

  • 把多分类变量直接当作 Logit 因变量会报错,因为当前页只接受 0/1。
  • 固定效应 Logit/Probit 会更耗时,维度很多时要留意性能提示。