Logit 教程

回归分析

解释二值因变量、聚类标准误、固定效应 Logit 提示和边际效应设置的填法。

常用 Stata 命令logit y x controls, vce(cluster id)

在 STATAU 中打开此功能

Logit二值因变量边际效应

这个页面解决什么问题

Logit 适用于因变量是 0/1 的离散选择场景，例如是否违约、是否就业、是否创新。STATAU 会在同一模块里提供聚类标准误、固定效应提示和边际效应开关。

方法原理

Logit 用 logistic 分布把线性预测值映射到 0 到 1 的概率区间，因此原始系数反映的是对对数胜算的影响，而不是对概率的直接影响。

适用数据与前提

被解释变量必须是 0/1 二值变量。若你打算加入固定效应，要特别注意样本规模和完全分离问题。

STATAU 页面中每个位置应该放什么变量

网站位置	应放入的变量	说明
因变量 (Y)	0/1 二值变量	例如是否违约、是否参与、是否披露。
自变量 (X)	核心解释变量	影响事件发生概率的变量。
控制变量	其他控制变量	控制共同影响因素。
聚类变量	聚类标准误维度	需要聚类标准误时填写。
边际效应设置	是否计算边际效应、AME / MEM / Median	用于把结果转成更直观的概率变化解释。

Stata 等效代码

logit [被解释变量] [解释变量] [控制变量], vce(cluster [聚类变量])

Stata 代码位置	STATAU 网站对应位置	应放入什么
`[被解释变量]`	因变量 (Y)	只能是 0/1 二值变量。
`[解释变量]`	自变量 (X)	核心解释变量。
`vce(cluster [聚类变量])`	聚类变量	选择聚类标准误时对应。

可删除代码段提示

如果不做聚类标准误，可删除 `vce(cluster [聚类变量])`。
如果只想先看原始系数，不必同时勾选边际效应。

在 STATAU 中操作步骤

确认因变量是 0/1 变量。
填写自变量、控制变量和标准误类型。
如果需要直观概率解释，再打开边际效应设置。
运行后先看原始系数方向，再结合边际效应解释概率变化。

结果怎么看

Logit 和 Probit 的原始系数反映的是潜在线性指标变化，不要直接把它当概率变化解释。
如果勾选了边际效应，优先使用边际效应表解释经济含义，再把原始系数当作方向参考。
Pseudo-R²、Log Likelihood 和样本量更适合用来比较模型设定，而不是单独判断模型好坏。

常见使用误区

把多分类变量直接当作 Logit 因变量会报错，因为当前页只接受 0/1。
固定效应 Logit/Probit 会更耗时，维度很多时要留意性能提示。