Skip to content

卡方检验教程

基础统计

判断两个分类变量之间是否存在统计关联。

常用 Stata 命令tab rowvar colvar, chi2
在 STATAU 中打开此功能
卡方检验列联表chi2

这个页面解决什么问题

卡方检验适合回答“两个分类变量是不是有关联”这类问题,例如地区和处理状态是否有关、行业和企业属性是否有关。它通常搭配列联表一起看。

适用数据与前提

需要两个分类变量,而且每个格子的样本数不能过低。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
行变量第一个分类变量例如处理状态、地区类型。
列变量第二个分类变量例如行业类别、企业属性。

Stata 等效代码

tab [行变量] [列变量], chi2
Stata 代码位置STATAU 网站对应位置应放入什么
[行变量]行变量列联表左侧分类变量。
[列变量]列变量列联表顶部分类变量。
chi2执行卡方检验对应输出卡方统计量和 p 值。

在 STATAU 中操作步骤

  1. 分别选择行变量和列变量。
  2. 生成列联表后先看各格样本数,再看卡方检验 p 值。

结果怎么看

  • 如果 p 值较小,说明两个分类变量之间更可能存在统计关联。
  • 若某些格子样本太少,结论要更谨慎。
论文表述示例
  • 可以写成:“卡方检验结果显示,处理状态与行业类型之间存在显著统计关联。”

常见使用误区

  • 如果本质上是连续变量,只是被粗暴编码成很多类别,卡方结果往往不稳定。
  • 先看列联表各格样本数,再看显著性,不要只盯 p 值。

相关页面