外观
卡方检验教程
判断两个分类变量之间是否存在统计关联。
常用 Stata 命令
tab rowvar colvar, chi2 在 STATAU 中打开此功能
卡方检验列联表chi2
这个页面解决什么问题
卡方检验适合回答“两个分类变量是不是有关联”这类问题,例如地区和处理状态是否有关、行业和企业属性是否有关。它通常搭配列联表一起看。
适用数据与前提
需要两个分类变量,而且每个格子的样本数不能过低。
STATAU 页面中每个位置应该放什么变量
| 网站位置 | 应放入的变量 | 说明 |
|---|---|---|
| 行变量 | 第一个分类变量 | 例如处理状态、地区类型。 |
| 列变量 | 第二个分类变量 | 例如行业类别、企业属性。 |
Stata 等效代码
tab [行变量] [列变量], chi2| Stata 代码位置 | STATAU 网站对应位置 | 应放入什么 |
|---|---|---|
[行变量] | 行变量 | 列联表左侧分类变量。 |
[列变量] | 列变量 | 列联表顶部分类变量。 |
chi2 | 执行卡方检验 | 对应输出卡方统计量和 p 值。 |
在 STATAU 中操作步骤
- 分别选择行变量和列变量。
- 生成列联表后先看各格样本数,再看卡方检验 p 值。
结果怎么看
- 如果 p 值较小,说明两个分类变量之间更可能存在统计关联。
- 若某些格子样本太少,结论要更谨慎。
论文表述示例
- 可以写成:“卡方检验结果显示,处理状态与行业类型之间存在显著统计关联。”
常见使用误区
- 如果本质上是连续变量,只是被粗暴编码成很多类别,卡方结果往往不稳定。
- 先看列联表各格样本数,再看显著性,不要只盯 p 值。