Skip to content

分组描述性统计教程

基础统计

按组比较均值、标准差和样本量,快速判断不同组之间的基础差异。

常用 Stata 命令tabstat y x1 x2, by(group) stat(mean sd n min max)
在 STATAU 中打开此功能
分组描述性统计tabstat by处理组对照组比较

这个页面解决什么问题

这页适合在正式回归前先比较处理组与对照组、不同地区、不同所有制或不同行业之间有没有明显的基础差异。它能帮你快速判断样本结构是否均衡,也能为后面的异质性分析打底。

适用数据与前提

通常需要一个分组变量和一组数值型指标变量。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
分组变量分类组别变量例如地区、行业、处理组。
分析变量组内统计变量进入各组描述性统计表。

Stata 等效代码

tabstat [分析变量], by([分组变量]) stat(mean sd n min max)
Stata 代码位置STATAU 网站对应位置应放入什么
[分组变量]分组变量决定每一组样本的划分口径。
[分析变量]分析变量进入各组统计表的数值型变量。
stat(mean sd n min max)统计量勾选区对应组内均值、标准差、样本量和极值等输出。

在 STATAU 中操作步骤

  1. 先选择分组变量,再勾选需要比较的数值变量。
  2. 生成后先看各组样本量,再比较均值和离散程度。

结果怎么看

  • 重点看组间均值差异是否明显,以及各组样本量是否过小。
  • 如果某一组样本量明显太少,后续分组回归和异质性结论都要更谨慎。
论文表述示例
  • 可以写成:“表 1 进一步报告了按处理状态分组的描述性统计结果,处理组与对照组在若干变量上存在明显差异。”

常见使用误区

  • 分组变量口径没整理好时,分组描述性统计会把同一类样本拆成多个小组。
  • 如果只是两组比较,后面最好再补一个 T 检验,而不是只停留在描述层面。

相关页面