外观
分组描述性统计教程
按组比较均值、标准差和样本量,快速判断不同组之间的基础差异。
常用 Stata 命令
tabstat y x1 x2, by(group) stat(mean sd n min max) 在 STATAU 中打开此功能
分组描述性统计tabstat by处理组对照组比较
这个页面解决什么问题
这页适合在正式回归前先比较处理组与对照组、不同地区、不同所有制或不同行业之间有没有明显的基础差异。它能帮你快速判断样本结构是否均衡,也能为后面的异质性分析打底。
适用数据与前提
通常需要一个分组变量和一组数值型指标变量。
STATAU 页面中每个位置应该放什么变量
| 网站位置 | 应放入的变量 | 说明 |
|---|---|---|
| 分组变量 | 分类组别变量 | 例如地区、行业、处理组。 |
| 分析变量 | 组内统计变量 | 进入各组描述性统计表。 |
Stata 等效代码
tabstat [分析变量], by([分组变量]) stat(mean sd n min max)| Stata 代码位置 | STATAU 网站对应位置 | 应放入什么 |
|---|---|---|
[分组变量] | 分组变量 | 决定每一组样本的划分口径。 |
[分析变量] | 分析变量 | 进入各组统计表的数值型变量。 |
stat(mean sd n min max) | 统计量勾选区 | 对应组内均值、标准差、样本量和极值等输出。 |
在 STATAU 中操作步骤
- 先选择分组变量,再勾选需要比较的数值变量。
- 生成后先看各组样本量,再比较均值和离散程度。
结果怎么看
- 重点看组间均值差异是否明显,以及各组样本量是否过小。
- 如果某一组样本量明显太少,后续分组回归和异质性结论都要更谨慎。
论文表述示例
- 可以写成:“表 1 进一步报告了按处理状态分组的描述性统计结果,处理组与对照组在若干变量上存在明显差异。”
常见使用误区
- 分组变量口径没整理好时,分组描述性统计会把同一类样本拆成多个小组。
- 如果只是两组比较,后面最好再补一个 T 检验,而不是只停留在描述层面。