Skip to content

差分项生成教程

数据处理

按时间顺序生成一阶差分或更高阶差分变量。

常用 Stata 命令xtset id year gen D1_x = D.x

这个页面解决什么问题

差分最常见的用法,是把“水平变化”改写成“增量变化”,例如今年减去年、这一期减上一期。对于趋势很强的变量或时间序列,这一步常常是后续建模前的必要处理。

适用数据与前提

至少需要目标变量、时间变量;若是面板数据,还要提供个体变量。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
目标变量需要做差分的变量例如价格、销量、资产。
个体变量 + 时间变量排序依据决定差分是沿着哪条时间线做。
差分阶数一阶或更高阶决定比较相邻几期。

Stata 等效代码

xtset [个体变量] [时间变量]
gen D1_[目标变量] = D.[目标变量]
Stata 代码位置STATAU 网站对应位置应放入什么
[个体变量] [时间变量]个体变量 + 时间变量决定差分沿哪条时间线计算。
D.[目标变量]目标变量对应本期减上期的一阶差分。

在 STATAU 中操作步骤

  1. 选择目标变量和时间顺序字段。
  2. 指定差分阶数后生成新变量。
  3. 再检查新变量是否符合“本期减上期”的直觉。

结果怎么看

  • 差分后的首期观测通常会为空,这是正常现象。
  • 如果差分结果异常,先检查时间顺序和个体边界是否设对。
论文表述示例
  • 如果你是为了消除趋势项或单位效应,记得在结果解释里强调“差分后变量反映的是变化量而不是水平值”。

常见使用误区

  • 差分会直接改变变量经济含义,后面解释系数时不要还按原始水平变量去写。
  • 高阶差分虽然能更强地去趋势,但也更容易放大噪声和样本损失。

相关页面