Skip to content

数据导入与合并教程

数据处理

解释导入当前数据、导入第二份数据以及 append / horizontal / join 三类合并方式的适用场景。

常用 Stata 命令import delimited / append using / merge 1:1 id year using data2.dta
在 STATAU 中打开此功能
数据合并appendmerge 1:1horizontal bind

这个页面解决什么问题

导入与合并模块分成“当前数据”和“第二份数据”两条线。当前数据负责建立后续全部处理的主版本;第二份数据只在你明确需要追加、横向绑定或按键匹配时才引入。

适用数据与前提

如果要做按键匹配合并,左右两份数据都应明确键变量,并保证变量编码口径一致。横向绑定只适合同一顺序、同一行数的数据表。

STATAU 页面中每个位置应该放什么变量

网站位置应放入的变量说明
导入当前数据本地上传 / 平台数据库 / 粘贴文本建立后续所有处理围绕的当前版本。
第二份数据来源上传文件 / 数据库 / 粘贴文本只服务于本次合并,不会单独变成主数据。
合并方式append / horizontal / join分别对应上下追加、1:1 横向绑定和按键匹配。
左右合并键左键 / 右键 / join 类型只在按键匹配时使用,用于定义匹配关系和保留规则。

Stata 等效代码

* 导入 CSV
import delimited "sample.csv", clear

* 上下追加
append using sample_2.dta

* 按键匹配合并
merge 1:1 id year using sample_2.dta
Stata 代码位置STATAU 网站对应位置应放入什么
import delimited导入当前数据对应本地上传或粘贴文本建立当前表。
append using合并方式 = 上下追加适合两份数据变量结构相近、只想补行。
merge 1:1 id year using合并方式 = 按键匹配合并对应左右键变量和 left / inner / right / outer 选择。
可删除代码段提示
  • 如果第二份数据只是补行,用 `append using`,不需要 `merge` 语句。
  • 如果你不做按键匹配,左键、右键和 join 类型整组参数都可以省略。

在 STATAU 中操作步骤

  1. 先导入当前数据,确认当前版本已经建立。
  2. 只有在确实需要第二份数据时,再切到“合并第二份数据”。
  3. 根据场景选择追加、横向绑定或按键匹配,并填写键变量或 join 类型。
  4. 执行后查看历史结果里的匹配率、未匹配提示和行列变化。

结果怎么看

  • append 关注的是行数是否增加、列是否自动对齐。
  • horizontal 关注的是两表长度是否一致,否则通常不适合直接横向绑定。
  • join 关注的是匹配率、重复键风险和未匹配样本提示。

常见使用误区

  • 左右键的类型不同,例如一边是字符串一边是数字,即使视觉上相同也会匹配失败。
  • 横向绑定不是“按键匹配”,它假定两份数据顺序和长度已经对齐。
  • 导入第二份数据后不要忘记确认当前主数据仍然是你想保留的版本。

相关页面