外观
数据导入与合并教程
解释导入当前数据、导入第二份数据以及 append / horizontal / join 三类合并方式的适用场景。
常用 Stata 命令
import delimited / append using / merge 1:1 id year using data2.dta 在 STATAU 中打开此功能
数据合并appendmerge 1:1horizontal bind
这个页面解决什么问题
导入与合并模块分成“当前数据”和“第二份数据”两条线。当前数据负责建立后续全部处理的主版本;第二份数据只在你明确需要追加、横向绑定或按键匹配时才引入。
适用数据与前提
如果要做按键匹配合并,左右两份数据都应明确键变量,并保证变量编码口径一致。横向绑定只适合同一顺序、同一行数的数据表。
STATAU 页面中每个位置应该放什么变量
| 网站位置 | 应放入的变量 | 说明 |
|---|---|---|
| 导入当前数据 | 本地上传 / 平台数据库 / 粘贴文本 | 建立后续所有处理围绕的当前版本。 |
| 第二份数据来源 | 上传文件 / 数据库 / 粘贴文本 | 只服务于本次合并,不会单独变成主数据。 |
| 合并方式 | append / horizontal / join | 分别对应上下追加、1:1 横向绑定和按键匹配。 |
| 左右合并键 | 左键 / 右键 / join 类型 | 只在按键匹配时使用,用于定义匹配关系和保留规则。 |
Stata 等效代码
* 导入 CSV
import delimited "sample.csv", clear
* 上下追加
append using sample_2.dta
* 按键匹配合并
merge 1:1 id year using sample_2.dta| Stata 代码位置 | STATAU 网站对应位置 | 应放入什么 |
|---|---|---|
import delimited | 导入当前数据 | 对应本地上传或粘贴文本建立当前表。 |
append using | 合并方式 = 上下追加 | 适合两份数据变量结构相近、只想补行。 |
merge 1:1 id year using | 合并方式 = 按键匹配合并 | 对应左右键变量和 left / inner / right / outer 选择。 |
可删除代码段提示
- 如果第二份数据只是补行,用 `append using`,不需要 `merge` 语句。
- 如果你不做按键匹配,左键、右键和 join 类型整组参数都可以省略。
在 STATAU 中操作步骤
- 先导入当前数据,确认当前版本已经建立。
- 只有在确实需要第二份数据时,再切到“合并第二份数据”。
- 根据场景选择追加、横向绑定或按键匹配,并填写键变量或 join 类型。
- 执行后查看历史结果里的匹配率、未匹配提示和行列变化。
结果怎么看
- append 关注的是行数是否增加、列是否自动对齐。
- horizontal 关注的是两表长度是否一致,否则通常不适合直接横向绑定。
- join 关注的是匹配率、重复键风险和未匹配样本提示。
常见使用误区
- 左右键的类型不同,例如一边是字符串一边是数字,即使视觉上相同也会匹配失败。
- 横向绑定不是“按键匹配”,它假定两份数据顺序和长度已经对齐。
- 导入第二份数据后不要忘记确认当前主数据仍然是你想保留的版本。