外观
数据处理页不是一堆分散的小工具,而是一条完整工作流:先把数据导进来,再清理样本,最后构造能进模型的变量。下面按这条路径给你排好入口。
先看清整个工作台的逻辑、版本历史和同步到分析的方式。
从本地文件、数据库或粘贴文本建立当前数据,再按键合并第二份表。
先整理变量名、变量说明和类型,再进入样本清洗和建模。
决定缺失值是删、填还是加缺失标记。
先定义观测单位,再判断哪些记录才是真的重复。
用 IQR、Z 分数或分位点规则识别极端值。
按研究口径保留样本,并清楚记录筛选逻辑。
抽测试样本、分层样本或人工核验样本。
对数、交互项、虚拟变量、滞后项和差分项都从这里进。
沿着个体和时间顺序生成上一期或前几期变量。
把水平值改写成增量变化,常用于时间序列和面板数据。
统一量纲,方便交互项、综合指标或变量比较。
根据指标离散程度生成综合得分。
用主成分方法把多指标压缩成少数综合维度。
适合处理潜在结构明显、需要解释公共因子的指标组。