stata 缺失值填充

发布时间 2023-09-01 09:46:56作者: myrj
//报告输出存在数据缺失的变量及该变量缺失值的个数
cap:ssc install nmissing
cap:ssc install fillmissing
cap:tssc install nmissing
nmissing
//with(linear)将缺失值改为相邻值的平均值
fillmissing var2 var3 var4 var5, with(linear)
//  fillmissing 命令语法
// [bysort varlist]: fillmissing varname [if] [in], [with(with_options)]
// with(any):最好用来填充常量变量 (constant variable),因为会任意从非缺失值中填充缺失值。如果未指定 with_options,则作为默认值;
// with(previous):使用前面的值填充当前的缺失值。如果前面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和前面的观测值;
// with(next):与 with(previous) 类似,使用后面的值填充当前的缺失值。如果后面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和后面的观测值;
// with(first):使用当前排序状态下的第一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的第一个值;
// with(last):使用当前排序状态下的最后一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的最后一个值;
// with(mean):使用非缺失值的平均值替换缺失值。变量类型只能为数值型 (numeric variable);
// with(median):使用非缺失值的中位数替换缺失值。变量类型只能为数值型 (numeric variable);
// with(min):使用非缺失值的最小值替换缺失值。变量类型只能为数值型 (numeric variable);
// with(max):使用非缺失值的最大值替换缺失值。变量类型只能为数值型 (numeric variable)。