0002.统计描述分析

发布时间 2023-05-25 00:58:59作者: 興華

描述统计分析是进行其他统计分析的基础和前提。在描述性分析中,通过各种统计图及数字特征量尅对样本来自的总体特征有比较准确的把握,从而选择正确的推断方法。

一、 频数分布分析(Frequencies)

基本概念:频数分布分析主要通过频数分布表、条图和直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征。

通过 分析>描述统计>频率 路径进入频率统计主对话框

   

1. 在频率统计主对话框中点击统计即可进入统计量对话框,针对需求进行各项目勾选即可

2. 在频率统计主对话框中点击图表即可进入图表对话框,针对统计数据选择需求图表即可

  在选择直方图时,可勾选在直方图中显示正态曲线,则输出图像为正态分布图。

3. 在频率统计主对话框中点击格式即可进入格式对话框,针对统计数据选择需求输出格式即可

 

① 排序方式,按需求选择即可

② 多个变量:比较变量为将所有变量的描述统计的结果显示在同一张表格中;按变量组织输出为每个变量分别输出单独的描述统计表格

二、描述性统计分析(Descriptives)

基本概念:描述性统计分析主要用以计算描述集中趋势和离散趋势的各种统计量,此外还有一个重要功能是对变量做标准化变换,即Z变换。

通过 分析>描述统计>描述 路径进入描述统计主对话框

1. 在描述统计主对话框中点击选项即可进入选项对话框,针对统计需求进行各项目勾选即可

三、探索性分析(Explore)

基本概念:探索分析是在对数据的基本特征 统计量有初步连接的基础上,对数据进行的更为深入详细的描述性观察分析。在一般描述性统计指标的基础上,增加了有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户四开对数据进行进一步的方案。

探索性分析有以下几个目的:

  •  对数据进行初步检查,判断有无离群点和极端值;
  • 对前提条件假设,如正态分布和方差齐性进行检查,不满足正态分布和方差齐性时,提示数据转换方法,最后决定使用参数方法或非参数方法;
  • 了解组间差异的特征。

通过 分析>描述统计>探索 路径进入探索统计主对话框

1. 在探索统计主对话框中点击统计即可进入统计对话框,针对统计需求进行项目勾选即可

  • 描述:生成描述性统计表格,表中显示样本数据的描述统计量,包括平均值、中位数、5%调整平均数、标准误差、方差、标准差、最大/小值、组距、四分位数、峰/偏度、峰/偏度的标准误差; 均值置信区间可输入,一般在95;
  • M-估计量:计算并生成稳健估计量。M估计在计算时对所有观测量赋予权重,随观测量距分布中心的远近而变化,通过给远离中心值的数据赋予较小的权重来减小异常值的影响;
  • 离群值:输出分析数据中5个最大值和5个最小值作为异常嫌疑值;
  • 百分位数:计算并显示制定的百分位数,包括5%、10%、25%、50%、75%、90%、95%等。

2. 在探索统计主对话框中点击图即可进入图形对话框,针对统计需求进行输出图表选择

  • 箱图:因子级别并置-为每个因变量创建一个箱图,在每个箱图 内根据分组变量的不同水平的取值创建箱型单元;因变量并置-为每个分组变量的水平创建一个箱图,在每个箱图内用不同的颜色区分不同因变量所对应的箱型单元,方便用户进行比较;无-不创建箱图
  • 描述图:茎叶图-主要由频率、茎、叶组成,在图中按从左到右的顺序依次排列,在图的底端,注明了茎的宽和每一叶所代表的观测量数;直方图-直接绘制直方图
  • 函检验的正态图:进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图
  • 含莱文检验的分布:伸展与级别检验,对所有的展布-水平图进行方差齐性检验和数据转换,同时输出回归直线的斜率及方差齐性的级别检验,但如果没有指定分组变量,则此选项无效

2. 在探索统计主对话框中点击图即可进入选项对话框,针对统计需求进行输出类型选择

  • 成列排除个案:对所有的分析过程剔除分组变量和因变量中所有带有缺失值的观测量数据;
  • 成对排除个案:同时剔除带缺失值的观测值及与缺失值有成对关系的观测量。在当前分析过程中用到的变量数据中剔除带有缺失值的观测量数据,在其他分析过程中可能包含缺失值;
  • 报告值:将分组变量的缺失值单独分为一组,在输出频数表的同时输出缺失值。