分析一组数据中的差异,主要采用以下方法:
一、描述性统计分析
-
分位数与分布
通过计算10%、25%、50%、75%、90%分位数,观察数据分布情况。例如,深圳数据显示女性收入在各个分位数均低于男性,90%分位值女性收入仅占男性的79%。
二、假设检验方法
-
方差分析(ANOVA)
-
LSD法 :适用于各总体方差相等的情况,通过比较组间均值差异判断是否存在显著差异,但无法控制一类错误概率。
-
S-N-K法 :当各水平观测值个数相等时,通过划分相似子集提高检验效率。
-
三、多重比较方法
-
先验对比检验
在发现部分组间差异显著后,进一步检验这些组均值组合的差异。例如,若x1、x2、x3与x4、x5均值显著不同,可检验其组合均值差异。
四、趋势分析
- 定序变量控制 :当存在定序变量(如教育程度、职位等级)时,通过趋势检验分析其变化对观测变量的影响,判断是否存在线性或非线性趋势。
总结 :根据数据类型和问题需求选择合适方法,描述性统计提供基础差异展示,假设检验用于验证差异显著性,多重比较可深入分析组间关系,趋势分析则关注变量间的动态关系。