相关分析是研究变量间线性或非线性关系的统计方法,主要分为以下五种常用方法:
一、积差相关(Pearson相关)
-
适用条件 :适用于两个连续型变量之间的线性相关分析,要求数据满足正态分布且变量间无显著异常值。
-
计算公式 :通过计算相关系数r,其值范围为-1到1,r=1表示完全正相关,r=-1表示完全负相关,r=0表示无相关。
二、斯皮尔曼相关(Spearman相关)
-
适用条件 :适用于两个顺序变量(如排名数据)或非正态连续型变量的相关性分析。
-
计算方法 :基于变量的秩次(排序后的位置)计算相关系数,值域为-1到1,可判断变量间的单调关系方向。
三、肯德尔相关(Kendall相关)
-
适用条件 :主要用于多组顺序变量之间的相关性分析,尤其适合判断多个变量间的一致趋势。
-
核心思想 :通过比较观测值与秩次的一致性,计算相关系数,值域为-1到1,值越大表示一致性越高。
四、斯皮尔曼-布朗相关(Spearman-Brown相关)
-
适用条件 :扩展了斯皮尔曼相关,适用于多组有序分类变量,可分析多组变量间的协同变化趋势。
-
特点 :通过构建多个二分变量,逐步分析变量间的交互关系,结果以相关系数表示。
五、其他补充方法
-
卡方检验 :用于分类变量间的关联性分析(如频数分布的拟合优度检验);
-
因子分析 :通过降维技术提取变量间的潜在因子(如主成分分析)。
注意事项 :相关分析仅能揭示变量间的关联程度,不能直接推断因果关系。实际应用中需结合领域知识和进一步验证。