11个常见的多变量分析方法


11个常见的多变量分析方法

文章插图
 
 
在社会科学研究中,主要的多变量分析方法包括多变量方差分析(Multivariate analysis of variance,MANOVA)、主成分分析(Principal component analysis)、因子分析(Factor analysis)、典型相关(Canonical correlation analysis)、聚类分析(Cluster analysis)、判别分析(Discriminant analysis)、多维量表分析(Multidimensional scaling),以及近来颇受瞩目的验证性因子分析(Confirmatory factor analysis )或线性结构模型(LISREL)与逻辑斯蒂回归分析等,以下简单说明这些方法的观念和适用时机 。
 
一、多变量方差分析
MANOVA适用于同时探讨一个或多个自变量与两个以上因变量间因果关系的统计方法,依照研究者所操作自变量的个数,可以分为单因素(一个自变量)或多因素(两个以上自变量)MANOVA 。进行多变量方差分析时,自变量必须是离散的定类或定序变量,而因变量则必须是定距以上层次的变量 。
 
二、主成分分析
主成分分析的主要功能在分析多个变量间的相关,以建构变量间的总体性指标(overall indicators) 。当研究者测量一群彼此间具有高度相关的变量,则在进行显著性检验钱,为避免变量数过多,造成解释上的复杂与困扰,常会先进行主成分分析,在尽量不丧失原有信息的前提下,抽取少数几个主成分,作为代表原来变量的总体性指标,达到资料缩减(data reduction)的功能 。进行主成分分析时,并无自变量和因变量的区别,但是所有的变量都必须是定距以上层次变量 。
 
三、因子分析
因子分析与主成分分析常被研究者混用,因为二者的功能都是通过对变量间的相关分析,以达到简化数据功能 。但不同的是,主成分分析是在找出变量间最佳线性组合(linear combination)的主成分,以说明变量间最多的变异量;至于因子分析,则在于找出变量间共同的潜在结构(latent structure)或因子,以估计每一个变量在各因子上的负荷量(loading) 。进行因子分析时,并无自变量和因变量的区分,但是所有变量都必须是定距以上层次变量 。
 
四、典型相关
典型相关可视为积差相关或多元回归分析的扩展,主要功能在分析两个变量间的相关 。进行多元回归分析的目的,是在分析一个或多个自变量与一个因变量间的关系,而典型相关中因变量也可以是多个;也就是说,典型相关的目的在于通过计算得到两个变量线性组合的加权系数 。以使(maximum)两个变量间的相关达到最大化 。进行典型相关时,并无自变量和因变量的区分,但是所有变量都必须是定距以上层次变量 。
 
五、聚类分析
聚类分析的主要功能在进行分类(classification),当研究者有观测值时,常会根据观测值的相似性或差异性进行分类,以形成几个性质不同的类别,简化解释的工作 。也就是说,聚类分析根据对变量进行测量的观察值进行分类,以达到组内同质、组间异值的目的 。其次,聚类分析完成后,通常可以进行判别分析,以识别分类的效度 。当然,在某些时候也可以对变量进行分类(此功能类似因子分析,因此多采用因子分析解决问题) 。进行聚类分析时,并无自变量和因变量的区分,但是所有变量都必须是定距以上层次变量 。
 
六、判别分析
判别分析是多变量分析中应用相当广泛的统计方法,它可以用来对样本进行分类的工作;也可以用来了解不同类别样本在某些变量上的差异情形;同时也可以根据不同类别的样本在某些变量的实际表现,用来预测新的样本属于某一类别的概率 。因此,在行为科学中,常见的研究者单独使用判别分析,建立判别函数(discriminant function),以对新样本进行预测;或是多变量方差分析的检验值达到显著性水平后,比较不同组别样本在因变量平均数的差异情形;或是聚类分析后,检验聚类分析的正确性 。进行判别分析时,自变量是定距以上层次变量,至于因变量通常是离散变量 。
 
七、多维量表分析
多维量表分析基本上也是一种分类的统计方法,他在市场上普遍被应用 。当研究者想要解释一群受试者(例如消费者)对一组客体(例如商品)在某些变量上相似性的测量中所包含的信息,此时多维量表分析就是一个相当适用的方法 。研究者只要将这一组客体在变量上的测量值转化成多维度的几何表征,就能够将这些客体有效地显示在这个几何空间中,达到分类的目的,同时也可以进一步解释这些几何表征所代表的潜在结构或意义 。进行多维量表分析时,并无自变量和因变量的区分,同时变量可以是等距以上变量,也可以是定类或定序变量 。


推荐阅读