引言 在市场细分研究实践中,我们常常遇到这样(2)
2013-06-03 02:28
导读:1.2 对应分析法的步骤 1.2.1 数据预处理 设有 n 个样品, 每个样品有 p 个观测指标, 列出原始数。 1.3 对应分析的优点和局限性 1.3.1 对应分析的优点 1.定性指
1.2 对应分析法的步骤
1.2.1 数据预处理
设有 n 个样品, 每个样品有 p 个观测指标, 列出原始数。
1.3 对应分析的优点和局限性
1.3.1 对应分析的优点
1.定性指标划分的类别越多,越容易刻画相互间的关系。
2.提供了将定性变量按定量方法处理的途径,从数量的角度揭示交叉列表行变量类别和列变量类别间关系。
3.对应分析图可以将不同属性的指标反映在同一坐标系下,将所有行变量类别和列变量类别间的联系直观地表现在同一张分布图上,从而能清楚地解释统计分析结果。
4.可以将名义变量或次序变量转变为间距变量,从而可以应用更多的传统统计方法分析含有这样变量的调查数据。
1.3.2 对应分析的局限性
1.它只是一种描述性的统计分析方法,虽然可以解释变量间的联系,但不能用于假设检验,并且各个类别之间的距离无实际意义,而只是表示联系的密切程度。
2.该方法是一种减少维度的方法,它要求用最少的维度来解释尽可能多的差异,但究竟用几维进行分析需要由研究者自己决定。
3.要求样本随机性获得,对拦截访问资料、重点调查资料等非随机资料,进行对应分析时需根据配额计算调整系数。当对应点有0 出现或者某类样本数量占样本总量的比例较小时,出现分析偏性的可能性较大,并且受极端值的影响较大。[12]
2 对应分析的实证研究
2.1 资料来源
该实证资料来自2012 年10 月广东东莞旗红服装厂对广西桂林市不同层次和年龄阶段的服装潜在消费者的入户调查取得所的626 个有效样本,并将该调查的潜在消费者特征与产品特征属性的原始数据整理成为两个维度的交叉结构的数据表。
(科教作文网http://zw.NSEaC.com编辑发布)
2.2 指标体系及数据
该服装潜在用户的调查资料共包括服装产品的7 个属性特征、样本的4 个年龄特征和3个文化程度特征。服装产品的7 个特征属性即为“名牌”、“外观正式”、“耐穿”、“外观时尚”、“感觉舒适”、“价格合理”和“质量好”; 样本的4 个年龄特征即为“18-25岁”、“26-35 岁”、“36-45 岁”、“46-55 岁”;3 个文化程度特征即为“初中以下”、“高中/中专”和“大学及以上”。
2.3 数据处理
惯量(inertia)实际上就是常说的特征根值(Eigenvalue),表示相应维度对各类别的解释量,维度的数量最大等于“行变量数-1”与“列变量数-1”中的较小者,本例最多可以产生6个维度。选取几个维度对结果进行分析,需结合实际情况,一般解释量累计比例达90%以上即可获得较好的分析效果。对应分析中与惯量相联系的另一个概念是奇异值(SingularValue),它等于惯量的平方根,表示交叉表中每个对应点的行分值与列分值的相关系数。[13]
从统计结果可以看出,行和列的分值都是按四个维度计算的。从维度奇异值(singularvalue)看,第一维和第二维分值的相关程度最高,但第三维度也有一定的相关关系。从解释比例来看,第一维和第二维可以解释全部差异的83.66%,如果增加到第三维则只能多解释8.67%,所以仍用两维分布图来表现变量间的联系。但是前两维的解释比例小于90%,说明有一些差异在两维空间里还不能充分表现出来。从表3 中每一维度对行分值作用的统计数据可以看出,第三位对“大学及以上”的行分值影响作用最大,但由于“大学及以上”得消费者的比例并不高,所以尽管第三维对它的分值影响很大,但从总体上看,绝对最用还是不大的。
针对每一个惯量,可以分别计算行(消费者特征)、列(产品属性)在相应维度上的得分。计算该轮廓坐标 (因子载荷矩阵),并在 R1 - R2 (即 Q1 - Q2 ) 直角坐标系上绘制投影图, 即得对应分析图如下[14]:
(科教范文网 fw.nseac.com编辑发布) 2.4 结果分析