基于聚类分析的K-means算法研究及应用(1)(2)
2013-11-30 01:34
导读:(1)聚类分析能作为一个独立的工具来获得数据的分布情况,观察每个簇的特点,集中对特定的某些簇作进一步的分析。如:①聚类分析软件 v1.2。此软件
(1)聚类分析能作为一个独立的工具来获得数据的分布情况,观察每个簇的特点,集中对特定的某些簇作进一步的分析。如:①聚类分析软件 v1.2。此软件主要用于血型、蛋白质多态、品种聚类等方面的统计分析,可自动进行杂合度、多态信息含量、遗传距离以及聚类的计算,并可自动画出聚类图。②SPSS统计软件。SPSS软件是一种专业的统计分析软件,用于数据的各种分析,从而最终为企、事业的科学决策服务。其中采用聚类分析是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。
本文通过一组儿童生长发育的数据运用SPSS工具进行分析,如表2所示。
运用SPSS工具调用K-means Cluster过程可完成由用户指定类别数的大样本资料的逐步聚类分析。逐步聚类分析就是先把被聚对象进行初始分类,然后逐步调整,得到最终分类。
为研究儿童生长发育的分期,笔者对1 253名1月~7岁儿童进行了抽样调查,分别对儿童的身高(cm)、体重(kg)、胸围(cm)和坐高(cm)进行了测量。资料作如下整理:先把1月~7岁划成19个月份段,分月份算出各指标的平均值,将第1月的各指标平均值与出生时的各指标平均值比较,求出月平均增长率(%),然后第2月起的各月份指标平均值均与前一月比较,求出月平均增长率(%)(表2)。将儿童生长发育时期分为四期,所以聚类的类别数为4,从而确定四个儿童生长发育期的起止区间。
①激活数据管理窗口,定义变量名。虽然月份分组不做分析变量,但为了更直观地了解聚类结果,也将之输入数据库。
②进行统计分析,在聚类方法上选择Iterate and classify指定初始类别中心点,按K-means算法作迭代分类。对聚类结果进行方差分析。共2页: 1 [2] 下一页 论文出处(作者):
(科教作文网http://zw.NSEaC.com编辑发布)
可配置可扩展发布订阅系统的研究及其实现
VPML-OOPN集成建模方法的设计与实现