第三方物流企业中的商务智能技术应用(1)(2)
2017-08-27 01:53
导读:数据挖掘的对象 关系数据库(relational database)中通常存储和管理的是结构化的数据,它将一个实体的各方面信息通过离散的属性进行描述。而文本数据库(
数据挖掘的对象
关系数据库(relational database)中通常存储和管理的是结构化的数据,它将一个实体的各方面信息通过离散的属性进行描述。而文本数据库(text database)或文档数据库(document database)则通常存储和管理的是半结构化的数据,例如新闻稿件、研究论文、电子邮件、书籍以及WEB页面等都属于半结构化数据。空间数据库、多媒体数据库中存放的是非结构化数据,例如地图、图片、音频、视频等都属于非结构化数据。相对于半结构化和非结构化数据来说,针对结构化数据的数据挖掘技术比较成熟,市场上有很多的商品软件可以使用,用的较多的包括IBM Intelligent Miner、SAS Enterprise Miner、SGI MineSet、Clementine SPSS以及Microsoft SQL Server 2000等。关于半结构化和非结构化的数据挖掘软件尚不多,相应的算法相对还较少。从另一个角度来说,数据挖掘的分析对象分为两种类型:静态数据和数据流(data stream)数据。现在的多数数据挖掘算法是用于分析静态数据的。
数据挖掘的分析
无论要分析的数据对象的类型如何,常用的数据挖掘分析包括关联分析、序列分析、分类、预测、聚类分析以及时间序列分析等。
关联分析 关联分析是由Rakesh Apwal等人首先提出的。两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阀值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是事件发生的概率和条件概率应该符合一定的统计意义。
本文来自中国科教评价网 共2页: 1 [2] 下一页 论文出处(作者):
提升商业服务企业客户价值之我见
物流企业专业化经营模式探讨