论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
粗集方法在KDD系统中的应用与研究
周波
【摘 要】本文论述了粗集方法性质及特点,提出了粗集方法在KDD系统中的应用模型,同时给出了应用这一模型对一个数据库实例进行数据挖掘的过程。另外,从精确性、鲁棒性等方面对KDD系统中的粗集方法的适用范围进行了分析。
【关键词】粗集 KDD 数据挖掘
Application and Research of Rough Set in KDD System
Zhou bo
(Multimedia Technology Institute ,Xidian University Xi’an710086)
Abstract: In this paper, we discuss the character of rough set, and put forward the application model of rough set in KDD system. Also, by an example ,the advantage and disadvantage of rough set in KDD system is analysed in detail.
Key Word: Rough Set KDD Data Mining
1.前 言
数据库中的知识发现技术(Knowledge Discovery in Database, KDD)是随着数据库和人工智能的发展而产生的,它是“从大量数据中提取出可信的、新颖的、有效的并能被人理解的模式的非平凡过程”。通过KDD,人们可以将知识发现的研究成果应用于实际数据处理中,为科学决策提供支持。KDD系统中的知识学习阶段被称为“数据挖掘”(Data Mining,DM),它的算法是KDD系统的核心。近年来,粗集理论(Rough Set Theory)开始逐渐应用到DM的领域中,在对大型数据库中不完整数据进行分析和学习方面取得了显著的效果,因此,以粗集为代表的集合论方法是今后KDD技术的一个主要研究方向。
2. KDD系统中粗集方法的基本特征
粗集(Rough Set)理论和模糊集(Fuzzy Set)理论都是针对不确定性问题提出的,它们既相互独立,又相互补充。粗集方法与传统的统计及模糊集方法不同的是:后者需要依赖先验知识对不确定性的定量描述,如统计分析中的先验概率、模糊集理论中的模糊度等等;而前者只依赖数据内部的知识,用数据之间的近似来表示知识的不确定性。用粗集来处理不确定性问题的最大优点在于