基于粗糙集的人力资源评价的规则挖掘(1)
2014-06-25 01:03
导读:计算机应用论文论文,基于粗糙集的人力资源评价的规则挖掘(1)在线阅读,教你怎么写,格式什么样,科教论文网提供各种参考范例:
摘 要 应用粗糙集理论和区分矩阵来挖掘各因素规则的方法对一
摘 要 应用粗糙集理论和区分矩阵来挖掘各因素规则的方法对一个人力资源评价的例子进行分析和处理,挖掘评价规则,并从客观的数据中得出了各主要因素的客观权重。 关键词 粗糙集; 人力资源; 规则; 权重 1 前言 粗糙集(Rough sets)理论是一种处理模糊、不精确的分类问题的新型
数学工具。粗糙集理论已成为当前数据挖掘的主要方法之一,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。该理论已被成功地应用于机器学习、决策分析、过程控制、模式识别与数据挖掘领域。 人力资源是指社会所拥有的能为社会创造价值的人力或劳动力,其本质是人的能力而不是人本身,人力资源的价值在于人掌握的知识和技能,在于人为社会创造价值的能力。人力资源评价就是通过分析影响人力资源价值的主要因素,结合一定的评价方法,进而得出一个综合评价值的过程。2 粗糙集处理的基本步骤及算法 ⑴ 收集和整理数据,组成信息表。 ⑵ 数据预处理。将数据库中的初始数据信息进行分类、聚类分析以及使某些属性的连续值离散化,转换为粗糙集形式,明确条件属性和决策属性。 ⑶ 属性约简,根据预处理后的数据信息表生成区分矩阵,利用区分矩阵法生成约简属性集。区分矩阵(Discernibility Matrix)是由波兰华沙大学的著名数学家skowron提出来的,是近年来在粗糙集约简上出现的一个有力工具。利用这个工具,可以将存在于复杂的信息系统中的全部不可区分关系表达出来。 定义1:设有信息系统S,a(
x)是记录
x在属性a上的值cij表示区分矩阵中第i行,第j列的元素,这样区分矩阵的定义是:(cij)=

其中i,j=1,2,3,…,n,这里n=

。 在获得区分矩阵的时候,还有一种情况没有列出来,就是a(
xi)=a(
xj),D(
xi)≠D(
xj)的情况,在有些资料中,将这种情况下的cij赋了一个-1;有些则不讨论这种情况,因为他们认为在数据表的预处理阶段会对数据表中冲突的记录做处理,使其不加入到数据中,并且将冲突的记录数除以记录总数,得到一个粗糙度的量度,该量度可以作为数据表的一个特征。本文遵从后一种处理方法,对冲突的记录不予讨论,认为数据表中没有冲突的记录。 定义2:区分函数是从区分矩阵中构造的,方法是把cij的每个属性“或”起来,然后再“与”其所有的cij,其中i,j=1,…,

,用p来表示。 区分矩阵是一个对称

×

矩阵。在实际应用中,只计算它的上三角矩阵或下三角矩阵。 根据区分矩阵的概念,有三点值得注意: ① 区分矩阵中条件属性组合数为1的元素项,即Card(cij)=1,表明除该属性外其余条件属性无法将决策不同的两条记录区分开来,即该属性必须保留,这个与决策表中核的概念一致。因此,矩阵中所有条件属性组合数为1的属性均为核属性。 ② 区分矩阵中凡是条件属性组合中包含有核属性的矩阵元素都可以仅用核属性就把决策不同的记录区分开来,也就是说属性组合中凡是包含有核属性的区分矩阵项的其它条件属性都是多余的。 ③ 对于不包含核属性的属性组合必然每个组合都至少有一个元素成为约简后的一个条件属性,否则决策表中的某些记录将无法识别。属性约简的基本过程如下: 第一步:生成区分矩阵,将矩阵中属性组合数为1的属性列入最终的属性约简集合,即Red=Core={ cij∣Card(cij)=1,i,j=1,2,3,…,

}。 第二步:从区分矩阵中找出所有不包含核属性且cij≠0属性组合Q,即:Q={ cij∣cij∩Core=ф,且cij≠0,i,j=1,2,3,…,