计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

基于粗糙集的人力资源评价的规则挖掘(1)(2)

2014-06-25 01:03
导读:} 第三步:将所有不包含核属性的条件属性组合表示为合取范式的形式,即:P=∧(∨cij),cij∈Q。 第四步:将P转换为析取范式的形式,并进行化简。
} 第三步:将所有不包含核属性的条件属性组合表示为合取范式的形式,即:P=∧(∨cij),cij∈Q。 第四步:将P转换为析取范式的形式,并进行化简。 第五步:根据需要选择不同的属性组合作为约简。 ⑷ 选取约简属性后的信息表,对每个规则求出其核属性,得到各规则的核值。 定义:具有相同条件属性而有不同决策属性的对象成为不可分辨的对象。 基本思想:考虑依次去掉各个属性,若存在不可分辨对象,则说明该属性为必要属性,即核值。若去掉该属性时,无不可分辨对象,则说明该属性为冗余属性,可省略。 ⑸ 根据核值表产生约简规则。 基本算法: 输入:信息系统S=(U,C∪D, V, f ) 输出:约简后的决策规则集。 步骤: ① 计算区分矩阵;int i=1,j=0; int k=card(U); M=Φ; while(1≤i≤k) for(i=0;i ;i≤k) for(j=i 1;j ;j≤k) if (D(xi) D(xj)) mij={a C:a(xi) a(xj)} else M=M ∪{mij} ② 得到CORE;i=1;CORED(C)=Φ;从头取M中元素,若为单一属性组合则将该属性加入CORED(C), ③ 进行属性约简从M中删除含有核属性的组合。Q={ cij∣cij∩CORED(C)=Φ,且cij≠0}P=∧(∨cij)将P转换为析取范式的形式 P=∨(∧ci*)ci*为约简的属性集合 ④ 一约简的属性集合ci*,对每一个规则求核属性 for(j=1;j ;j≤m)  (m 为每个规则的属性个数)  每次假设从规则中去掉一个属性aj  if 不存在不可分辨的规则     then 去掉该属性  else aj为该规则的属性核值 ⑤ 根据每一规则的核值,列出约简的规则集合。若对每一个对应的决策值该规则组合是既约的且在系统中为真时为约简规则。 ⑹ 求出各约简属性的权重。 通常情况下,决策者会拥有对各个条件属性的先验知识,权重用来衡量属性的相对重要性。在不同的决策环境下,相同的属性对决策输出会有不同的影响,即权重对环境敏感。粗集理论中的属性重要度表达了当前数据环境下属性对决策的影响,但它不能反映决策者的先验知识。因此,将二者结合起来确定属性的权重可以得到比较理想的结果。这样我们将粗集理论同决策者的先验知识结合起来,即将由大量的历史数据确定出来的客观的属性重要度同由主观的先验知识确定的属性权重结合起来确定最终的综合权重,从而实现主观先验知识同客观情况的统一。 我们假设系统中的条件属性为C,决策属性为D。在C中有n个属性a1,a2,…,an。由决策者先验知识给定的权重分别为p(a1), p(a2), …, p(an)。然后收集大量的评价样本,由这些样本数据来考察所有条件属性将样本划分为决策类的分类能力,并由决策属性对条件属性的依赖度rC(D)=Card(posC(D))/Card(U),其中Card表示集合的基数。然后去掉条件属性i后,在重新考虑分类情况,求出rC-i(D)=Card(posC-i(D))/Card(U),则属性i的重要度为rC(D)-rC-i(D),以此类推。在此基础上将各个属性的重要度进行归一化处理并把处理后的结果q(ai)作为属性i的客观权重。即q(ai)= 。显然,q(ai)在0和1之间取值。得到各个属性的主观和客观权重后,由于客观权重是由历史数据处理后得到的,我们赋予其较大的权重为60%,相应地,赋予主观权重为40%,那么,由此确定的综合权重P(ai)=0.6×p(ai) 0.4×q(ai)。3 应用实例 ⑴ 数据采集。在人力资源评价中,各属性值用3,2,1分别表示“优,中,差”。