计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

摘要:软件组织内部智慧资产的有效组织和管理(4)

2013-06-07 01:23
导读:4)比较类的权重,将文本分到权重最大的那个类别中。 4实验结果我们对本文提出的知识分类算法进行了实验验证,选用的数据集包括:(1)用手工方式创建

  4)比较类的权重,将文本分到权重最大的那个类别中。
  4实验结果我们对本文提出的知识分类算法进行了实验验证,选用的数据集包括:(1)用手工方式创建的数10项过程经验和个人技能;(2)SWEBOK中所给出的169篇参考文献、NASAC2004(全国软件与应用学术会议)的197篇以及从美国CMU大学提供了935篇计算机科研论文数据,算法性能的评价则采用精确度和召回率以及结合两者的FlMeasure。
  对于训练集和测试集的选择,其方法如下:将这些数据集按照所属类别进行手工分类,然后平均分成十份,选择其中九份作为训练集,选择其中一份作为测试集。运行分类算法,共执行10次分类操作,计算其平均值,实验结果如表1所示。
  知识类型准确率召剧率FI度量过程经验100% 100% 100%个人技能100% 100% 100%知识制品879%8208%84.38%观察表1的结果数据,我们可以发现过程经验和个人技能的分类准确率、召回率和F1度量值都很高(皆为100%)。
  通过定性分析我们可以得知产生这种现象的原因:这两种类型的软件工程知识皆采用了直接映射的分类算法。输出很好的分类效果是必然的。对于知识制品来说,它的F1度量值也超过了84%.这表明以SWEBOK为骨干分类树来进行软件工程知识的组织和分类是可行,旦采用文本分类算法进行知识制品的分类也是行之有效的。
  5结论
  软件组织内部智慧资产的有效组织和管理仍旧是一个开放的课题,就目前来看尚未有一个银弹(Silver Bullet)以解决这个问题。本文的创新之处就在于将文本分类技术引入到软件工程领域。以SWEBOK作为骨干分类体系,为软件工程知识的自动分类提供了一种新的解决途径,并通过实验验证了所提出的模型和算法的有效性。
  事实上,文本分类的技术和方法是通用的,本文提出的模型和算法也是通用的,如果我们将SWEBOK骨干分类体系换作其他领域的分类体系,将过程经验模板和个人经验模板换作其他模板,则可以构造一个面向其他领域的知识分类器。
(转载自http://zw.nseac.coM科教作文网)

  就软件组织来说,其内部智慧资产的规模远没有Web上的资源那样巨大。但是它对分类的准确率和召回率的要求却非常高。就目前来说,改进算法仍然是提高分类准确率和召回率的最为有效的途径。因此,我们下一步的工作就是通过引入更为综合的特征赋权函数、改进特征选择算法和通过对领域知识的运用以改进分类算法等,来迸~步提高其分类的性能。此外,在更大规模知识集上的训练和测试也是我们努力的方向。

上一篇:摘要: 简述了我国建筑工程造价的发展过程, 下一篇:没有了