计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

试析基于关键词集合的知识关联网络构建(2)

2014-04-23 01:27
导读:但技术上现实可行,能够较好地表达知识间的关系. 基于关键词集合构建关联网络所遵循的原理是:设n个知识点具有共同的关键词集合S,则这n个知识点均是
但技术上现实可行,能够较好地表达知识间的关系.

    基于关键词集合构建关联网络所遵循的原理是:设n个知识点具有共同的关键词集合S,则这n个知识点均是互相关联的;将各知识点作为点,关联关系作为有向边,可以绘制基于关键词集合S的有向完全图G;将KMS中的关键词按特定策略划分为集合,并综合各关键词集合,根据算法画出有向完全图,可以得到该关键词集合划分策略下的完整知识关联网络.

  2.2健词集合及其划分策略

    关键词是用户在编辑知识时为每个知识点设置的,一般用于知识检索,本文则关注应用关键词集合构建知识关联网络的思想与算法.关键词集合指包含了1个或多个关键词的集合.关键词集合所包含的关键词内容与数量如何设置,取决于知识关联所遵循的关键词集合划分策略.本文涉及的三种划分策略分别是单关键词集合策略、全关健词集合策略和不定关键词集合策略.

    在单关键词集合策略下,每个关键词集合S只拥有一个关键词w;,该集合S‘对应知识点集合戊}k,,k2,-..,k,},这些知识点均含有关键词,、.设知识点k,具有关键词、,,,,,…,二r,基于此策略设置知识关联时,k,会把与关键词集合S,,SZ,...,5:匹配的知识点集合K,K‘中的全部知识点链接进来,并剔除其中的重复部分.如图2所示,6个含有关键词“学生”的知识点以单关键词集合{学生}为制图策略构成了有向完全图,也就是这6个知识点基于“学生”关键词的知识关联网络.

   在全关键词集合策略下,全关键词集合s;包含了知识点k:所具有的所有关键词,k:只把与全关键词集合S;wl,叨2,…,,r匹配的知识点集合K;中的知识链接进来.使用该策略获取的知识结果的相关度比使用单关键词策略要高.

   在不定关键词集合策略下,需人工确定关键词集合中所包含的关键词,此方式无法实现全自动知识关联,不适合在大型知识库系统中采用. (科教作文网http://zw.NSEaC.com编辑发布)
    由全关键词策略或不定关键词策略获得的结果集是单关键词集合策略结果集的子集,获得的知识关联网络图是基于单关键词集合策略获得的知识网络图的子图.在实际应用中,宜采用全关键词集合策略与单关键词集合策略相结合的方式,在知识点关联展示的时候分两组按不同的优先级展示.首先展示优先级最高的按全关键词集合策略得出的关联知识点集合,该集合中的知识与当前知识点的相关度最高;其次才展示单关键词集合策略得出的结果集.本文讨论的算法均基于这两种策略相结合的方式.

  2. 3以关键词集合为迭代单元的关联网络算法

    计算知识关联网络可以用关键词集合作为迭代单元循环进行或者仅针对单个知识点进行.这两种方式在KMS中各有优势,分别适合不同的场景在为数量较多的知识点构建关联网络时,首选以关键词集合为迭代单元进行计算,算法描述如下.

    1)设需要计算关联网络的知识范围中有P个知识点k, , k2,…,kP,任意知识点气均对应一个点v;,把所有的点绘制在图‘<V, E>中,v;与k}一一对应.

    2)分拣出KMS中所有种类的关键词w‑w2.wn,记录KMS中所有关键词集合的信息获得关键词集合S, ,52,.. Sn ... S9(包含所有的单关键词集合与全关键词集合),同时获得与任意关键词集合S.相匹配的知识点集合K;.

    3)逐个扫描关键词集合S, ,52, ,59,优先扫描其中的全关键词集合(这样可以确保每条知识后的关联信息优先展示关键字相关度最高的链接),记录当前关键词集合S,所对应的知识点集合Kl,记录知识点集合K中所包含的每个知识点元素k;,在图中与K对应的点集合的所有元素间作有向完全子图,在画边e};、eji时,在系统内知识点k、后加人知识点匆的链接,在知识点k;后加人k‘的链接·如果边已存在,则跳过,每画一条边,计数器c累加1.扫描完K9后,循环结束.

    4)程序绘制的图<V, E>就是P个知识点根据关键词集合S‑S2,S。构建的知识关联网络图,。是知识关联网络所具有的知识关联数量.该算法的复杂度是。(n2).

    如图3所示,在一个具有7个知识点的示例系统中,算法先根据单关键字集合S,{经济学}进行绘图,其次根据单关键字集合管理学进行绘图.“管理经济学”知识点因为同时具有管理学、经济学两个关键词,因此同时处于左、右两个有向完全子图中.图3就是这7个知识点根据2个单关键字集合所绘制的知识关联网络.

  2. 4针对单个知识点的关联网络算法

    对于任意一个知识点k;设该矢识点拥有个关键词,首先扫描全关键词集合Sr十,{w},w2,…,、:},再逐个扫描关键词二:所对应的关键词集合S,在每一轮扫描中将当前集合所对应的知识点集合凡,内所有的知识点元素记录在缓存中,扫描到任意知识点乓时,程序绘制两条有向边人知识点的关联,在知识点气后加入的关联如果边ei、ei;已存在或i=J,则跳过,每画一条边,计数器。累加,直到有向完全图绘制完成.

    程序绘制的图就是知识点的相关知识点关联图。是与该知识点相关的所有知识关联数量.该算法的复杂度是口(矿).该算法循环应用在所有知识点上同样也可以得到算法2. 3绘制的整体知识地图,但算法复杂度达到0(矿),因此在为多个知识点建立关联或绘制地图时宜采用2. 3节的算法.2. 4节的算法则适宜针对个别知识点绘制关联网络并建立知识链接时采用.

  3实际应用中需注意的问题

    企业级KMS中知识点数量可能达到1万以上,在应用关键词集合绘制知识关联网络时必须设置范围与条件,一般只分层次、分区域按照相应使用人员群体的权限选择部分知识点进行关联网络绘制.其次,必须严格准确地设定关键词,管理维护关键词,建立系统关键词管理维护机制,同时应制定关键词编辑规范并开发检验程序,限制每个知识点的关键词字数、关键词个数,并提供系统级视图监控系统关键词的使用与分布状况.在 KMS中,应采用关联网络、分类体系、搜索引擎共同协作的方式构建完善的知识地图,这样有助于建立真正意义上的实用知识地图,使知识查阅检索更加方便、快捷、准确.

上一篇:基于xDSL宽带网络测试系统的TL1通信协议设计与实 下一篇:没有了