实用分类系统及其实现方法(1)(2)
2015-02-13 01:00
导读:透彻理解ontology对技术操作的指导意义和掌握大量的素材是编制实用分类系统的前提,此外,在编制时还要有步骤地进行。一般而言,构造和设计实用分类
透彻理解ontology对技术操作的指导意义和掌握大量的素材是编制实用分类系统的前提,此外,在编制时还要有步骤地进行。一般而言,构造和设计实用分类系统有下面几个步骤。如图2所示[7]。
首先,要确定实用分类系统的目的和范围。即所研究的领域和范围领域越大,所建实用分类系统越大。一般而言有三种实用分类系统,如图3所示[7]。
不同的领域可以构建不同的实用分类系统,即使是同一个领域内,实用分类系统也有不同的层次;而我们研究目的的不同也决定着实用分类系统的大小。比如在数字图书馆的建设中,基于文本文献的实用分类系统是一个层次,基于XML的多媒体信息的实用分类系统是一个层次,而基于对数字图书馆全程知识管理的实用分类系统又是一个层次。目的和范围的不同决定我们将建立一个怎样的体系,以及在建立这个体系的过程中将花多少成本,而这一系统将来能发挥多大作用[8]。
其次,进行实用分类系统分析。构建实用分类系统的核心是建立概念间的等级结构及定义概念属性,从而利用逻辑推理来推导概念之间的关系。这需要专家的参与,在专家的指导下,确定领域内该分类系统建立的可行性。而专家对该领域了解得深入程度将直接影响到所建立实用分类系统的完善程度。
第三,实用分类系统的表示。一般用语义模型(或语义网络)来表示实用分类系统,在语义模型(语义网络)中,每个结点表示一个概念,而结点之间的连接表示概念之间的关系。
第四,实用分类系统的检验。要建立清晰、一致、完整、可扩展的实用分类系统,就要求系统中的术语无歧义,系统中的术语间保持一致的逻辑关系,系统中的概念和关系应是统一完整的,并且在系统中可以随时加入该领域的新概念[9]。
(科教范文网 fw.nseac.com编辑发布) 第五,对所建立的系统应进行检验。符合标准的以数据形式存放,否则,重新进行系统分析。
4 主要应用的设计方法
现在关于实用分类系统的构造设计方法主要有两种:一是利用已有的叙词表或分类词表来改造成实用分类系统;二是利用现有文献和领域专家从头做起。进入联网时代以来,在许多大型的数据库中产生了众多现在仍在使用的叙词表。一般认为在大的知识领域中建立实用分类系统是一件费时费力费钱的工作,而以原有知识领域已经建好的叙词表(或分类表)的概念结构为基础,往上扩充概念特性、关系等成分,对于构造设计实用分类系统可取得事半功倍的效果[10]。美国的联合医学语、系统元词表(Unified Medical Language Systern Metathesaurus简称UMLSM)中包含的超级叙词表(superthesaurus)便是一个很好的例子。超级叙词表2001年版收集了60多种生物医学源词表(其中部分为多语种)中的约80万个概念和约190万个名称。超级叙词表以概念或涵义来组织,同一概念的不同名称(如同义词、词语变体和译文)被链接在一起,每一个概念都有一定的属性以限定其涵义。这些属性有:所属语义类型、在各种源词表等级关系中的位置等,许多概念还有一个定义,同时还显示出不同概念间的各种关系,其中一部分关系源于来源词表,一部分关系在编制超级叙词表时产生。绝大多数词间关系与相应的概念链接。在此基础上,UMLS通过134种语义类型为超级叙词表中所有概念提出了一个统一的分类体系,语义类型之间的54种链接展示了实用分类系统的结构并显示出在生物医学领域内的重要关系,在超级叙词表中可以找到指定概念的所有信息[11]。
实用分类系统构造的另一种方法是利用现有的文献和领域专家(Domain EXperts)来设计和编制。现阶段实用分类系统的建立仍然处在注重技术的水平上,而未达到建立大型工程所要求的完善程度。多种研究方法虽久经考验,但是建立一种普适性的Ontology的标准仍未出现。尽管如此,有关方面技术的进展已经为建立专有领域的实用分类系统铺就了道路。Ontology研究现在局限于集中的或少数研究小组的圈子里,随着人们对语义网兴趣的增加,新的开发环境和设计思路会不断涌现,但充分开发对各个领域谙熟的领域专家的知识与技术潜能,对于建立各领域的不同层次的Ontology显然仍具有重要的指导意义。作为语义网的主干技术,Ontology研究在人工智能、计算语言、数据原理等方面有着广阔的前景。其中建立知识表示和知识管理的实用分类系统备受关注。可以预计实用分类系统(Ontology)在以统一的智能化来实现智能化的统一的过程中必将带来新的革命。
【参考文献】
(科教作文网http://zw.ΝsΕAc.com发布)
1 RICHARD BENJAMINS,V.;FENSEL,DIETER;DECKER,STEFAN;PEREZ,ASUNCIóN GóMEZ.Building Ontology for the Internet:a midterm report[EB/OL].International Journal of Humancomputer studies.Volume:51,Issue:3,September,1999.687-712.available at:http://elsevier.lib.sjtu.edu.cn/,2004-05-15
2 W3c.(2002).Requirements For a Web Ontology Language[DB/OL].On-line.Available at:<http://www.w3c.org/TR/2002/WD-webout-req-20020307/>,2004-05-15.
3 秦健.实用分类系统与语义网:发展现状和研究课题[J].现代图书情报技术,2004,(1):16-23.
4 Klein,M.Fensel,D.,Van Harmelen,F.,& Horrocks,I(2001).The relation between ontologies and XML schemas[EB/OL].Computer and Information Science,On-line,V.6.available at:<http://www.ida.liu.se/ext/epa/cis/2001/004/tcover.html>,2004-05-15.
5 王军.UISION:集成分类法、主题分类法和语义元数据的概念网络[J].
情报学报,200,(3):412-418.
6 Kathleen Dahlgren.A Linguistic Ontology[DB/OL].Int.J.Human-Computer Studies(1995)43,809-818 available at:http://elsevier.lib.sjtu.edu.cn/cgi-bin/search.pl?collection=journals&GetSearchResults=Search&fields=Any&search_field=A+Linguistic+Ontology&x=30&y=17,2004-05-15.
7 董慧.基于本体论和数字图书馆的信息检索[J].情报学报,2003,(12):648-652.
8 NICOL GUARINO.Understanding、building and using ontologies[DB/OL].Int.J.Human-Computer Studies(1997)46,293-310available at:http://elsevier.lib.sjtu.edu.cn/cgi-bin/search.pl?collection=journals&GetSearchResults=Search&fields=Any& search_field=+ontology+1997&x=17&y=22,2004-05-15.
9 常春.Ontology在信息管理领域的研究背景[J].现代图书情报技术,2003,(6):4-7.
10 Mehrnoush Shamsfard,Ahmad Abdollahzadeh Barforoush.Learning ontologies from natural language texts[DB/OL].Int.J.Human-Computer Studies 60(2004)17-63 available at:http://elsevier.lib.sjtu.edu.cn/cgi-bin/search.pl?collection=journals&GetSearchResults=Search&fields=Any&search_field=Learning+ontologies+from+natural+language+texts&x=15&y=17,2004-05-15
(科教论文网 lw.nseaC.Com编辑发布)
11 焦玉英、李法运.网络环境下信息检索语言的优化研究[J].图书情报工作,2003,(6):291-296.
共2页: 2
论文出处(作者):