浅论网络环境下用户标注的价值与应用网(3)
2013-07-30 01:03
导读:3 标注的应用 传统下的标注以自标自用为主,其应用多是为方便自己日后的检索或使用,有一种做备忘录的性质。在网络环境下,标注的应用突破了这些局
3 标注的应用 传统下的标注以自标自用为主,其应用多是为方便自己日后的检索或使用,有一种做备忘录的性质。在网络环境下,标注的应用突破了这些局限,在更大的范围内得到了更广泛的应用。
3.1 利用标注组织资源
用标签作为元数据组织资源,代替关键词的功能,这是目前标注最普遍的应用,网上流行的大众标注(folksonomy)就是根据这一原理形成的。这种方法最初是随着美味书签的出现和发展而逐步发展起来的,它摒弃了传统分类法事先分类、专家分类的原则,采用由资源使用者为资源提供关键词,根据这些关键词来聚类资源的方式。这种资源组织方法一方面方便了用户,用户无需了解专业的、自己不熟悉的分类体系;另一方面,它利用集体智慧组织资源,形成的分类结果更贴近用户的使用习惯,对用户更具有现实意义。当资源数量巨大,专业人员无法完成对资源的组织时,这种由用户自发分类的方式更有效。当然,这种完全自由式的资源组织方式存在着一些先天的不足,如一词多义、一义多词、垃圾标签等问题,人们也在探求如何对之进行改进,希望能够克服这些不足,同时又不损害其原有的特色。
3.2 利用标注改进资源组织工具 标注不仅仅可以直接用来组织资源,还可以用来改善现有的资源组织工具和组织方法。在这方面,最直接的应用是将标注与其他资源描述、组织工具或方法进行整合,共同完成对资源的组织和检索。例如,将表达同一概念的不同形式的标签关联起来,作为对正规的主题词的补充,以此来改善检索效果。Melanie Aumharnmer等人还尝试将标签与自发语义(emergent semantics)整合,以实现对非文本型资源(图像资源)进行更准确的检索。
利用标注来生成描述资源的语义模型或本体是这方面的又一个应用。传统环境下,本体是预定义的,由专业人员预先完体的构建,然后将构建好的本体应用到具体的资源上,这种方式实现起来构建难度大且更新困难,由于构建者、使用者和检索者对概念的理解不同而产生偏差,也使构建出来的本体与本体所描述的资源之间存在一定的距离。鉴于此,有人开始尝试利用标注来自动构建本体,这种本体是通过收集用户对资源的描述形成的,因此更贴近资源的实际内容和使用者的习惯,同时它的创建和更新更加容易。
3.3 利用标注实现异构资源的整合 用户一直渴望以一种透明的、统一的方式来检索不同来源、不同结构、不同类型的资源,因此,对异构资源的整合一直是信息服务领域关注的焦点之一,也出现了多种整合异构资源的方法。传统的资源整合方法要求被整合的异构资源有本地或全局结构框架,但是一些数据无法满足这一要求,因此难以用传统的方法进行整合。针对这一问题,MichaelGertzi和Kai-Uwe Sattler等人尝试使用标注来实现异构资源的整合,科研人员可以对资源进行标注,通过标注将那些可以通过Web存取的数据在不同的细粒度上与相应的概念链接。这样,被标注数据成为这些概念的实例,为用户提供了一种通过整合、透明方式来查询分布数据的框架。
3.4 利用标注进行协同过滤和推荐 通过对大量标注的聚类和内容分析,可以划分用户(标注者)群体、资源群体,从而实现协同过滤和推荐。
如果能够在信息过滤的过程中加入人工干预,那么这个过滤过程会更有效。基于这一理念,施乐公司帕洛阿尔托研究中心的研究人员开发了实验性的邮件系统Tapestry,它记录人们在阅读文档时的各种反应(用户通过标注来表现这种反应),通过这种记录来彼此帮助,共同完成过滤。
(科教范文网 lw.nseaC.Com编辑发布) 当前,在许多支持标签的Web网站上,都提供了利用标注进行推荐的功能:一种是大众式推荐,根据标签的数量计算出热门标签,以标签云图的形式展现给用户;另一种是专门式推荐,当用户标注了一定的资源之后,系统会根据用户给予资源的标签计算出用户的兴趣领域,同时根据其他用户的标注行为计算出属于该兴趣领域的资源,将它推荐给特定的用户。
4 结语 标注并非一种新生事物,但数字和网络环境为这种古老而传统的事物赋予了新的生命力,使它具有了新的价值和应用领域。当然,和任何事物一样,标注也并非十全十美,它仍然存在着很多问题,如为吸引眼球、推销商品、发泄情绪而制造的垃圾标注,标注的质量问题,不负责任的标注会误导用户对资源的理解和使用等方面。随着标注应用的日益广泛,会暴露出越来越多的问题。因此,在研究如何应用标注、发挥其价值的同时,需要关注这些问题,这样才能够更有效地发挥标注的价值。