论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
InFind是一个类似于元搜索引擎的产品,但支持自然语言、模糊检索,可将结果自动去重、聚类,并可返回对所有搜索引擎并发查询的结果,其检索结果根据分类排列。
芝加哥大学人工智能实验室开发的FAQFinder。它是一个具有问答式界面的智能搜索引擎。在获知用户问题后,它查询FAQ文件以给出比较合适的回答。FAQFinder的内核由五个互联联系的技术环节构成:(1)基于统计方法建立FAQ文件。这是由FAQFinder中的工具Smart完成的。(2)用一个由简单名词和动词短语构成的文法树分析用户的查询,以得到一个用于支持内容匹配的描述。(3)问题识别者(QuestionRecognizer)操作文法树以辨识问题从属的类别。(4)使用语义网分析与概念匹配技术,找出与用户查询最近似的问题。(5)FAQFinder将得到的匹配返回给用户。如果没有近似的匹配,则将使用一个启发式的策略。
智能搜索引擎还可以采用协同式检索方法。该方法一般用于一个特定的用户(如一个或一组新闻工作者、一个新闻媒体、一个或一组受众)。协同式方法有时又称为公众学习方法,它将其他用户的反应反馈给当前的用户。系统不去计算分类项目的相似程度,而是计算用户之间的相似程度。协同式方法不分析分类项目的内容。协同式方法一般用于非文本化的数据,如电影、音乐等,但是也有的系统将其用于文本数据的挖掘,如新闻过滤等。已有一些系统用于电子邮件处理、会议时序安排、电子新闻过滤和娱乐节目推荐。
与智能搜索引擎技术相关的还有信息智能“推”技术和个性化检索技术。
基于网民和新闻工作者访问互联网的特点,在用户拉取信息的搜索过程中,根据其输入的关键词,通过机器学习,可以识别和预测其兴趣或偏好,从而有针对性、及时地向网民和新闻工作者主动推送相关知识和最新信息、新闻和新闻线索。推送的形式可采用频道式推送、邮件式推送、网页式推送或专用式推送。目前已有构造Web访问模式树(WAP tree)的算法,可从大量信息访问日志中挖掘用户访问信息的模式。也可从用户访问文档的超链接来预测用户的访问偏好,其知识发现采用关联性法则。
个性化检索要求能够网络信息检索系统能够学习网民和新闻工作者的兴趣、适应其兴趣的变化并提出检索建议。一般采用分布式Agent技术,例如在客户机上运行用户接口Agent,表示用户个性化模式,在服务器上运行信息检索管理Agent,相当于中介信息检索代理服务器,实现与各引擎的交互,用户Agent用户开始一项个性化查询quest,通过与个性化模式库中模式的类比学习,产生净化了的个性化检索模式,提交信息Agent协调模块选择相关信息检索。返回的检索结果通过信息滤波,送交显示模块,新闻工作者和网民通过浏览返回的结果,确认是否为感兴趣的文档,若为感兴趣的文档,就提交相关反馈文档模块并进行聚类,产生个性化模式,同时存入该用户的个性化模式库中,如果用户不满意,也可以将确认结果提交给强化学习模块,进行交互学习,进一步净化检索结果。
1 匡文波。网络媒体概论,清华大学出版社,2001年4月
2 匡文波。网络传播学概论,高等教育出版社,2001年10月