信息检索的发展和问题

摘要。现代信息检索技术经历了由低级到高级的发展过程。目前正朝着多元化的方向发展。主要从信息检索的智能化、专业化、可视化、一站式及基于网格的5个方面来介绍现代信息检索技术的发展趋势。

随着信息技术的发展和用户检索需求的变化,现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。本文探讨了现代信息检索技术发展趋势,从智能化、个性化、一站式、可视化四个方面进行了分析,对检索技术发展趋势展开了一定的探讨。

关键词:信息检索;智能化;个性化;一站式;可视化

信息检索技术经过先组式索引检索、穿孔卡片检索、缩微胶卷检索、脱机批处理检索发展到今天的联机检索、光盘检索、网络检索等。其发展经历了由低级到高级的过程、传统的线性检索向超文本支持的非线性检索发展。这主要依赖于信息技术的发展和信息用户的信息检索需求。这些始终是推动现代信息检索理论与技术发展的重要动力。那么,现代信息检索技术的发展趋势将来如何呢。而要对信息检索技术的发展作出成功的预测是十分困难的。但是可以在广泛调研、比较、分析的基础上把握其某些发展动态,发现一些影响现代信息检索技术发展的新变化、新技术、新理念。

1智能化信息检索

智能化信息检索是人们把人工智能与信息检索技术结合起来应用于信息存取领域的成果。近年来internet上不断涌现的人工智能产品。比如智能搜索引擎、智能浏览器、智能代理、知识共享智能体等。都将大大提高信息存取系统的智能化程度。智能化信息检索是当今信息检索技术研究的热点问题之一。也是未来信息检索主要的发展方向。智能化信息检索是基于自然语言的检索形式.机器根据用户所提供的自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,它能够代替或辅助用户完成诸如选词、选库、构造检索式。甚至在数据库中进行自动推理查找等功能;系统对知识库检索推理的结果。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息存取系统。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预.这意味着用户将彻底从繁琐的规则中解脱出来。它是人工智能与检索技术的有机结合。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。ibm的最新研究的检索系统piquant能够基于对问题回答来完成用户的检索要求。piquant能分析文章的语义结构,并揭示其没有显示的表现出来的知识。ibm研究人员演示了在pinquant中提问“谁是加拿大总理。”。系统准确地找到了回答这个问题的文章,虽然在这篇文章中没有显示的提到我们提问中的单词。

提高信息检索的智能化是信息检索所致力于实现的一个重要特征,它包含2个方面的含义:一是用户检索需求理解的智能化。比如askjeeve,answerbus(http://www.answerbus.corn)等等;二是检索过程的智能化。比如著名的搜索引擎altavista所开设的“askaltavista”就有这种智能化检索技术,能够综合用户在一次次的检索结果选择中的取舍,自我学习并进行推理,使自己变得更聪明,从而调整其检索策略,完善检索效果。

人工智能与信息检索技术的结合,将使检索工具更高级易用、更加智能化、个性化和人性化,也使得检索结果更加符合人们的需求,但是因为人工智能本身还处在发展和研究之中.使得现在的检索工具还没有具备完全的智能化.要真正

实现两者的结合的各项优势,还有待研究和改进。因而,检索工具的智能化在未来还具有相当的发展潜力。有关智能检索技术的研究.将为信息检索技术的发展带来革命性的飞跃。也是未来网络信息检索的一个发展方向。

2可视化信息检索

据研究。人们获取的信息70%来自视觉,20%来自听觉,10%来自触觉。因此,人类是非常适应可视信息的。可视的图像较容易记忆,而且在传达某种信息时比任何方式都快且更有效,因而可视化检索具有自己独特的优势。可视化信息检索包含2个方面:一个是检索过程的可视化,另一个是检索结果的可视化。检索过程的可视化是指用户在检索过程中各检索对象之间的关系以可视化的形式展现在用户面前.用户顺着可视化的检索画面一步一步地发现检索结果。斯坦福大学的高线出版社(hi曲wirepress)推出的主题地图(topicmap)就是一种可视化检索环境,它总共包括54149个主题.按学科分类.并按学科之间的关系构成主题树.用户可以可视化地看到学科与学科之间的关系,以及每一个学科下子学科的数目,用户通过拖动鼠标来选择自己感兴趣的主题.最后显示在每一等级主题下的论文数目。

相对于其他的信息检索技术,可视化信息检索技术的好处有:对文献或检索式内部语义关系的理解,有助于用户判断一个检索中的相关文献;一个透明的检索过程使检索更容易、有效,即视觉过程寓于检索过程中是可视化的核心;一个可视化的环境为用户展示更丰富、更直观的信息。相关性在传统的信息检索中指检索结果与检索式相关.而在可视化检索中指检索结果之间的相关度:它具有开发新的检索系统的潜力;它引入了人的认知能力:使得用户可以进行交互式输入,允许在信息空间进行动态移动,允许用户修改数据的展示方式。使他们理解数据的个人偏好可视化;减少了理解检索结果的时间。可对相关的信息进行聚类分析。而聚类分析可帮助人们发现新的学科点,也可作为反馈的工具:提供对检索的有效的反馈机制;提高检索的准确度:帮助和提高检索系统与人之间的交互性:检索结果可以模仿网络环境形成拓扑图.在拓扑图中所有的相似文献或其它类型资源将被归为同类。以等高线来表达与其它信息内容在概念上的远近,cartia的themescape便是基于概念图谱运用的例子之一。

总之,可视化技术缩短了用户理解信息的时间.提供了感觉与思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息存取系统,如opac和搜索引擎。尽管目前成熟的、商业化的可视化信息存取系统还未问世,但随着网络技术的发展。以及xml,rdf,ontology,grid在信息组织、构架中的应用.可视化检索的优势将越来越突出.成为现代检索技术的发展方向之

3一站式信息检索

目前的信息检索系统比如搜索引擎大都是在甲网站找图片,到乙网站找新闻,再到丙网站找股票资讯等等,十分麻烦且浪费时间。如何将这些图片、新闻、股票等等各种相关联的信息整合到同一界面,让intemet用户一次查询,全部满足用户的查询要求,这就必须引入一站式(onestop)信息检索技术,它使得信息用户在搜索时只需输入一次查询目标,即可在同一界面得到各种有关联的查询结果。一站式信息检索能够使用户通过一个检索工具满足自己所有的信息检索需求。一站式信息检索将是未来信息检索服务的一种发展模式。一站式信息检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。

4个性化信息检索

信息时代的一个很大特点就是个性化,不同的人有不同的检索习惯.对检索界面也会有不同的要求:由于人们对词义的不同理解及感兴趣的领域不同,不同的用户对相同的检索结果往往会有不同的评价。随着信息资源的指数级膨胀。不同的打有消费者个人烙印的产品将成为某个消费者区别他人、感觉自我存在及独特的外在标志,也真正体现了个性化信息检索以用户为中心的服务理念。因此现代信息存取技术将来也要满足用户个性化的需求。个性化信息检索主要体现在以下2个方面:

1允许信息用户的个性化定制。通过“person—alization”选项.用户可以在一定程度上改变检索结果显示的格式.用户还可以预选择自己的信息源,向各种用户自身满意的信息源提问,索取特定类型的信息,并且用户还能对命中结果进行进一步限定,要求仅提供权威性的可靠结果.从而提高查准率,分辨和满足不同用户不同检索需要的功能,甚至还能理解不同用户的不同工作风格。在应用中表现为信息用户的基本定制和高级定制。

2基于数据挖掘技术对信息用户的检索行为进行分析.挖掘出信息用户的检索需求,利用推送技术(push)主动向用户推送所需要的信息资源。例如,专业性搜索引擎中的dejanews具备个性化检索和自动跟踪功能,当用户使用了dejanews提供的查询功能后.在返回的结果中点击“trackthissearchforme”。以后每当有新的文章满足用户的查询条件时,系统将通过电子邮件自动通知用户。

总之,现代信息检索技术的发展趋势必将以信息技术的发展和信息用户的信息检索需求为出发.在理念、人性化、智能化等方面取得全面突破,不断吸收信息技术上的最新成果和理解人们的需求。逐渐适应人脑的思维方式,实现智能、高效、快速而灵活的信息检索,最后达到随心所欲地查找、迅速获取所需信息的水平。从而促进人们对无序信息世界的有序化组织,令信息资源得到更为合理的开发和利用,以一个崭新的面貌出现在人们面前。参考文献:

[1】

苏新宁主编.信息检索理论与技术.北京:科学技术文献出版社.2004[2】

熊回香.网络信息检索及其发展趋势研究.华中师范大学硕士学位论文.2003【3】

黄如花.网络信息检索的发展趋势.图书情报知识,2002(8)

第二篇:浅析网络信息检索存在的问题和发展方向信息检索结课论文

信息检索结课论文

浅析网络信息检索存在的问题和发展方向

摘要。21世纪是以信息技术为核心的知识经济时代,先进的信息作用于各个行业,网络信息检索是目前发展最为迅速,最受人欢迎的信息检索,在互联网上人们轻易地从浩如烟海的信息世界里可以找到自己所需的信息。本文就网络1

信息检索结课论文

信息检索中在搜索引擎,资源组织分类,多媒体检索,个性化需求和用户本身方面存在的问题进行了分析,针对这些问题提出了未来网络信息检索技术的智能化、标准化、个性化三大发展方向。

关键词:网络信息检索搜索引擎多媒体检索智能化标准化个性化

随着信息技术的高速发展,信息资源的越来越显得重要,而网络信息资源也逐步成为这个信息时代的核心资源。信息检索技术也很快得到发展,在此网络信息检索随着网络的发展也应运而生。[1]网络信息检索,就是将描述特定用户所需网络信息的提问特征,与信息储存的检索标识进行异同比较,从中找出与提问一致或基本一致的网络信息的过程。相对传统文献检索,网络信息检索显现出了很多的优越性,如不受时间地点的限制,检索方式多样化,多元化等。但是我觉得网络信息检索的发展还不是十分完善,仍存在些问题,如目前检索工具在信息搜集缺乏统一的规范管理,检索过程会出现很多雷同,甚至无用的垃圾信息等。以下从网络信息检索目前存在的问题,及针对问题面临的以后的发展方向进行了探讨。

一、在搜索引擎方面中存在的问题

搜索引擎起着网络导航的作用,在给我们提供方便的同时,也存在一些问题。目前搜索引擎存在缺陷且智能化程度低状况,用户在使用搜索引擎检索信息时,经常会搜索出一些毫不相干的内容,大大降低了检索所需信息的效率。[2]目录式搜索引擎由于人工分类成本高,费时费力,标引速度慢,使得采集信息的速度远远跟不上网络资源的增长速度,这就造成了目录式搜索引擎所建立的数据库规模较小,某些类目下搜集的信息数量有限而且难以随时更新等缺陷,查全率低。关键词式全文搜索引擎采用机器人搜索技术,但是自动标引不完善,虽然数据库更新快,检索功能强,但是信息关联难以控制且重复链接太多,查准率低。例如在百度检索关键词“信息检索”,检索首页会出现“中国信息专利网”、“收费信息检索”“国家知识专利检索”等无用信息。搜索引擎索引库中全部或部分下载的网页中有许多垃圾或暂时信息,影响了索引速度,也浪费了网络通信资源。

二、在信息资源组织分类方面存在的问题

目前有些网站质量差,栏目设置很是混乱,也没有导航措施,内容无特色、陈旧,长期不更新。信息类型庞杂,垃圾、虚假、过时信息等增加了信息的不确定性,造成了信息污染。而且在信息资源的分类组织上都存在着混乱状况,表现在类目划分标准不是很合理,对信息资源在同一层次的划分标准不统一,甚至可能会出现同时用两个或两个以上标准划分的现象。这样就会产生重复和遗漏的现象。而且,有时还会产生不符合基本逻辑的现象,存在整体不能包含局部的现象,我觉得应该明确事物的外延和内涵,在信息分类时做到概念清晰,检索结果力求达到查准率和查全率的恰当的结合。只有这样,才能确实方便我们用户能及时地了解最新的信息,但时有过多的动态信息使信息组织显得没有规律和层次,也会给用户的检索带来不便。

信息检索结课论文

三、在多媒体技术方面存在的问题

多媒体信息检索技术是一种新的检索技术。[3]多媒体信息检索,是针对数值、文本、图形、图像、动画、声音等各种形式信息的全方位需求,采用具有集成性,实时性和交互性的计算机对这些多媒体信息进行采集、编码、储存、传输等数字化的处理,集成一个具有交互性的存取系统的检索过程。在进行多媒体信息检索时,存在用户查询界面和途径不够丰富多样,多媒体特征信息表达方式不够完善的缺陷。以及进行基于内容的识别和解释,多媒体特征的表述在检索中占有重要地位,多媒体的许多特征并不能用简单的数值和字符来精确表达,需要能表达多媒体内容特征的查询方式及用户接口,如在检索一幅图画时,很难解决内容描述的问题,因为同一幅图像,每个人可能有不同的见解,从而检索出来的结果很可能也不一样。

四、在个性化需求方面存在的问题

个性化服务也就是针对性的个别服务,具体来说就是指以用户为中心,有针对性地为用户提供服务。目前综合性搜索引擎提供是大众化服务较多,而个性化服务很少,它们没有有效地手段理解用户准确的个性化信息需求,不能提供长期的主动的信息服务。不同的用户有着不同的信息需求,若要每一位用户都感到满意,仅仅提供网络信息获得途径或者是直接从网上获得信息是远远不够的,只有针对不同用户的不同需求提供个性化服务,才有可能使每位用户都感到满意以求最大限度地为用户提供所需信息。

五、在用户方面存在的问题

每个人的检索习惯也不同,用户使用网络也存在着不适应性。[4]用户对网络信息资源的了解及其利用还存在着一个认识、接受和熟悉的过程,再加上用户的受教育程度、知识结构等原因,也造成用户利用网络信息资源的局限性。表现在三个方面:不同的用户对信息检索需求的理解和检索策略不同,检索信息的质量也不一样;不同的用户的计算机操作能力及网络相关知识的掌握程度不同,信息检索的效率也不一样;不同的用户对网络信息检索工具的应用熟练程度不同,信息检索的效果也不一样。

面对以上问题我觉得未来网络信息检索技术的发展方向如下:

1.智能化

现有的检索引擎存在着查全率和查准率低的问题,未来的搜索引擎技术必须具有能及时挖掘新信息和及时能链接新增的信息,多途径检索功能,用户可以交互式检索,搜索出满意的信息。提高网络信息检索技术水平并实现智能检索,智能化是网络信息检索未来主要的发展方向。[5]智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,智能检索技术就是采用人工智能进行信息检索的技术,它可以模拟人脑的思维方式,分析用户以自然语言表达的检索请求,自动形成检索策略进行智能、快速、高效的信息检索。最近几年,智能信息检索作为人工智能的一个独立研究分支得到了迅速发展,而且目前已有一些搜索引擎支持智能检索,但智能化程度还不高,这方面还有待进一步的发展。

2.标准化

现在的网站信息瞬息万变,杂乱纷繁,很是需要进行分类整理。目前虽然有

信息检索结课论文

大量的搜索引擎,但还没有一个统一严格的分类方法来管理,网络信息资源在组织分类上需要制定一个统一的分类标准。还要规范网络术语,提高资源共享的程度,这样可以有效保证用户的检索效率。

3.个性化

科技的发展要以人为本,随着科学技术的发展,个性化服务也将成为网络信息检索的一个发展方向。随着互联网的飞速发展,每个人的对信息的需求将不再满足于标准化、单一化的大众需求。不同的人需要不同的服务,如残疾人士对网络信息检索的要求就要区别于常人,要是信息检索能很好的识别语音检索就能很有效的满足他们的信息需求。如何使用户更方便、快捷地使用各种检索工具,满足用户各种检索要求,个性化服务也会成为网络信息检索重要的发展方向。

结束语。在这个知识大爆炸的时代,要想从浩如烟海的信息资源中快速准确地找到自己所需的信息,就需要我们在不断信息检索实践中总结及掌握一些检索技巧。当然也需要我们不断的发现问题,努力解决问题。也由衷地希望随着科技的发展,网络信息检索技术越来越成熟,能给人们带来各式各样的服务,让我们的生活更加便利。【参考文献】

【1】

陆和建,杨栎,王春军.信息检索.安徽:安徽大学出版社,2011,2:325【2】

刘元荣,王凤英.网络文献阅读研究.吉林:吉林大学出版社,2011,4:139【3】

陆和建,杨栎,王春军.信息检索.安徽:安徽大学出版社,2011,2:292【4】

百度.[2012-4-29].

http://wenku.baidu.com/view/eab5dd84b9d528ea81c779fb.html

【5】

搜搜.[2010-4-29].

http://wenwen.soso.com/z/q345679669.htm

第三篇:传统信息检索与现代信息检索的区别和联系[精选]目录

传统信息检索与现代信息检索的区别与联系……………………………………..2【引言】

:…………………………………………………………………………………..2

一、传统信息检索………………………………………………………………………2

二、现代信息检索………………………………………………………………………2

三、传统信息检索和现代信息检索的异同…………………………………….3

四、国内外研究现状……………………………………………………………………3

五、信息检索的发展趋势…………………………………………………………….6传统信息检索与现代信息检索的区别与联系

【摘要】

:信息检索的发展是随着科学技术的进步而发展的。人类已经进行了四次信息技术革命,目前正在进行第五次信息技术革命。信息技术的革命使得信息检索也不断地得到改进,信息检索技术主要有四个阶段:初始阶段、手工检索阶段、计算机检索阶段、网络检索时代。信息检索手段分传统信息检索和现代信息检索。传统信息检索是指手工信息检索,现代信息检索包括计算机信息检索和网络信息检索。

【关键词】

:网络信息检索传统信息检索信息技术革命比较研究计算机检索手工检索网络检索信息检索技术检索手段文献信息

【引言】

一、传统信息检索

传统信息检索-手工检索是利用各种专门用于检索的印刷出版物,即常说的检索工具来查找所需要信息的手段。其检索方法主要有以下几种:(1)直接检索:这是人们最常用的一种查找信息的方法,如去图书馆查阅各种图书、期刊及其他资料,找到需要的信息,需花大量的时间和精力,在过去文献较少时,还能达到目的,而在信息大量产生的年代里犹如大海捞针。

(2)间接检索:就是利用各种检索工具获取线索,再根据线索查找原始文献信息的方法。也就是手工检索。间接检索还分为:1追溯放:通过已知文献所赋的参考文献“由一变十,由十变百“地进行追溯查找有关信息还可以利用各种”引文索引”等工具进行追溯检索。

2.工具法。利用各种检索工具进行查找文献,是文献检索最常用的方法。

二、现代信息检索

现代信息检索是指计算机及网络信息检索。计算机检索是以计算机为基础的信息存储检索。它是在手工检索、机械检索及光电检索基础上演变过来的,且在不断地发展。(1)计算机单机检索:是计算机检索的初形式。随着计算机存储介质的发展变化,也在发生不断变化。目前主要有三种方式:计算机磁盘检索,计算机磁带检索和计算机光盘检索。

(2)网络检索:计算机网络检索是近几年来发展起来的,目前它主要有三种形式:图书馆的局域网络的检索,联机检索系统的检索和internet网上检索。

随着计算机技术的普及、通讯及网络技术的发展,现代信息检索技术已不再是图书馆情报专业人员的专长,而是人人都应掌握的基本技能。

三、传统信息检索和现代信息检索的异同

(1)检索语言。检索语言就是检索信息时所使用的信息词汇,在检索语言上,手工检索与计算机检索基本相同,不同的是计算机检索可以使用较多的自然语言,internet网上检索一般使用自然语言。

(2)检索概念的组配。手工检索主要是以人脑进行检索概念的组配,而计算机检索则是利用布尔逻辑、位置逻辑等逻辑运算符进行概念组配,internet网上检索概念组配方式尚不成熟。其中计算机检索的概念组配最为严谨,手工概念组配的检索组配最灵活。

(3)检索途径。检索途径也就是检索入口,是根据信息的某种特征所进行的检索,手工检索与计算机检索的基本检索途径是相同的,如著作、分类、主题等。但计算机检索的检索途径要更加广泛和灵活,可以从年代、题目、文章、语种等途径进行检索,并能进行多途径同时检索。

(4)检索工具的特点:传统检索:

1、检索范围窄

2、检索速度慢

3、检索效率差

4、检索入口少

5、用户负担大

6、工具内容更新速度慢

7、工具体积庞大

隐藏内容

此处内容需要权限查看

  • 普通用户特权:8.8积分
  • 会员用户特权:免费
  • 网站代理用户特权:免费推荐
会员免费查看

[3]徐蓉.以社会主义核心价值体系引领大学生价值观教育[j].思想政治教育.2008

(3).

[4]梁亚敏、梅荣政.试论社会主义核心价值体系的引领作用[j].思想政治教育.2009(9).