❶ 什么是网络信息检索
主要指对利用Internet信息发布技术,通过Internet发布的信息进行的检索,主要利用搜索引擎、网络机器人和门户站点等来完成。
因特网上有海量的数据,是信息的海洋,但在解决实际问题中,仍感到缺乏真正需要的信息,出现了数据丰富,信息贫乏的问题。如何在海量数据堆中,准确、快速的找到所需要的信息,是一个需要很好解决的重大问题。因此,网上信息检索技术,为用户从包含各种数据的文件堆中查找所需要的信息或知识的技术,便成为因特网应用中的一个关键性问题。
作为信息海洋的因特网,从浏览器上通过逐个网页浏览寻找所要信息的方法,就像大海捞针一样,不仅浪费大量的计算机时间和占用网络通道资源,也很难找到真正需要的信息,利用信息检索技术及为其开发的软件系统才是唯一可行的方法。
信息检索技术是将因特网上的海量数据,通过软件系统的检索查询,根据用户提供的需求,把用户所要的信息提取出来,经十多年发展已经取得了不少突破性的进展,发展了一大批有效、不同的信息检索软件,如文本信息检索、动态网页Web信息检索、检索引擎等一些重要的检索方法和技术,特别是检索引擎,成了Web上查找信息不可缺少的工具。
特点
由于网络信息检索借助网络通信、信息处理等技术的发展,与传统信息检索相比,网络信息检索具有如下特点:
1.检索范围、领域涵盖广。网络信息检索的信息来源范围通常涵盖全球,而信息资源类型、学科(主题)领域也几乎无限制。
2.传统检索技术与网络检索技术相结合。传统的信息检索核心检索技术如布尔逻辑检索、截词检索、限定检索等检索技术在网络信息检索中被沿用。但是网络信息检索技术借助网络信息技术的发展,一些新的检索技术也融入到网络信息检索中,如人工智能、数据挖掘、自然语言处理、多媒体检索技术、多语言检索技术等,如一些搜索引擎能将搜索结果进行自动分类。
3.用户界面友好,容易上手。网络信息检索所借助的网络信息检索工具均以面对非专业信息检索的广大网民为主,通过各种交换和智能技术,使得一般检索基本能解决大部分问题。不需要专门的检索技术和知识。不过,高级搜索就相对难一些。
4.信息检索效率低。由于网络信息资源浩如烟海,信息资源良莠不齐等特点,信息检索结果数量虽多,但是查准率较低,尽管一些新的技术如数据挖掘技术、自然语言理解技术等的不但发展和应用,但网络信息检索效率低的状况短时间内还无法改观。
❷ 网络信息的检索方法有哪几种
网络信息检索方法主要有以下四种:1、漫游法2、直接查找法3、搜索引擎法4、网络资源指南法。
1.漫游法
(1)偶然发现。这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强,具不可预见性和偶然性。
(2)顺“链”而行。指用户在阅读超文本文档时,利用文档中的链接从一网页转向另一相关网页。此方法类似于传统手工检索中的“追溯检索”,即根据文献后所附的参考文献追溯查找相关的文献,从而不断扩大检索范围。这种方法可能在较短的时间内检出大量相关信息,也可能偏离检索目标而一无所获。
2.直接查找法
直接查找法是已经知道要查找的信息可能存在的地址,而直接在浏览器的地址栏中输入其网址进行浏览查找的方法。此方法适合于经常上网漫游的用户。其优点是节省时间、目的性强、节省费用,缺点是信息量少。
3.搜索引穆检索法
此方法是最为常规、普遍的网络信息检索方法。搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。
其缺点是:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。
4.网络资源指南检索法
此方法是利用网络资源指南进行查找相关信息的方法。网络资源指南类似于传统的文献检索工具————书目之书目(bibliography of bibliographies),或专题书目,国外有人称之为web of webs,webliographies,其目的是可实现对网络信息资源的智能性查找。它们通常由专业人员在对网络信息资源进行鉴别、选择、评价、组织的基础上编制而成,对于有目的的网络信息检索具有重要的指导作用。
其局限性在于:由于其管理、维护跟不上网络信息的增长速度,使得其收录范围不够全面,新颖性、及时性不够强,且用户还要受标引者分类思想的限制。
❸ 搜索引擎的搜索方法有哪些,各有什么特点
大致可分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎。
1、全文搜索引擎
一般网络用户适用于全文搜索引擎。这种搜索方式方便、简捷,并容易获得所有相关信息。但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。尤其在用户没有明确检索意图情况下,这种搜索方式非常有效。
2、元搜索引擎
元搜索引擎适用于广泛、准确地收集信息。不同的全文搜索引擎由于其性能和信息反馈能力差异,导致其各有利弊。元搜索引擎的出现恰恰解决了这个问题,有利于各基本搜索引擎间的优势互补。而且本搜索方式有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。
3、垂直搜索引擎
垂直搜索引擎适用于有明确搜索意图情况下进行检索。例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。
4、目录搜索引擎
目录搜索引擎是网站内部常用的检索方式。本搜索方式旨在对网站内信息整合处理并分目录呈现给用户,但其缺点在于用户需预先了解本网站的内容,并熟悉其主要模块构成。总而观之,目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。
(3)关于网络搜索技术表述都有哪些扩展阅读
搜索引擎的行业应用分为如下几种形式:
1、 政府机关行业应用
实时跟踪、采集与业务工作相关的信息来源。全面满足内部工作人员对互联网信息的全局观测需求。及时解决政务外网、政务内网的信息源问题,实现动态发布。快速解决政府主网站对各地级子网站的信息获取需求。
全面整合信息,实现政府内部跨地区、跨部门的信息资源共享与有效沟通。节约信息采集的人力、物力、时间,提高办公效率。
2、企业行业应用
实时准确地监控、追踪竞争对手动态,是企业获取竞争情报的利器。及时获取竞争对手的公开信息以便研究同行业的发展与市场需求。为企业决策部门和管理层提供便捷、多途径的企业战略决策工具。大幅度地提高企业获取、利用情报的效率,节省情报信息收集、存储、挖掘的相关费用,是提高企业核心竞争力的关键。
提高企业整体分析研究能力、市场快速反应能力,建立起以知识管理为核心的竞争情报数据仓库,是提高企业核心竞争力的神经中枢。
3、新闻媒体行业应用
快速准确地自动跟踪、采集数千家网络媒体信息,扩大新闻线索,提高采集速度。支持每天对数万条新闻进行有效抓取。监控范围的深度、广度可以自行设定。支持对所需内容智能提取、审核。实现互联网信息内容采集、浏览、编辑、管理、发布的一体化。
4、 行业网站应用
实时跟踪、采集与网站相关的信息来源。及时跟踪行业的信息来源网站,自动,快速更新网站信息。动态更新信息。实现互联网信息内容采集、浏览、编辑、管理、发布的一体化。针对商务网站提出商务管理模式,大大提高行业网站的商务应用需求。
针对资讯网站分类目录生成,提出用户生成网站分类结构。并可以实时增加与更新分类结构。不受级数限制。从而大大利高行业的应用性。提供与CCDC呼叫搜索引擎的广告合作。建立行业网站联盟,提高行业网站知名度。
5、网络信息监察与监控
网络舆情系统。网站信息与内容监察与监控系统。