❶ 什麼是網路信息檢索
主要指對利用Internet信息發布技術,通過Internet發布的信息進行的檢索,主要利用搜索引擎、網路機器人和門戶站點等來完成。
網際網路上有海量的數據,是信息的海洋,但在解決實際問題中,仍感到缺乏真正需要的信息,出現了數據豐富,信息貧乏的問題。如何在海量數據堆中,准確、快速的找到所需要的信息,是一個需要很好解決的重大問題。因此,網上信息檢索技術,為用戶從包含各種數據的文件堆中查找所需要的信息或知識的技術,便成為網際網路應用中的一個關鍵性問題。
作為信息海洋的網際網路,從瀏覽器上通過逐個網頁瀏覽尋找所要信息的方法,就像大海撈針一樣,不僅浪費大量的計算機時間和佔用網路通道資源,也很難找到真正需要的信息,利用信息檢索技術及為其開發的軟體系統才是唯一可行的方法。
信息檢索技術是將網際網路上的海量數據,通過軟體系統的檢索查詢,根據用戶提供的需求,把用戶所要的信息提取出來,經十多年發展已經取得了不少突破性的進展,發展了一大批有效、不同的信息檢索軟體,如文本信息檢索、動態網頁Web信息檢索、檢索引擎等一些重要的檢索方法和技術,特別是檢索引擎,成了Web上查找信息不可缺少的工具。
特點
由於網路信息檢索藉助網路通信、信息處理等技術的發展,與傳統信息檢索相比,網路信息檢索具有如下特點:
1.檢索范圍、領域涵蓋廣。網路信息檢索的信息來源范圍通常涵蓋全球,而信息資源類型、學科(主題)領域也幾乎無限制。
2.傳統檢索技術與網路檢索技術相結合。傳統的信息檢索核心檢索技術如布爾邏輯檢索、截詞檢索、限定檢索等檢索技術在網路信息檢索中被沿用。但是網路信息檢索技術藉助網路信息技術的發展,一些新的檢索技術也融入到網路信息檢索中,如人工智慧、數據挖掘、自然語言處理、多媒體檢索技術、多語言檢索技術等,如一些搜索引擎能將搜索結果進行自動分類。
3.用戶界面友好,容易上手。網路信息檢索所藉助的網路信息檢索工具均以面對非專業信息檢索的廣大網民為主,通過各種交換和智能技術,使得一般檢索基本能解決大部分問題。不需要專門的檢索技術和知識。不過,高級搜索就相對難一些。
4.信息檢索效率低。由於網路信息資源浩如煙海,信息資源良莠不齊等特點,信息檢索結果數量雖多,但是查准率較低,盡管一些新的技術如數據挖掘技術、自然語言理解技術等的不但發展和應用,但網路信息檢索效率低的狀況短時間內還無法改觀。
❷ 網路信息的檢索方法有哪幾種
網路信息檢索方法主要有以下四種:1、漫遊法2、直接查找法3、搜索引擎法4、網路資源指南法。
1.漫遊法
(1)偶然發現。這是在網際網路上發現、檢索信息的原始方法。即在日常的網路閱讀、漫遊過程中,意外發現一些有用信息。這種方式的目的性不是很強,具不可預見性和偶然性。
(2)順「鏈」而行。指用戶在閱讀超文本文檔時,利用文檔中的鏈接從一網頁轉向另一相關網頁。此方法類似於傳統手工檢索中的「追溯檢索」,即根據文獻後所附的參考文獻追溯查找相關的文獻,從而不斷擴大檢索范圍。這種方法可能在較短的時間內檢出大量相關信息,也可能偏離檢索目標而一無所獲。
2.直接查找法
直接查找法是已經知道要查找的信息可能存在的地址,而直接在瀏覽器的地址欄中輸入其網址進行瀏覽查找的方法。此方法適合於經常上網漫遊的用戶。其優點是節省時間、目的性強、節省費用,缺點是信息量少。
3.搜索引穆檢索法
此方法是最為常規、普遍的網路信息檢索方法。搜索引擎是提供給用戶進行關鍵詞、片語或自然語言檢索的工具。用戶提出檢索要求,搜索引擎代替用戶在資料庫中進行檢索,並將檢索結果提供給用戶。它一般支持布爾檢索、片語檢索、截詞檢索、欄位檢索等功能。利用搜索引擎進行檢索的優點是:省時省力,簡單方便,檢索速度快、范圍廣,能及時獲取新增信息。
其缺點是:由於採用計算機軟體自動進行信息的加工、處理,且檢索軟體的智能性不很高,造成檢索的准確性不是很理想,與人們的檢索需求及對檢索效率的期望有一定差距。
4.網路資源指南檢索法
此方法是利用網路資源指南進行查找相關信息的方法。網路資源指南類似於傳統的文獻檢索工具————書目之書目(bibliography of bibliographies),或專題書目,國外有人稱之為web of webs,webliographies,其目的是可實現對網路信息資源的智能性查找。它們通常由專業人員在對網路信息資源進行鑒別、選擇、評價、組織的基礎上編制而成,對於有目的的網路信息檢索具有重要的指導作用。
其局限性在於:由於其管理、維護跟不上網路信息的增長速度,使得其收錄范圍不夠全面,新穎性、及時性不夠強,且用戶還要受標引者分類思想的限制。
❸ 搜索引擎的搜索方法有哪些,各有什麼特點
大致可分為四種:全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎。
1、全文搜索引擎
一般網路用戶適用於全文搜索引擎。這種搜索方式方便、簡捷,並容易獲得所有相關信息。但搜索到的信息過於龐雜,因此用戶需要逐一瀏覽並甄別出所需信息。尤其在用戶沒有明確檢索意圖情況下,這種搜索方式非常有效。
2、元搜索引擎
元搜索引擎適用於廣泛、准確地收集信息。不同的全文搜索引擎由於其性能和信息反饋能力差異,導致其各有利弊。元搜索引擎的出現恰恰解決了這個問題,有利於各基本搜索引擎間的優勢互補。而且本搜索方式有利於對基本搜索方式進行全局控制,引導全文搜索引擎的持續改善。
3、垂直搜索引擎
垂直搜索引擎適用於有明確搜索意圖情況下進行檢索。例如,用戶購買機票、火車票、汽車票時,或想要瀏覽網路視頻資源時,都可以直接選用行業內專用搜索引擎,以准確、迅速獲得相關信息。
4、目錄搜索引擎
目錄搜索引擎是網站內部常用的檢索方式。本搜索方式旨在對網站內信息整合處理並分目錄呈現給用戶,但其缺點在於用戶需預先了解本網站的內容,並熟悉其主要模塊構成。總而觀之,目錄搜索方式的適應范圍非常有限,且需要較高的人工成本來支持維護。
(3)關於網路搜索技術表述都有哪些擴展閱讀
搜索引擎的行業應用分為如下幾種形式:
1、 政府機關行業應用
實時跟蹤、採集與業務工作相關的信息來源。全面滿足內部工作人員對互聯網信息的全局觀測需求。及時解決政務外網、政務內網的信息源問題,實現動態發布。快速解決政府主網站對各地級子網站的信息獲取需求。
全面整合信息,實現政府內部跨地區、跨部門的信息資源共享與有效溝通。節約信息採集的人力、物力、時間,提高辦公效率。
2、企業行業應用
實時准確地監控、追蹤競爭對手動態,是企業獲取競爭情報的利器。及時獲取競爭對手的公開信息以便研究同行業的發展與市場需求。為企業決策部門和管理層提供便捷、多途徑的企業戰略決策工具。大幅度地提高企業獲取、利用情報的效率,節省情報信息收集、存儲、挖掘的相關費用,是提高企業核心競爭力的關鍵。
提高企業整體分析研究能力、市場快速反應能力,建立起以知識管理為核心的競爭情報數據倉庫,是提高企業核心競爭力的神經中樞。
3、新聞媒體行業應用
快速准確地自動跟蹤、採集數千家網路媒體信息,擴大新聞線索,提高採集速度。支持每天對數萬條新聞進行有效抓取。監控范圍的深度、廣度可以自行設定。支持對所需內容智能提取、審核。實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。
4、 行業網站應用
實時跟蹤、採集與網站相關的信息來源。及時跟蹤行業的信息來源網站,自動,快速更新網站信息。動態更新信息。實現互聯網信息內容採集、瀏覽、編輯、管理、發布的一體化。針對商務網站提出商務管理模式,大大提高行業網站的商務應用需求。
針對資訊網站分類目錄生成,提出用戶生成網站分類結構。並可以實時增加與更新分類結構。不受級數限制。從而大大利高行業的應用性。提供與CCDC呼叫搜索引擎的廣告合作。建立行業網站聯盟,提高行業網站知名度。
5、網路信息監察與監控
網路輿情系統。網站信息與內容監察與監控系統。