第一篇:網絡信息檢索及其前沿技術的發展范文
目 錄
摘要......................................................................................................................................(1)1因特網信息檢索概述.............................................................................................(1)2因特網信息檢索的方法.......................................................................................(2)
2.1因特網信息檢索的一般方法........................................................................(2)
2.1.1網上漫游..................................................................................................(2)2.1.2順“鏈”瀏覽.........................................................................................(2)2.1.3 利用搜索引擎進行信息檢索..........................................................(2)
3因特網信息檢索的特點.....................................................................................(3)
3.1超文本檢索..........................................................................................................(3)
4網絡信息檢索遇到的挑戰..................................................................................(3)5網絡信息檢索的前沿發展技術及展望........................................................(4)
5.1智能化信息檢索.................................................................................................(5)5.2 可視化信息檢索.............................................................................................(6)5.3 一站式信息檢索.............................................................................................(7)5.4 個性化信息檢索.............................................................................................(7)
6致謝.......................................................................................................................................(8)
參 考 文 獻........................................................................................................................(9)
Abstract ···························································································································(10)
網絡信息檢索及其前沿技術的發展
作 者:1111 指導教師:11111
摘要:現代信息檢索技術經歷了由低級到高級的發展過程。目前正朝著多元化的方向發展。本文主要從信息檢索的智能化、專業化、可視化、一站式及基于網格的5個方面來介紹現代信息檢索技術的發展趨勢。因為隨著信息技術的發展和用戶檢索需求的變化,現代信息檢索技術在理念、人性化、智能化等方面發生了全面突破。本文探討了現代信息檢索技術發展趨勢,從智能化、個性化、一站式、可視化四個方面進行了分析,對檢索技術發展趨勢展開了一定的探討。
關鍵詞:因特網; 信息檢索; 前沿技術 ;搜索引擎
1因特網信息檢索概述
因特網信息檢索是現代網絡技術帶來的必然課題,當網絡成為信息世界中的一種無所不在的承載體,每一個檢索者都可以隨時隨地截取和輸送最新的各種信 ,面對這樣一個龐大無比、動態變化的網絡信息 , 要想獲得某個用戶所需特定信息 , 必然還要依賴于因特網上的信息檢索。因特網信息檢索是由眾多站點、瀏覽器和搜索引擎及網絡支撐組成的三角結構。其中的核心部分,不是眾多站點,而是網絡瀏覽器和具有收集、檢索功能的搜索引擎。
眾多站點、網頁上的信息是因特網上信息的基本組成部分。在因特網發展初期,瀏覽器和簡單的搜索引擎即可幫助人們檢索所需的文獻信息。瀏覽器 ,相當于提供了一個信息總目次 ,提供讀者和用戶對一個又一個網站進行直接地點擊、瀏 ,通過超文本鏈接 ,選擇自己所需的信息。瀏覽雖然方法簡易、直接,但隨機性強,耗時量大,對于搜索因特網上的信息來講時間和費用較高,因此更科學的方法是要借助搜索引擎。搜索引擎是因特網信息的網上檢索工,它可以幫助用戶快速搜索所需信息及其相關信息。搜索引擎是因特網上設立的一種特殊類型的站點,通過用戶輸入所需信息的關鍵詞, 經由檢索服務器處理內部數據庫,找到相關資料并整理后送出,通過網絡傳給用戶使用的主機,即可以通過下圖所示的簡單流程圖來表示。這是就其檢索功能而言,對因特網上的信息檢索來說,它也離不開數據庫的支持,而因
第1頁(共10頁)特網上數據庫的收集、整理,是搜索引擎具備的另外一部分功能。
2因特網信息檢索的方法
2.1因特網信息檢索的一般方法
如果用戶要在因特網上獲取信息,就必須能夠找到提供信息的服務器。所以,首先以找到服務器在網上的地址(URL)為目標 , 然后通過該地址去訪問服務器提供的信息,它的檢索方法一般來說有以下幾種。2.1.1網上漫游
這是在因特網上發現、檢索信息的原始方法。即在日常的網絡閱讀、漫游過程中,意外發現一些有用信息。這種方式的目的性不是很強 , 其不可預見性、偶然性使檢索過程具有某種探索寶藏的意味,也許會充滿樂趣 , 但也可能一無所獲。2.1.2順“鏈”瀏覽
指用戶在閱讀超文本文檔時, 利用文檔中的鏈接從一個網頁轉向另一個相關網頁。有些類似于傳統文獻檢索中的“追溯檢索” , 即根據文獻后所附的參考文獻目錄去追溯相關文獻,一輪一輪地不斷擴大檢索范圍。這種方式可以在很短的時間內獲得大量相關信息 , 但也可能在“順鏈檢索”中偏離了檢索目標,或迷失于網絡信息空間中 , 而且找到合適的檢索起點也并不容易。
通過網絡資源指南(res ource guide)來查找信息為了對因特網這個無序的信息世界加以組織、管理 ,使大量有價值的信息納入一個有序的組織體系,專業人員做了許多努力和開發。也就是基于專業人員對網絡信息資源的產生、傳遞與利用機制的廣泛了解和對網絡信息資源分布狀況的熟悉 , 以及對各種網絡信息資源的采集、組織、評價、過濾、控制、檢索等手段的全面把握而開發出的可供瀏覽和檢索的網絡資源主題指南。綜合性的主題分類樹體系的網絡資源指南 , 如 Y ahoo 等。而專業性的網絡資源指南就更多了 , 幾乎一學科專業、重要課題、研究領域的網絡資源指南都可在因特網上找到。
2.1.3 利用搜索引擎進行信息檢索
它是較為常規普遍的網絡信息檢索方式。搜索引擎是提供給用戶進行關鍵詞、詞組或自然語言的檢索工具。用戶提出檢索要求 , 搜索引擎代替用
第2頁(共10頁)戶在數據庫中進行檢索 ,并將檢索結果提供給用戶。它一般支持布爾檢索、詞組檢索等功能。利用搜索引擎進行檢索的優點是: 省時省力,簡單方便,檢索速度快、范圍 ,能及時獲取新增信息。其缺點是:由于采用計算機軟件自動進行信息的加工、處理 , 且檢索軟件的智能化不是很高,造成檢索的準確性不是很理想 ,與人們的檢索要求及對檢索效率的期望有一定的差距。目前在因特網上的搜索引擎層出不窮,比較有影響的英文搜索Y ahoo , AltaVista 等;比較有影響的中文搜索引擎有網易、搜狐、新浪等。
3因特網信息檢索的特點
檢索范圍大 ,因特網是一個全球性的網絡 , 信息資源分布在世界各地的服務器上 , 可供檢索的資源包括大量的主頁、多種報紙、全文期刊、各種組織機構發布的信息用戶新聞以及原始技術報告等。3.1超文本檢索
因特網檢索的結果是完全可以直接閱讀和利用的 Web頁面文獻全文。而且只需要簡單地用鼠標點擊 , 即可隨意瀏覽。在多媒體的超文本中 , 不但有文字、圖片 ,還可以有聲音、動畫、影視等形式的信息內容。界面友好 , Web信息檢索工具界面豐富友好 , 使用戶的檢索相當方便 , 十分易于操作。Web 信息檢索途徑較多甚至還可按相關性程度對檢索結果進行排序輸出。檢索時 , 只需按一定規則輸入檢索式 , 在發出檢索命令后即可獲得檢索結果 , 通常檢索結果包括文獻頁面的題名、內容簡介、URL 地址等 ,并可據此獲得更詳細的超文本頁面。良好的反饋能力和快速響應能力 , Web信息檢索工具通常采用全文單詞標引的方式 ,將因特網上的文本頁面進行全文單詞的自動倒排,建立龐大的索引數據庫。這些Web信息檢索的索引數據庫 , 常常 24 小時就更新,大量的基于全文的單詞倒排工作,通常是借助于有關的程序軟件自動運行的 ,因而具有良好的信息反饋功能和快速響應功能。
4網絡信息檢索遇到的挑戰
網頁是因特網的最主要的組成部份,也是人們獲取網絡信息的最主要的來源,為了方便人們在大量繁雜的網頁中找尋自己需要的信息,這類檢
第3頁(共10頁)索工具發展的最快。一般認為,基于網頁的信息檢索工具主要有網頁搜索引擎和網絡分類目錄兩種。網頁搜索引擎是通過“網絡蜘蛛”等網頁自動搜尋軟件搜索到網頁,然后自動給網頁上的某些或全部字符做上索引,形成目標摘要格式文件以及網絡可訪問的數據庫,供人們檢索網絡信息的檢索工具。網絡目錄則是和搜索引擎完全不同,它不會將整個網絡中每個網站的所有頁面都放進去,而是由專業人員謹慎地選擇網站的首頁,將其放入相應的類目中。
網絡目錄的信息量要比搜索引擎少得多,再加上不同的網絡目錄分類標準有些混亂,不便人們使用,因此雖然它標引質量比較高,利用它的人還是要比利用搜索引擎的人少的多。但是由于網絡信息的復雜性和網絡檢索技術的限制,這類檢索工具也有著明顯的不足。(1)隨著網頁數量的迅猛增加,人工無法對其進行有效的分類、索引和利用。網絡用戶面對的是數量巨大的未組織信息,簡單的關鍵詞搜索,返回的信息數量之大,讓用戶無法承受。(2)信息有用性評價困難。一些站點在網頁中大量重復某些關鍵字,使得容易被某些著名的搜索引擎選中,以期借此提高站點的地位,但事實上卻可能沒有提供任何對用戶有價值的信息。(3)網絡信息日新月異的變更,人們總是期望挑出最新的信息。然而網絡信息時刻變動,實時搜索幾乎不可能,就是剛剛瀏覽過的網頁,也隨時都有更新、過期、刪除的可能。
5網絡信息檢索的前沿發展技術及展望
現代信息檢索技術經歷了由低級到高級的發展過程。目前正朝著多元化的方向發展。主要從信息檢索的智能化、專業化、可視化、一站式及基于網格的5個方面來介紹現代信息檢索技術的發展趨勢。
隨著信息技術的發展和用戶檢索需求的變化,現代信息檢索技術在理念、人性化、智能化等方面發生了全面突破。本文探討了現代信息檢索技術發展趨勢,從智能化、個性化、一站式、可視化四個方面進行了分析,對檢索技術發展趨勢展開了一定的探討。
信息檢索技術經過先組式索引檢索、穿孔卡片檢索、縮微膠卷檢索、脫機批處理檢索發展到今天的聯機檢索、光盤檢索、網絡檢索等。其發展經歷了由低級到高級的過程、傳統的線性檢索向超文本支持的非線性檢索
第4頁(共10頁)發展。這主要依賴于信息技術的發展和信息用戶的信息檢索需求。這些始終是推動現代信息檢索理論與技術發展的重要動力。那么,現代信息檢索技術的發展趨勢將來如何呢?而要對信息檢索技術的發展作出成功的預測是十分困難的。但是可以在廣泛調研、比較、分析的基礎上把握其某些發展動態,發現一些影響現代信息檢索技術發展的新變化、新技術、新理念。5.1智能化信息檢索
智能化信息檢索是人們把人工智能與信息檢索技術結合起來應用于信息存取領域的成果。近年來Internet上不斷涌現的人工智能產品。比如智能搜索引擎、智能瀏覽器、智能代理、知識共享智能體等。都將大大提高信息存取系統的智能化程度。智能化信息檢索是當今信息檢索技術研究的熱點問題之一。也是未來信息檢索主要的發展方向。智能化信息檢索是基于自然語言的檢索形式.機器根據用戶所提供的自然語言表述的檢索要求進行分析,而后形成檢索策略進行搜索,它能夠代替或輔助用戶完成諸如選詞、選庫、構造檢索式。甚至在數據庫中進行自動推理查找等功能;系統對知識庫檢索推理的結果。可以使用戶得到能夠直接加以利用的信息,它是建立在一個或多個專家系統基礎上的信息存取系統。用戶所需要做的僅僅是告訴計算機想做什么,至于怎樣實現則無須人工干預.這意味著用戶將徹底從繁瑣的規則中解脫出來。它是人工智能與檢索技術的有機結合。檢索工具智能化的內涵在于檢索工具具有學習、分析、辨別和推理的能力。IBM的最新研究的檢索系統Piquant能夠基于對問題回答來完成用戶的檢索要求。Piquant能分析文章的語義結構,并揭示其沒有顯示的表現出來的知識。IBM研究人員演示了在Pinquant中提問“誰是加拿大總理?”,系統準確地找到了回答這個問題的文章,雖然在這篇文章中沒有顯示的提到我們提問中的單詞。
提高信息檢索的智能化是信息檢索所致力于實現的一個重要特征,它包含2個方面的含義:一是用戶檢索需求理解的智能化。比如AskJeeve,AnswerBus(http://www.tmdps.cnprehensive breakthrough occurred.This article discusses the trend of the development of modern information retrieval technology, intelligent, personalized, one-stop, visualize, four aspects has carried on the analysis of the retrieval technology development trend is discussed.Key words: the Internet;Information retrieval;Cutting-edge technology;The search engine
第9頁(共10頁)
第二篇:網絡信息檢索及其局限性(本站推薦)
【關鍵詞】 網絡信息 信息檢索 搜索引擎網絡信息檢索簡介
隨著信息技術的飛速發展,信息已成為全社會的重要資源,對信息的占有程度及信息處理水平的先進程度已成為衡量一個國家或地區現代化程度的重要標志,而網絡上豐富的信息在更大程度上改變了人們的工作和生活的方式。Internet是當今世界上規模最大、覆蓋面最廣、信息資源最豐富、發展最為迅速的信息網絡,基于Internet的網絡信息檢索的研究,無論對研究人員還是一般用戶來說,都有著很強的現實性和實用性。
1.1 信息檢索概念
信息檢索是指將信息按一定的方式組織和存儲起來,并根據信息用戶的信息需求查找所需信息的過程和技術。人們獲取信息源的方式主要有:①傳統的信息檢索方法,通過人工查詢在圖書館等提供文獻的機構進行文獻的查詢和獲取活動;②聯機信息檢索相對于前者來說具有實時性、完整性、共享性、廣泛性等優點;③網絡信息檢索是指通過網絡信息檢索工具檢索存在于Internet信息空間中各種類型的網絡信息資源。
1.2 網絡信息檢索的原理
網絡信息檢索工具是網絡信息檢索技術的實物體現。目前,常用的網絡信息檢索模型有布爾邏輯模型、模糊邏輯模型和概率模型等幾種方式。
① 布爾邏輯模型 這是一種簡單而常用的嚴格匹配模型。用戶可以根據檢索項在文檔中的布爾邏輯關系提交查詢,搜索工具根據事先建立的倒排文檔結構確定查詢結果。標準的布爾邏輯模型為二元邏輯,所搜索的文檔要么與查詢相關,要么與查詢無關。利用這種模型進行查詢,其查詢結果一般沒有按照內容的相關特性排序。
② 模糊邏輯模型 它在查詢結果處理中引進了模糊邏輯比較,并且按照相關的優先次序排列查詢結果,這樣就可以克服布爾邏輯模型信息查詢結果的無序性。
③ 概率模型 它是基于貝葉斯概率原理而提出的,根據詞條、文檔間的內在聯系,利用詞條間和詞條與文檔間的概率相依性來進行信息檢索。2 搜索引擎
搜索引擎是目前使用最為頻繁的一種網絡信息檢索工具。與其他工具相比,它的檢全率和檢準率都比較高,具有很強的使用價值和廣泛的應用前景。
2.1 搜索引擎的工作原理
作為一種www站點資源和其它網絡資源進行組織和檢索的檢索工具,搜索引擎的檢索機制一般包括數據采集和標引機制、數據組織機制和用戶檢索機制,基本構成如圖1所示。① 數據采集標引機制按照一定規律和方式對網絡上www站點進行搜索,并將搜索到的www頁面信息存入搜索引擎的臨時數據庫中。
② 數據組織據組織機制的主要功能是對www頁面信息進行整理以形成規范的頁面索引,并建立相應的索引數據庫。
③ 索引數據庫是用戶進行檢索的基礎,它的數據質量直接影響到檢索效果,而搜索引擎的數據采集標和標引機制又是決定數據庫質量的關鍵技術。
④ 用戶檢索機制幫助用戶以一定方式檢索引擎的索引數據庫,以獲得符合用戶需要的www站點或頁面。
2.2 搜索引擎的分類
按照用戶查找的途徑劃分,可將搜索引擎分為如下幾種: ① 基于關鍵詞的搜索引擎 主要通過使用自動采集軟件來對網絡上的數據進行采集標引,建立成索引數據庫。它主要采用自動搜索和標引方式來建立和維護其索引數據庫,供用戶查詢使用。
② 基于分類目錄的搜索引擎 一般依賴于按照某種分類標準進行人工編排的分類體系。
③ 聯合式搜索引擎 是基于關鍵詞的搜索引擎的另外一種表現形式,是后者與基于類目的搜索引擎的一種結合。2.3 搜索引擎的功能
目前Internet上的搜索引擎種類繁多,雖然各種搜索引擎都有自己的不同信息采集標引機制,在其他一些方面各具特色,但其基本功能卻是相似的。
① 布爾邏輯檢索 這一功能使得用戶能使用AND、OR和NOT來進行關鍵詞的搭配檢索。
② 模糊檢索 在用戶進行檢索的過程中,系統會對跟用戶提供的關鍵詞相似的詞語進行檢索,并返回包含關鍵詞或是這些相似詞的檢索結果。
③ 截詞檢索 這種檢索形式利用檢索詞的某一部分來進行檢索。在搜索引擎中,用戶提供包含“?”或是“*”通配符的檢索項來進行檢索。
④ 限定詞檢索 這種檢索加減號檢索,它用來規定檢索項中必須出現或是必須不出現某些關鍵詞。網絡信息檢索的局限 用戶在查找網絡信息資源時,不可避免的用到網絡信息檢索工具。檢索工具的優劣很大程度的影響了用戶的檢索效率。雖然網絡信息檢索工具在最近幾年有了長足的發展,但是到現在網絡信息檢索仍然存在著這樣或是那樣的局限。
3.1 文本信息檢索的局限
① 網絡信息標引的準確度不夠 檢索工具對網絡信息資源的標引一般都存在著柵引準確度不夠的問題,檢索工具經常會在返回大量垃圾信息的同時丟失有用信息。當用戶要進行特定的文獻檢索時,有時還會發現現存的檢索工具無濟于事,檢索出來的數據完全被無用信息所覆蓋。如想要通過搜索引擎查詢清朝雍正年間李衛任浙江巡撫的資料,你只能夠查到大量《李衛當官》之類無用信息。
② 搜索引擎的查全率不高 由于互聯網上的信息資源以爆炸性的速度不斷增長,搜索引擎采集數據的速度遠遠落后于信息資源的增長速度。單個搜索引擎的數據庫所收集的Web頁面大大不足,就是所有的搜索引擎所儲存的數據也只占全球Web頁面的50%強。由于這方面的原因,搜索引擎的檢全率會無可避免的被降低。
③ 搜索引擎的查準率不高 一是返回的信息過多,這是現有搜索引擎檢索信息的普遍現象;二是返回重復的信息,搜索引擎的檢索結果中還經常重復出現同一信息源的不同部分,甚至出現不同信息源的相同內容信息。
④ 查詢方式有限 目前大多數搜索引擎的查詢方法比較單一,一般只提供分類查詢方式和關鍵詞查詢方式。這樣,一方面檢索時不能從文獻的多個方面對檢索提問進行限制,只能就某一關鍵詞或概念進行籠統的檢索;另一方面,由于查詢結果完全依賴于用戶所給出的關鍵詞,而大多數用戶對他們檢索的領域或索引數據庫的關鍵詞不太了解,因此使最后的查詢結果相關性很差,往往是輸入一個檢索式,得到一大堆網址,但其中大部分是冗余信息。
⑤ 檢索對象的數據結構單一 由于現在大多數網站使用的是傳統的關系數據庫對信息進行組織和存儲,因此其使用的搜索引擎也是基于關系數據庫的,這種傳統的關系數據庫非常擅長處理結構化的數據,但其對于非結構化的數據的處理能力則很弱。
⑥ 交互性不夠 當前的搜索引擎與用戶的交互性不夠,與用戶間缺乏足夠的協作,不了解用戶的情況,不記錄用戶提交的查詢任務,不能處理用戶的反饋信息,因而不能與用戶進行足夠好的交互以提高檢索效率。3.2 多媒體信息檢索的局限
到現在為止,雖然單獨針對圖像、視頻、聲音等媒體的檢索技術已經出現,但還沒有任何搜索引擎能夠充分解決多媒體信息的檢索,其主要表現在以下幾個方面:
① 檢索效果不夠理想 目前,幾乎所有的多媒體搜索引擎在多媒體信息的查準率方面都不能達到令人滿意的程度,用戶將在返回的幾百個甚至上千個圖像中篩選需要的那一幅。這是很費時和令人難以忍受的,而且有時你所用的搜索引擎根本檢不出你想要的東西。歸其原因,一方面是在于查詢方式的單一,另一方面在于對圖像的標引深度不夠,這就要求完善圖像檢索和索引機制。
② 用戶查詢接口單一 理想的多媒體檢索系統中,人是主動的,用戶的查詢接口能提供豐富的交互能力,且直觀易用,使用戶能夠在主動交互過程中通過調整檢索參數,表達對圖像的語義感知,最終獲取滿意的結果。這就涉及到如何把用戶的提問轉換為可以執行檢索的特征矢量、交互方式的設計,如何獲取用戶的內容感知等問題。目前的多媒體搜索引擎用戶查詢接口比較單一,大多只提供描述查詢接口,即關鍵詞提問框。
③ 圖像特征信息的表示與檢索不夠完善 基于內容的圖像檢索,實質上就是進行圖像特征相似度的比較,但目前這一技術還存在許多問題。
④ 信息的自動加工與人工標引不夠 目前文本搜索引擎在這方面的發展正日趨完善,而多媒體搜索引擎的研究剛剛起步,尤其是圖像信息的加工,圖像不同于文本,文本自身就能說明要講的內容,而圖像內容卻需要加入人的理解和描述,人工干預雖能提高查準率,但一方面能被人工標引的是極其有限的;另一方面由于人工標引勞動強度大而限制了檢索的范圍,如何對圖像信息進行快速標引和準確分類是急待解決的主要問題。
另外,目前基于內容的檢索技術多應用于對靜態圖像的檢索,對動態圖像的檢索還沒有多少行之有效的方法。但隨著寬帶網絡的逐步實現,動態多媒體信息在網絡中將會越來越多。參考文獻】
張杰.淺論網絡信息檢索.江西圖書館學刊,2002年增刊.董慧.網絡信息資源開發與利用.武漢:武漢大學出版社,2001.盧小賓.信息檢索.北京:科學出版社,2003.李勇先,鄭文良.人工智能在網絡信息檢索中的應用.圖書館建設,2003(4),4:81~83.焦玉英,符紹宏,何紹華.信息檢索.武漢:武漢大學出版社,2001.
第三篇:網絡信息檢索實驗報告
網絡信息檢索的應用和發展趨勢
09軟件1 W班09144136張越
摘要:隨著信息時代的到來,網上信息資源的數量、種類不斷增加,電子信息資源日益豐富,互聯網技術也日新月異、層出不窮,人們通過網絡能夠獲取大量所需信息,如何在信息的海洋中快捷、準確地找出所需信息,網絡搜索引擎就像圖書館目錄能指引讀者迅速找到所需圖書一樣,為人們在網絡信息海洋中導航。而面對日益豐富的電子信息資源,如何有效的利用網絡資源查找自己需要的信息,并對其進行熟練、靈活、有效地運用,已經被越來越多的人重視。
關鍵字:搜索引擎 信息檢索 網絡 發展趨勢
隨著信息技術的飛速發展,因特網已經繼報紙、期刊、廣播、電視等,成為當代信息存儲與傳播的主要媒介之一。因特網有著極其豐富的信息資源,但是浩如煙海的信息資源往往讓信息使用者眼花繚亂。人們總是不能在最短的時間內找到自己需要的最有用的資源。因此,我們需要通過信息檢索來解決這個問題。信息檢索是指信息按一定的方式組織起來,并根據信息用戶的需要找出有關的信息的過程和技術。信息檢索分為兩種,即廣義信息檢索和狹義信息檢索。狹義的信息檢索就是信息檢索過程的后半部分,即從信息集合中找出所需要的信息的過程,也就是我們常說的信息查尋。本文主要研究的就是狹義的信息檢索中出現的問題及解決策略。
一、搜索引擎及其基本原理
搜索引擎是Internet上具有查詢功能的網頁的統稱,是獲取知識信息的工具。隨著網絡技術的發展,搜索技術逐漸完善,搜索引擎已廣為人們使用。任何搜索引擎的設計,均有其特定的數據庫索引范圍、獨特的功能和使用方法,以及預期的用戶群指向。它是一些網絡服務商為網絡用戶提供的檢索站點,它收集了網上的各種資源,然后根據一種固定的規律進行分類,提供給用戶進行檢索。
搜索引擎的自動信息搜集功能分兩種。一種是定期搜索,即每隔一段時間進行搜索,搜索引擎主動派出“蜘蛛”程序,對一定IP地址范圍內的互聯網站進行檢索,一旦發現新的網站,它會自動提取網站的信息和網址加入自己的數據庫。當用戶以關鍵詞查找信息時,搜索引擎會在數據庫中進行搜尋,如果找到與用戶要求內容相符的網站,便采用特殊的算法,通常根據網頁中關鍵詞的匹配程度,出現的位置、頻次,鏈接質量等計算出各網頁的相關度及排名等級,然后根據關聯度高低,按順序將這些網頁鏈接返回給用戶。
二、網絡信息檢索技巧
3.1加強對因特網的管理
從以上問題,我們可以看出,因特網存在著問題,很大一部分是因為網絡監管的不利造成的。因此,國家要加強宏觀政策調控,并制定相應的法律法規政策,以法律條文的形式強制性規范網絡,從而維持因特網秩序,保護網絡環境。同時我們也應該加強公民的思想道德教育,將以德治網和以法治網有機地結合在一起,不斷促進網絡安全的發展,進一步減少網絡詐騙等事件的發生。
3.2選擇合適的搜索引擎及關鍵詞
因為每個用戶的需求不同,所以在選擇搜索引擎時要綜合考慮自己的需求,不能盲目地選擇。如前文所說,搜索引擎分為關鍵詞搜索引擎和目錄搜索引擎。而信息檢索最基本的要求就是選擇合適的關鍵詞,尤其是在使用關鍵詞搜索引擎的時候。如果輸入的關鍵詞和用戶所需要的準確信息聯系不大,則用戶很難迅速地找到自己需要的信息。所以這需要用戶選擇 富有特色的、合適的關鍵詞,不能使用太過寬泛的詞,盡量接近自己需要的信息,同時也應盡量避免拼寫錯誤等低級錯誤。
3.3提高使用者檢索專業水平及選擇適合的數據庫
要提高使用者的檢索專業水平,就要對使用者進行相關信息檢索的專業培訓。培訓的目的主要在于讓使用者跳出傳統的檢索思維范疇,熟悉并能熟練運用新的檢索技術,不斷滿足使用者日益增長的信息檢索需要。同時使用者對于檢索的范圍等要有一個大概的了解,如果搜索出來的結果較多,則要適當減小范圍;如果檢索結果很少,則適當增大范圍,對自己的檢索策略做出及時調整。另外,根據檢索的內容的范疇來選擇合適的數據庫是很重要的環節。而現有的數據庫種類繁多,這也需要用戶進行合適的選擇,并迅速地找到主題分類目錄,進而更準確地進行檢索。
三、在實踐中充分利用豐富的網絡信息資源
搜索前,首先要分析一下自己的搜索需求,然后再選擇關鍵字。在搜索過程中,關鍵字的選擇充滿著反復性,在搜索的過程中,切不可急躁,應該不斷的篩選,分析所選擇的關鍵字,直到找到滿意的關鍵字為止。在搜索收錄網站時,只要網站本身沒有違反有關的規則,一般都能登錄成功。如果搜索都能做到這樣,搜索效率會不斷的提高,網絡信息資源會得到更多和更好的利用。此外,在登錄搜索引擎時,我們一般不用考慮網站的分類問題,而登錄目錄索引時則必須將網站放在一個最合適的目錄,就是要分門別類地存放在相應的目錄中,用戶在查詢信息時,可選擇關鍵詞搜索,也可按分類目錄逐層查找。目前,搜索引擎與目錄索引有相互融合滲透的趨勢。原來一些純粹的全文搜索引擎現在也提供目錄搜索。總之,在網絡信息資源檢索的過程中,要耐心、細致、多角度思考,不忽略每一個檢索點,只有這樣,才能圓滿完成檢索任務。
四、網絡信息檢索的發展趨勢
(1)信息檢索的多樣化。其具體趨勢表現為:網絡檢索信息的形態多種多樣;多媒體信息檢索變得普遍;網上檢索工具向其他服務范疇擴展,以各種形式滿足大眾的信息需要。
(2)信息檢索的智能化。智能化信息檢索是當今信息檢索技術研究的熱點問題之一,也是未來信息檢索主要的發展方向。可以使用戶得到能夠直接加以利用的信息,它是建立在一個或多個專家系統基礎上的信息檢索系統。
(3)信息檢索的專業化。專業化信息檢索是指面向某一特定專業或學科領域,提供高質量的專業信息的檢索。可以提高檢索速度,和信息專指度,加大檢索深度、力度,從而提高全=面和準確。
參考文獻:
[1]鄢百其等,網絡信息檢索技巧及析疑[J].武漢科技大學學報(社會科
學版),2008,10(2).[2]李秀芹,葛永亮.略論網絡信息檢索[J].科技信息,2007(15):325.[3]黃如花,張春蕾.網絡信息檢索的發展趨勢[J].圖書情報知識,2002(4):48-50.[4]楊海濤.網絡信息檢索的困境及發展趨勢[J].科技情報開發與經濟,2008(11):13-14.
第四篇:網絡信息檢索論文
網絡時代新特征
——讀《理解媒介:論人的延伸》有感
由于沒讀《世界是平的》,所以談談讀《理解媒介:論人的延伸》對網絡時代新特征的理解。加拿大傳播學巨匠麥克盧漢的著作《理解媒介》中闡述的主要觀點是:“媒介是人的延伸,思維的延伸。人類的思維交流從面對面,到了電話,到了網絡,不斷將世界拉近。” 的確,媒介的變化和改進深深地影響著人類社會的方方面面,甚至影響到社會的變革。麥克盧漢在1964年預言:隨著電子媒介的發展,世界日益成為一個地球村。他認為人類社會的發展經歷了一個部落化——非部落化——重新部落化的過程,最終整個世界成為一個新的“地球村”。在原始社會,口語是主要的傳播媒介,由于聽力有限,人們必須生活在小空間的部落群體之中,相互保持近距離的密切關系。文字和印刷媒介產生之后,人咧可以分散到廣闊的地域,部落神會便發生了解體。電子媒介的普及再次改變了這種狀況,談們的床不速度和實時性再次將遙遠的世界拉得很近,人與人的距離大大“縮小”,于是重新“部落化”,形成“地球村”。在電子媒介剛出現時,大多數人并不相信他的這一預言,但事實是新媒介正逐漸將這一預言實現。電子化的、通過電線、光纖、無線電等技術傳送信息的網絡使得任何種類的信息都可以突破時空的限制自由的傳送。
當今,互聯網的浪潮正以難以想象的速度和不可阻擋的勢頭席卷全球。我覺得甚至可以這樣理解,第三次科技革命就是信息傳播媒介的革命,網絡計算機技術改變最深刻的就是傳播和人們交流信息的方式。一方面,從傳統的印刷技術到現代的數字化的通訊技術和通訊網絡,信息傳播的方式突飛猛進;另一方面,信息傳播方式的革命正在改變經濟增長方式以及世界經濟格局,是企業進入數字經濟時代。信息傳播方式的革命促使人類的一切都可以虛擬化。逐漸出現的虛擬辦公、虛擬企業、虛擬學校、虛擬圖書館、虛擬商城等,將改變人類經濟與社會活動方式。甚至可以說,這種革命會影響到政治、文化等更生層次的領域。
麥克盧漢還認為,這種變化不僅僅是社會整體層面的變化,更是其組成單位——人的個體的變化。麥克盧漢說印刷媒介時代的人是割裂的、殘缺不全的人,他認為是印刷文字的語法把人類分裂為相互獨立的自私自利的派別,分裂為種和民族,分裂為情感的派別。他也相信,電子傳播中網絡那種統一的力量又可能使人類重新回到整合統一的狀態。我覺得這種觀點很有深度,也很有遠見。
在互聯網上,世界正在變成一個沒有時差,沒有距離的整體,變成一個超越傳統是空的“網絡時空”。在網絡時空中,人們可以更多的利用網絡娛樂,包括收聽、下載音樂,觀看電影,人們可以利用網絡購物,訂票,訂酒店等等,網絡承擔起人類娛樂、休閑新載體的任務。另外,在網絡時空中,人們還可以通過虛擬圖書館、博物館、藝術館等來收集需要的信息,在網絡上學習,工作。
非常佩服麥克盧漢在40多年前就能做出這樣的預言,正是互聯網這種麥克盧漢所預言的新媒介深刻的改變著世界,在經濟全球化的進程中,世界不斷在變小,有人說互聯網既是新媒介也是新市場,我們需要通過互聯網來了解網絡時代的新特征,更好的利用互聯網。
第五篇:關于網絡信息檢索論文
信息檢索是指信息按一定的方式組織起來,并根據信息用戶的需要找出有關的信息的過程和技術。下面小編為大家搜索整理了關于網絡信息檢索論文,希望對大家有所幫助。
淺談網絡信息檢索的現狀及其發展趨勢
【摘要】隨著計算機技術及網絡技術的發展,網絡信息檢索顯得越發重要。本文主要綜述了網絡信息檢索的全文數據庫、搜索引擎、互聯網“超鏈接”等現行檢索模式及它的智能化、一站式化、可視化等發展趨勢。
【關鍵詞】網絡信息檢索;現狀;發展趨勢
1、信息檢索概述
信息檢索(Information Retrieval)是指將信息按照一定的方式組織和存儲起來,并能根據信息用戶的需要指出其中相關信息的過程,因此它的全稱叫“信息存儲與檢索”。
隨著互聯網的發展,人類社會的信息化、網絡化進程大大加快。當今出現的一系列新型檢索模式,包括網絡信息規范控制標準等為網絡檢索技術的未來展現了新希望,與之相適應的信息檢索的交流平臺也迅速轉移到以WWW為核心的網絡應用環境中,信息檢索步入網絡化時代,網絡信息檢索已基本取代了手工檢索。
2、網絡信息檢索的現狀
對大多數讀者而言,檢索并不意味著發現,而是獲得。人們希望不僅僅是提供寬泛的檢索結果,而應該是計算機能試圖理解用戶提問的意圖,并對檢索結果進行適當的分類和排序。但是,現有的搜索引擎大多是基于簡單的關鍵詞匹配,不能真正理解用戶的檢索意圖;各個搜索引擎的信息搜集和索引建立有很大的不同,每個搜索引擎平均只能涉及到整個網上資源的30%~50%,而其中真正有用的信息也只占很小的比例,這就意味著使用任何一個搜索引擎都只能檢索到網絡中的部分資源。目前網絡檢索面臨一系列的挑戰,網絡信息量迅猛增加,人工已經無法對它們進行有效的分類、索引和利用;簡單的關鍵詞搜索,返回的信息量過大,已經讓用戶無法承擔;網絡信息組織的無序性;信息有用性評價困難;網絡信息日新月異的更變;信息媒體的多樣化;帶寬等其它因素的制約,這些都給因特網信息的獲取造成了極大的阻礙。這樣就造成了要求智能化、專業化、多元化、多媒體化的網絡信息檢索工具出現的呼聲越來越高,并且有更多的人參與到其中來。如此種種,給當今的網絡信息檢索研究帶來了發展機遇,也給了它無限的發展空間。
3、網絡信息檢索的現行模式
3.1 網絡全文數據庫檢索
網絡全文數據庫是以全文數據為數據庫對象,并在網上提供全文檢索服務的數據庫。按數據庫的生產機構分類,可分為出版商全文期刊數據庫和生產商全文期刊數據庫。前者主要是那些期刊出版單位在其出版的印刷期刊基礎上建立的網絡電子期刊全文數據庫。而后者則是由數據庫生產商根據一定的主題或一定的收錄范圍整合一定數量的期刊出版物而產生的全文數據庫。國內全文數據庫主要有中國學術期刊全文數據庫。
3.2 網絡搜索引擎檢索
搜索引擎是一個專門的系統,它可以對互聯網信息資源進行搜索整理和分類,并將其儲存在網絡數據庫中供用戶查詢。搜索引擎包括搜集信息、分類和用戶查詢等三大部分。目前流行的搜索引擎有兩大類:關鍵詞全文檢索式搜索引擎和分類目錄式搜索引擎。
關鍵詞全文檢索式搜索引擎主要利用其內部的搜索機器人和蜘蛛程序,自動搜索來自互聯網上的各種內容,在每一個關鍵詞和所有相關的網頁之間按照網頁相關性原理建立一個對應關系,儲存在其網絡服務器的數據庫中。用戶只要輸入關鍵詞就可以找到符合該關鍵詞特征的所有被索引的網頁,搜索結果以超鏈接的方式列表,搜索結果有簡單介紹,用戶點擊相應的鏈接就可以進入相應的網絡資源網站,從而找到所需信息。用這種方式搜索到的結果通常數以百萬計,但是相關性越高的信息,在搜索結果列表中的位置越靠前。分類目錄式搜索引擎將互聯網信息按照一定的標準進行收集和分類,并編入相應目錄,以層級和逐次分項的方式管理目錄,查找信息可以按照分類目錄一層層進入,最終找到所要的信息。
3.3 互聯網“超鏈接”搜索
Web信息以超文本鏈接方式組織,基本組織單元是信息節點而不是字符串,信息節點之間通過鏈接進行聯系。超鏈接是網頁必不可少的一個元素,同一主題或相關的信息因超鏈接構成了信息網。超文本信息檢索技術,以超文本信息節點之間的多種鏈接關系為基礎,根據思維聯想或查找信息的需要,通過鏈接從一個信息節點轉到另一個信息節點。
4、網絡信息檢索的未來發展趨勢
網絡技術的發展,給網絡信息檢索及信息的網絡化帶來的極大的便利,進一步推動了網絡信息檢索理論和技術的快速發展。怎樣為網絡用戶提供高質量、高效率的檢索方式是網絡信息檢索研究者的努力方向。信息檢索的對象已從傳統的文本信息擴展到如今開放、動態、分布廣泛的多媒體信息。那么,網絡信息檢索的發展趨勢如何呢?
4.1 智能化信息檢索
智能化信息檢索是基于自然語言處理的檢索形式。檢索工具是對用戶提供的以自然語言表達的檢索要求進行分析,從而形成檢索策略進行檢索。檢索工具智能化的內涵在于檢索工具具有學習、分析、辨別和推理的能力。近年來,因特網上不斷涌現的人工智能產品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網絡信息檢索的智能化程度,促進智能信息檢索的發展。
網絡中的智能代理通常是一個專家系統、一個過程、一個模塊或一個求解單元。智能代理可以獲得用戶的信息需求,自動檢索信息和推送檢索結果信息。多智能代理系統還具有信息發現、信息篩選、信息推送和信息導航功能,可滿足專業研究人員的特定需求,實現網絡信息檢索與服務的智能化。
4.2 一站式信息檢索
一站式(One Stop)信息檢索是指用戶通過一個檢索工具能滿足自己所有的信息檢索需求。一站式信息檢索將是網絡信息檢索服務的一種發展模式。一站式檢索服務是人性化服務的重要體現,它將大量節約用戶的檢索時間。全球最大的搜索引擎Google正在朝著一站式服務的方向發展。2004年12月,Google宣布與紐約公共圖書館和包括哈佛大學圖書館在內的4個主要圖書館合作,將這些圖書館的大約1500萬冊藏書掃描進自己的數據主庫以提供網絡用戶檢索。目前,Google已經為其用戶提供了某種程度上的一站式的檢索服務了。而其他越來越多的檢索服務提供商將向一站式檢索方向發展。
4.3 可視化
可視化指的是運用計算機圖形學和圖像處理技術,將數據轉換為圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術。據統計,獲取信息有70%~80%靠視覺,20%靠聽覺,10%靠觸覺。用圖像取代文字幫助人們檢索的優點在于:圖像的表達更生動、結束語形象、準確,效率更高,具有交互性、多維性、可視性等特點,可以大大加快檢索速度,使時刻都在產生的海量數據得到有效利用。
4.4 商業化
目前網絡信息檢索系統已成為新的投資熱點,網絡信息檢索系統不再僅僅是一種檢索工具,而且是一種商業產品。2001年10月,全球最大的中文搜索引擎提供商百度聯合新浪等多家中文門戶網站,共同推廣“搜索引擎競價排名”全新網絡商業服務模式。網絡信息檢索的商業化還體現在聯機和光盤檢索逐漸進入網絡環境。由于目前網絡信息檢索的檢準率低,聯網的收費聯機和光盤檢索依舊受到青睞,如世界著名的聯機信息系統DIALOG、OCLC、EBSCO、Silverplatter,國內的萬方數據資源系統、中國學術期刊光盤、重慶維普公司系列光盤等都紛紛在網上設立自己的網絡檢索入口。許多著名科技期刊的上網豐富了網絡資源,它們大多數都是在提供印刷版的同時提供期刊的網上服務,包括收費檢索。
5、小結
在的網絡信息資源中尋找自己所需要的信息資源是一件極具挑戰性的工作。為此,許多信息專家正在積極地研究探索,并且取得了不少成果。我們相信隨著科學技術的進步,網絡信息檢索發展會越來越快,人們所利用的檢索工具和手段的更替會更加頻繁。
參考文獻
[1]黃靜.網絡信息檢索發展方向展望[J].Journal of Library and Information Sciences in Agriculture,2008(1):15-19.[2]霍小梅,王小蘭.網絡信息檢索的現狀及發展趨勢[J].圖書館論壇,2004(4):180-182.[3]戴莉.網絡信息檢索的發展趨勢[J].情報探索,2005(2):52-54.[4]徐謙.網絡信息檢索的智能化趨勢[J].圖書館理論與實踐,2006(2):63-65.[5]謝新洲.網絡信息檢索技術與案例[M].北京:北京圖書館出版社,2005:9.[6]易向軍.網絡信息檢索現狀及未來[J].合肥學院學報,2007(7):90-92.