第一篇:計算機信息檢索02139自考資料
第一章 信息檢索概述
1.信息檢索:指將信息按一定的方式組織和存儲起來,并根據信息用戶的需要找出有關信息的過程。
2.根據檢索手段的不同,信息檢索可以分為手工檢索、光盤檢索、聯機檢索和網絡檢索。
3.信息檢索的基本原理
通過對大量的、分散無序的文獻信息是進行搜集、加工、組織、存儲,建立各種各樣的檢索系統,并通過一定的方法和手段使存儲與檢索這兩個過程所采用的特征標識達到一致,以便有效地獲得和利用信息源。
4.信息檢索語言
信息檢索語言是人們在加工、存儲和檢索信息時用來描述信息內容和信息需求的詞匯或符號及其使用規則構成的供標引和檢索的工具。
5.五個信息檢索階段:手工檢索、機械信息檢索、脫機批處理檢索、聯機檢索、網絡信息檢索,后三
者統稱為計算機信息檢索。
6.與手工檢索相比,計算機信息檢索的特點表現在:
(1)速度快、效率高,僅幾分鐘就可以從成千上萬條記錄中找到所需信息;
(2)檢索范圍廣,可以迅速而方便地瀏覽相關學科或主題的所有數據庫中的記錄,在網絡中,幾乎每一臺個人計算機都可以成為信息源;
(3)檢索不受時空的限制,只要擁有相應的軟件和硬件設備,就可以在任何地方借助
光盤和通信網絡查詢所需信息。
7.信息檢索的模型:就是運用數學的語言和工具,對信息檢索系統中的信息及其處理過程加以翻譯和
抽象,表述為某種數學公式,再經過演繹、推斷、解釋和實際校驗,反過來指導信息檢索實踐。
信息檢索的三個經典模型是:布爾模型、向量空間模型和概率模型。
8.信息檢索系統是具有信息存儲和信息查詢功能的一類信息服務設施。
9.信息檢索系統是信息檢索所用的硬件資源、系統軟件以及信息資源集合的總和。
10.數據庫由字段、記錄和文檔構成。
11.根據載體的不同,數據庫可分為:聯機數據庫、光盤數據庫和網絡數據庫三種。
12.信息檢索系統評價的核心是檢索性能評價。
13.檢索性能評價:根據一定的評價指標對實施信息檢索活動所取得的成果進行客觀科學評價,以進一
步完善檢索工作的過程。
評價檢索效果的最主要的指標:查全率和查準率。
14.查全率
查全率是指檢出文獻中合乎需要的文獻數量占數據庫中存在的合乎該需要的所有文獻的比例。
15.查準率
查準率是指檢出文獻中合乎需要的文獻數量占檢出文獻全部數量的比例。
第二章 網絡信息檢索的方法與技術
1.布爾邏輯檢索的主要運算符
布爾邏輯檢索的主要運算符有:邏輯與(“AND”)、邏輯或(“OR”)、邏輯非(“NOT”)。
它們分別代表的含義是:(1)邏輯“與”。表示檢索結果中必須包含所有的檢索詞;(2)邏輯“或”。表示檢索結果中只要包含任何一個檢索詞即可;(3)邏輯非。表示檢索結果中一定不能出現“NOT”后面的檢索詞。
2.鄰近檢索
鄰近檢索是用一些特定的算符來表達檢索詞與檢索詞之間的順序和詞間距的檢索。
3.短語檢索:短語用“ ”表示,檢索出與“”內形式完全相同的短語,以提高檢索的精度和準確度,因而也有人稱之為“精確檢索”
4.截詞檢索
是指在檢索標識中保留相同的部分,用相應的截詞符代替可變化部分。檢索中,計算機會將所有含有相同部分標識的記錄全部檢索出來。截詞符一般用“?”或“*”表示,但不同的數據庫中有所差別。
常用的截詞檢索方法有前截詞、中間截詞和后截詞。
5.在信息檢索過程中,為了提高查全率或查準率,需要將檢索范圍限制在特定的字段中,即字段限制
檢索。
6.模糊檢索:模糊檢索是指使用某一檢索詞進行檢索時,能同時對該詞的同義詞、近義詞、上位詞、下位詞進行檢索,以達到擴大檢索范圍、避免漏檢的目的。
7.信息檢索的主要技術有:
(1)全文檢索技術;(2)多媒體信息檢索技術;(3)超文本及超媒體檢索技術;(4)智能信息檢索技
術;(5)可視化信息檢索技術;(6)跨語言信息檢索技術;(7)文本聚類技術。
(8)智能信息檢索的最大特點是在檢索過程中引入了資源對象的語義處理。
8.檢索策略
檢索策略是為實現檢索目標而制訂的全盤計劃或方案,是就一個問題檢索一個或多個數據庫所輸入的全
部檢索式的集合。
9.信息檢索的一般步驟(主要流程):
(1)分析信息需求。即要確切了解所要查詢的目的和要求,確定檢索問題的關鍵詞、涉及學科、信息類
型、查詢方式、查詢范圍、查詢時間等。
(2)選擇合適的檢索工具。選擇合適的檢索工具主要從檢索工具的類型、收錄范圍、檢索問題的類型、檢索具體要求等方面綜合考慮。
(3)確定檢索點與關鍵詞。應盡量選專指詞、特定概念或專業術語,避免冷僻詞匯和太泛的詞。
(4)正確構造檢索式。利用搜索工具支持的檢索運算、允許使用的檢索標識和各種限定,正確構建檢索
式。
(5)及時調整檢索策略。當檢索結果為零或檢索結果太少,需要擴大檢索范圍;檢索時如果得到太多的檢索結果,或檢索結果不相關,需要縮小檢索范圍。
(6)檢索結果的輸出。
第三章 搜索引擎
1.搜索引擎是一種基于Web上應用的軟件系統,它以一定的策略在Web上搜索和發現信息,在對信
息進行處理和組織后,為用戶提供web信息查詢服務。
搜索引擎有三個功能模塊:網頁搜集;預處理;查詢服務。
2.搜索引擎的工作原理:
搜索引擎的三個功能模塊形成了搜索引擎工作的三個階段。
(1)網頁搜集。系統在一定時間內定向向網站派出“蜘蛛”程序,掃描網站的所有網頁并將相關信息存
入數據庫。
(2)預處理。主要包括關鍵詞的提??;重復網頁或轉載網頁的消除;鏈接分析;網頁重要程度的計算。
(3)查詢服務。搜索引擎接受用戶提交的查詢請求后,按照用戶的要求檢索索引數據庫,找到用戶所需
要的資源,并返回給用戶,列表顯示摘要結果。
3.按信息內容的組織方式,搜索引擎可劃分為目錄式搜索引擎和機器人搜索引擎。
(1)目錄式搜索引擎。是以人工方式或半自動方式搜集信息,由搜索引擎的編輯員查看信息之后,依據
一定的標準對網絡資源進行選擇、評價、人工形成信息摘要,并將信息置于事先確定的分類框架中而形成的主題目錄。
(2)機器人搜索引擎。是由一個被稱作“蜘蛛”的計算機程序依據一定的網絡協議以某種策略自動在互
聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸入檢索索引庫,并
將查詢結果返回給用戶。
4.Yahoo是目前最流行的目錄式搜索引擎,提供主題目錄檢索。
5.按專業范疇劃分,可將搜索引擎劃分為綜合性搜索引擎和專業性搜索引擎。綜合性搜索引擎內容涵
蓋各個學科和生產生活的各個領域,可檢索圖片、音頻、視頻等多種資源類型,適用對象廣泛。
6.常用的綜合性搜索引擎包括哪些,專業性搜索引擎包括哪些
7.按檢索功能劃分,可將搜索引擎劃分為獨立搜索引擎和元搜索引擎。元搜索引擎是多個獨立搜索引
擎的集合,通過一個統一的用戶界面,可同時對多個搜索引擎進行檢索操作。
8.調查顯示,截止2009年6月底,中國網民人數已達3.38億。其中約2.35億網民使用過搜索引擎,中國網民用得最多的搜索引擎是百度。在全球范圍內,2009年7月,搜索引擎用戶已達1137億次,其中Google市場份額最高。
9.綜合性搜索引擎的評價指標主要有:
(1)收錄范圍。即搜索引擎收錄的范圍是否完備充分。(2)分類。即搜索引擎的分類是否科學合理,分類的廣度與深度是否合適。(3)檢索功能與效果。檢索手段是否完善,檢索效果是否好。(4)對檢索結果的處理。結果的排序方式是否多樣、是否有去重功能、能否按照用戶反饋動態調整和顯示檢索結果。(5)頁
面組織。頁面組織是否清晰、類目設置是否合理、界面是否友好。(6)其他功能與服務。能否滿足用戶多方
面的信息需求。
第四章
1.國內重要的綜合性信息檢索系統中國知網CNKI的《中國期刊全文數據庫》(CAJ)是目前世界上最大的連續動態更新的中國期刊
全文數據庫,收錄了國內1994年至今的8200余種綜合性期刊與專業特色期刊的全文。
2.中國知網CNKI提供了導航檢索、邏輯式檢索、智能輔助檢索三種類型。
3.中國知網的源數據庫資源主要有:中國學術期刊全文數據庫,中國博士學位論文全文數據庫,中國
優秀碩士學術論文全文數據庫,中國重要會議論文全文數據庫,中國重要報紙全文數據庫,中國年
鑒網絡出版總庫,中國工具書網絡出版總庫。
4.維普資訊網VIP的前身是科學技術部西南情報中心的情報分析網站,目前已發展成為集外文獻、企業咨詢、動態新聞服務、行業信息資源等多種服務為一體的科技文獻知識資源門戶網站。
5.維普資訊網的主要資源有:中國科技期刊數據庫,中文科技期刊引文庫,外文科技期刊數據庫,中
國科技經濟新聞數據庫,中國科學指標數據庫。
6.維普資訊網設有專門的“專業檢索首頁”,為中文期刊專業文章提供一站式的檢索服務。檢索方式
有快速檢索,傳統檢索,高級檢索,期刊導航。
7.國家科技圖書文獻中心NSTL是經國務院領導批準,于2000年6月12日成立的一個基于網絡環境的科技信息資源服務機構。
8.國際科學引文數據庫(DISC)是國家科技圖書文獻中心(NTSL)于2006年首創的集文獻發現、引文鏈接、原文傳遞為一體的信息服務系統。它提供快速檢索,期刊瀏覽,來源文獻檢索,引文檢
索。
9.中國高等教育文獻保障系統CALIS 是經國務院批準的我國高等教育“211工程”、“九五”、“十五”
總體規劃中三個公共服務體系之一。它的數據資源主要有中文數據資源、外文數據資源兩大類。
10.中國高等教育文獻保障系統(CALIS)中的聯合目錄公共檢索系統(OPAC)選擇多庫分類檢索,OPAC中的數據按照語種劃分,可分為中文、西文、日文、俄文四個數據庫。
11.中國科學院國家科學數字圖書館(CSDL)建設以來非常重視信息服務,其中:論文查收查引檢索
及評價服務是根據用戶需要,在國內外權威數據庫中檢索其論文被收錄和被引用的情況,并出具相
關檢索證明報告。定題、專題檢索服務是針對用戶事先選定的專題,定期或不定期地進行文獻跟蹤
檢索,把經過篩選的最新檢索結果,以書目、索引、全文等方式提供給用戶。科技查新服務是根據
用戶提供的有關科研資料查證其研究結果是否具有新穎性,并做出結論。在線參考咨詢服務是用戶
可按專業、機構或所處地理位置選擇專家提問,可在線提交咨詢表單。
第五章 國外重要的綜合性信息檢索系統
1.學術資源整合平臺(WOK)是基于互聯網建立的動態的學術信息資源整合平臺,提供自然科學、工程技術、社會科學、藝術與人文等多個領域中高質量的學術信息。
2.學術資源整合平臺(WOK)支持的運算有布爾邏運算,截詞檢索,短語檢索。
3.在截詞檢索中,通常運用*代表多個字符,運用?代表一個字符。
4.引文檢索是指從被引著者、被引文獻入手檢索文獻的被引用情況。
5.美國Dialog系統是世界上最早和最大的專業情報檢索系統,也是我國科技界廣泛使用的系統。
6.美國Dialog聯機檢索系統支持的運算有布爾邏運算,位置限制檢索,短語檢索和截詞檢索。
7.SDOL采取瀏覽與檢索相結合的方式,主要有期刊論文瀏覽、快速檢索、高級檢索、專家檢索。
8.聯機計算機圖書館中心(或OCLC)創立于1967年,是全球最大的不以贏利為目的、維護和管理
電子資源系統并提供計算機圖書館服務的會員制合作和研究組織。
9.PowerSearch 2.0檢索平臺支持對Gale的2萬多種出版物的瀏覽,提供5種檢索方式,包括基本檢
索、主題詞瀏覽、出版物瀏覽、高級檢索、異構跨庫檢索。
10.CSAIllumina 是一個多學科、多信息類型的信息服務平臺,目前由美國Proquest公司提供服務,具有多語種文字檢索界面。
第六章 國外專業性書目信息檢索系統
1.SciFinder是美國化學學會的分支機構推出的基于網絡的文獻檢索系統。
2.在SciFinder檢索窗口最上方的主工具欄中列出了3種檢索模式:Explore References,Explore
Substances,Explore Reactions。
3.在數據庫CASREACT中檢索化學反應及相關信息。檢索化學反應僅有1種檢索途徑。
4.用化學結構式檢索化學反應,可以用反應分類,報道反應信息的文獻來源,文獻出版年和反應步數
5.6.7.8.9.10.11.12.13.14.15.16.第七章
1.2.3.4.5.6.7.8.9.10.11.加以限定,以縮小檢索范圍。在數據庫CAS Registry 中檢索化合物及相關信息,系統提供3種檢索途徑:化學結構檢索,分子式檢索,物質檢索.BP主界面上提供6種檢索方式:基本檢索,高級檢索,題錄檢索,檢索工具,字段檢索,多字段檢索。工程索引(Engineering Village)系統所提供了5種檢索方式:簡單檢索,快速檢索,專家檢索,詞表檢索,標簽檢索。PubMed提供概要、簡介、文摘、引文、MEDLINE等5種顯示檢索結果內容的記錄格式。PubMed可以全部或部分保存文獻記錄,既可保存當前頁,又可以保存其中的幾條記錄。保存方式有:網頁格式和純文本方式。荷蘭醫學文摘(Excerpta Medica,簡稱EM)創刊于1947年 美國教育資源信息中心(ERIC)的檢索方法有:初級檢索,高級檢索,ERIC敘詞表檢索。美國教育資源信息中心(簡稱ERIC)包括兩部分內容:教育資源 和當前教育期刊索引。LexisNexis公司的數據庫產品有:律商聯訊、法律數據庫、國會大全、統計大全、環境大全和學術大全。進入LexisNexis中文網站后,可見4個資源子庫:法律子庫,新聞和商業子庫,企業界信息子庫,在線查詢庫LexisNexis在線服務數據庫主頁的特點是無檢索框。LexisNexis系統默認的是Search方式,這種方式最符合用戶的檢索習慣。Internet上多媒體信息的檢索 多媒體信息檢索是指對包括圖像和音頻、視頻等在內的多媒體信息進行特征元數據提取、索引建庫,同時根據用戶的檢索需求,將用戶的信息需求表達與多媒體索引庫進行相似度匹配運算,識別和返回用戶所需信息,并通過與用戶之間的反饋,不斷優化、調整顯示結果的過程。目前,主流的多媒體信息檢索方式主要分為基于文本的和基于內容的多媒體信息檢索兩類?,F在,主流搜索引擎都有基于文本 的圖像檢索功能,具有基于內容的圖像檢索功能的搜索工具還不多見。基于內容的圖像檢索的原理是:首先根據分析圖像的內容,提取其顏色、形狀、紋理,以及對象空間關系等信息,建立圖像的特征索引庫,而后將用戶的檢索提問與特征索引庫進行匹配計算,返回檢索結果。常見的圖像檢索系統有10個:QBIC, WebSEEK, TinEye, Titomo, VAST, ImageRover, Scour, Amazing Picture Machine, Lycos, Image SurferQBIC:QBIC是基于內容的圖像檢索系統的簡稱,是IBM Almaden研究中心開發的第一個商用的基于內容的圖像及視頻檢索系統,主要為IBM的DB2大型數據庫提供圖像檢索,并支持基于Web的圖像檢索服務。它提供了對靜止圖像及視頻信息基于內容的檢索手段,是標準的基于內容特征檢索圖像的工具。WebSEEK的檢索途徑有3種:一是使用關鍵詞進行自由全文檢索,但不支持短語檢索;二是利用不同的類目等級進行主題瀏覽;三是在檢出圖像的基礎上利用其可視屬性進行進一步檢索。視覺語義圖像查詢系統提供4種功能,分別是:(1)文本查詢功能:可以直接在文本檢索框中輸入想要查詢的文本關鍵字;(2)示例查詢功能:在示例圖像框中輸入想要查詢的樣例圖像,或者點擊瀏覽選擇圖片;(3)綜合查詢功能:在示例圖像框中輸入想要查詢的樣例圖像,或者點擊瀏覽選擇,同時在文本檢索框中輸入想要查詢的文本關鍵字;(4)相關反饋:在進行文本查詢后,如果滿意結果中的某張圖片,可以點擊該圖片下面的反饋鏈接,系統將返回與此圖片相似且與文本關鍵字相關的圖片集?;趦热莸囊曨l檢索通常有基于屬性和基于對象兩種方法,可以通過顏色、紋理、形狀、空間聯系、原始語義、客觀屬性、主觀屬性、動作、文本和領域概念來表征視頻信息?;趦热莸囊曨l檢索,其檢索過程分為數據庫建立和視頻檢索兩個階段,前一階段的任務主要是偵測視頻片段邊界、選擇關鍵屬性和提取諸如顏色、紋理、形狀等低級別的空間特征,后一階段則致力于通過顏色、形狀或顏色與其他類目的組合,來進行用戶需求向量與已有資源向量空間的相似度匹配。現有的基于內容的視頻信息檢索工具主要有6個:VisualSeek,Informedia-II Digital Video Library,Google Video Search, Yahoo Video Search, Open V,VideoQ
12.音頻信息的檢索可通過同音比較、聽覺或知覺特征的提取、個人語言的主觀特征描述和 擬聲法 4
種方式來實現。
八 專題信息的檢索
1.專利包含三層含義,分別是專利權、專利技術和專利說明書。
2.專利權是指國家專利主管機關依據專利法授予申請人的一種實施其發明創造的專有權。
3.我國專利法將專利分為三種,即發明、實用新型和外觀設計。
4.專利信息是指以專利文獻作為主要內容或以專利文獻為依據,經分解、加工、標引、統計、分析、整合和轉化等信息化手段處理,并通過各種信息化方式傳播而形成的與專利有關的各種信息的總稱。
5.專利信息可分為5種:技術信息、法律信息、經濟信息、著錄信息、戰略信息。
6.專利文獻是包含已經申請或被確認為發現、發明、實用新型和工業品外觀設計的研究、設計、開發
和試驗成果的有關資料,以及保護發明人、專利所有人及工業品外觀設計和實用新型注冊證書持有人權利的有關資料的已出版或未出版的文件(或其摘要)的總稱。
7.專利文獻的類型有一次專利文獻,二次專利文獻,專利分類資料。
8.專利分類是按專利文獻的技術內容或 主題進行分類,以便于查找,各國曾有不同的專利文獻分
類法。
9.中國專利說明書的編號體系包括:申請號,專利號,公開號,授權公告號
10.專門檢索專利的搜索引擎有:FreePatentsOnline,IP-Discover,免費專利在線
11.商標是區別商品或服務來源的一種標志,每一個注冊商標都是指定用于某一商品或服務上的。
12.商標信息檢索的途徑有:分類檢索,關鍵詞檢索,圖像檢索
13.商標信息的主要來源有:商標主管部門提供的商標信息,商業性的商標數據庫,專門的商標搜索引
擎,某企業的商標數據庫。
14.專門的商標搜索引擎有:Trademarkia,桑尼維爾專利和商標中心,托馬斯網
15.商業性的科技報告數據庫:萬方數據中的科技成果類數據庫,NSTL的國外科技報告數據庫,NTIS
美國政府報告數據庫。
16.科技報告按保密性可以分為:保密報告、非保密報告和解密報告。
第九章 網絡信息檢索與利用中的有關問題
1.《時代》雜志自2003年起每年都會評選最佳網站。
2.Robert Harris是一名作家和具有多年大學教育經驗的教育家,他提出了因特網研究資源評價的著名的CARS指標體系,即:可信性、準確性、合理性、支持度。
3.我們將網絡信息的評價標準歸為兩大類:網站性能的評價標準和網站內容的評價標準。
4.網站內容是網絡信息資源評估中最重要的指標。
5.網絡信息資源的評價方法一般劃分為定性評價法、定量評價法和綜合評價法。
6.網絡信息利用中應特別注意知識產權的四個特征,即法定性、專有性、地域性和時間性。
7.個人文獻管理軟件是一種用于幫助用戶組織、管理與課題相關的參考文獻,建立個人參考文獻數據
庫的軟件。
8.個人文獻管理軟件的主要作用是幫助用戶有效管理已經獲取的文獻信息,并且對已經獲得的文獻信
息進行方便快捷的利用。
9.個人文獻管理軟件的基本功能包括:建立個人的書目文獻數據庫,或是個人虛擬圖書館;幫助用戶
組織、管理已獲取的文獻信息;對個人的書目文獻數據庫進行快速檢索;按特定格式要求快速插入引文(參考文獻);導出/導入、備份/恢復個人文獻數據庫中的內容。
10.自動翻譯是在沒有人工翻譯參與的情況下,利用最新技術生成的翻譯,自動翻譯通常也稱為“機器
翻譯”。
11.自動翻譯工具的功能有:文本翻譯、文檔翻譯、網站翻譯和翻譯電子郵件。
第十章 信息檢索的主要應用-科技查新
1.“查新”一詞來源于專利審查,其本來意義是新穎性檢索,最早見于1978年6月公布的《專利合作條例》。
2.1991年國家科委正式制定《科技查新咨詢工作管理辦法(討論稿)》,并通過考核評定,公布了首
批11個國家查新咨詢單位,查新工作納入制度化軌道?
3.查新咨詢分為以下幾類:科研咨詢;產品咨詢;技術、方法咨詢以及專利咨詢。
4.查新質量主要表現在文獻檢索質量和查新報告質量兩方面。
5.查新報告的質量情況主要由對比分析質量、結論質量和表述質量反映。
第二篇:計算機信息檢索02139自考資料
第一章 信息檢索概述
1.信息檢索:指將信息按一定的方式組織和存儲起來,并根據信息用戶的需要找出有關信息的過程。2.根據檢索手段的不同,信息檢索可以分為手工檢索、光盤檢索、聯機檢索和網絡檢索。3.信息檢索的基本原理
通過對大量的、分散無序的文獻信息是進行搜集、加工、組織、存儲,建立各種各樣的檢索系統,并通過一定的方法和手段使存儲與檢索這兩個過程所采用的特征標識達到一致,以便有效地獲得和利用信息源。
4.信息檢索語言
信息檢索語言是人們在加工、存儲和檢索信息時用來描述信息內容和信息需求的詞匯或符號及其使用規則構成的供標引和檢索的工具。
5.五個信息檢索階段:手工檢索、機械信息檢索、脫機批處理檢索、聯機檢索、網絡信息檢索,后三者統稱為計算機信息檢索。
6.與手工檢索相比,計算機信息檢索的特點表現在:
(1)速度快、效率高,僅幾分鐘就可以從成千上萬條記錄中找到所需信息;
(2)檢索范圍廣,可以迅速而方便地瀏覽相關學科或主題的所有數據庫中的記錄,在網絡中,幾乎每一臺個人計算機都可以成為信息源;
(3)檢索不受時空的限制,只要擁有相應的軟件和硬件設備,就可以在任何地方借助光盤和通信網絡查詢所需信息。
7.信息檢索的模型:就是運用數學的語言和工具,對信息檢索系統中的信息及其處理過程加以翻譯和抽象,表述為某種數學公式,再經過演繹、推斷、解釋和實際校驗,反過來指導信息檢索實踐。信息檢索的三個經典模型是:布爾模型、向量空間模型和概率模型。8.信息檢索系統是具有信息存儲和信息查詢功能的一類信息服務設施。
9.信息檢索系統是信息檢索所用的硬件資源、系統軟件以及信息資源集合的總和。10.數據庫由字段、記錄和文檔構成。
11.根據載體的不同,數據庫可分為:聯機數據庫、光盤數據庫和網絡數據庫三種。12.信息檢索系統評價的核心是檢索性能評價。13.檢索性能評價:根據一定的評價指標對實施信息檢索活動所取得的成果進行客觀科學評價,以進一步完善檢索工作的過程。
評價檢索效果的最主要的指標:查全率和查準率。14.查全率
查全率是指檢出文獻中合乎需要的文獻數量占數據庫中存在的合乎該需要的所有文獻的比例。15.查準率
查準率是指檢出文獻中合乎需要的文獻數量占檢出文獻全部數量的比例。
第二章 網絡信息檢索的方法與技術
1.布爾邏輯檢索的主要運算符
布爾邏輯檢索的主要運算符有:邏輯與(“AND”)、邏輯或(“OR”)、邏輯非(“NOT”)。它們分別代表的含義是:(1)邏輯“與”。表示檢索結果中必須包含所有的檢索詞;(2)邏輯“或”。表示檢索結果中只要包含任何一個檢索詞即可;(3)邏輯非。表示檢索結果中一定不能出現“NOT”后面的檢索詞。
2.鄰近檢索
鄰近檢索是用一些特定的算符來表達檢索詞與檢索詞之間的順序和詞間距的檢索。
3.短語檢索:短語用“ ”表示,檢索出與“”內形式完全相同的短語,以提高檢索的精度和準確度,因而也有人稱之為“精確檢索” 4.截詞檢索
是指在檢索標識中保留相同的部分,用相應的截詞符代替可變化部分。檢索中,計算機會將所有含有相同部分標識的記錄全部檢索出來。截詞符一般用“?”或“*”表示,但不同的數據庫中有所差別。
常用的截詞檢索方法有前截詞、中間截詞和后截詞。
5.在信息檢索過程中,為了提高查全率或查準率,需要將檢索范圍限制在特定的字段中,即字段限制檢索。
6.模糊檢索:模糊檢索是指使用某一檢索詞進行檢索時,能同時對該詞的同義詞、近義詞、上位詞、下位詞進行檢索,以達到擴大檢索范圍、避免漏檢的目的。
7.信息檢索的主要技術有:
(1)全文檢索技術;(2)多媒體信息檢索技術;(3)超文本及超媒體檢索技術;(4)智能信息檢索技術;
(5)可視化信息檢索技術;(6)跨語言信息檢索技術;(7)文本聚類技術。
(8)智能信息檢索的最大特點是在檢索過程中引入了資源對象的語義處理。8.檢索策略
檢索策略是為實現檢索目標而制訂的全盤計劃或方案,是就一個問題檢索一個或多個數據庫所輸入的全部檢索式的集合。
9.信息檢索的一般步驟(主要流程):
(1)分析信息需求。即要確切了解所要查詢的目的和要求,確定檢索問題的關鍵詞、涉及學科、信息類型、查詢方式、查詢范圍、查詢時間等。
(2)選擇合適的檢索工具。選擇合適的檢索工具主要從檢索工具的類型、收錄范圍、檢索問題的類型、檢索具體要求等方面綜合考慮。
(3)確定檢索點與關鍵詞。應盡量選專指詞、特定概念或專業術語,避免冷僻詞匯和太泛的詞。
(4)正確構造檢索式。利用搜索工具支持的檢索運算、允許使用的檢索標識和各種限定,正確構建檢索式。
(5)及時調整檢索策略。當檢索結果為零或檢索結果太少,需要擴大檢索范圍;檢索時如果得到太多的檢索結果,或檢索結果不相關,需要縮小檢索范圍。
(6)檢索結果的輸出。
第三章 搜索引擎
1.搜索引擎是一種基于Web上應用的軟件系統,它以一定的策略在Web上搜索和發現信息,在對信息進行處理和組織后,為用戶提供web信息查詢服務。搜索引擎有三個功能模塊:網頁搜集;預處理;查詢服務。2.搜索引擎的工作原理:
搜索引擎的三個功能模塊形成了搜索引擎工作的三個階段。
(1)網頁搜集。系統在一定時間內定向向網站派出“蜘蛛”程序,掃描網站的所有網頁并將相關信息存入數據庫。
(2)預處理。主要包括關鍵詞的提取;重復網頁或轉載網頁的消除;鏈接分析;網頁重要程度的計算。
(3)查詢服務。搜索引擎接受用戶提交的查詢請求后,按照用戶的要求檢索索引數據庫,找到用戶所需要的資源,并返回給用戶,列表顯示摘要結果。
3.按信息內容的組織方式,搜索引擎可劃分為目錄式搜索引擎和機器人搜索引擎。
(1)目錄式搜索引擎。是以人工方式或半自動方式搜集信息,由搜索引擎的編輯員查看信息之后,依據一定的標準對網絡資源進行選擇、評價、人工形成信息摘要,并將信息置于事先確定的分類框架中而形成的主題目錄。
(2)機器人搜索引擎。是由一個被稱作“蜘蛛”的計算機程序依據一定的網絡協議以某種策略自動在互聯網中搜集和發現信息,由索引器為搜集到的信息建立索引,由檢索器根據用戶的查詢輸入檢索索引庫,并將查詢結果返回給用戶。
4.Yahoo是目前最流行的目錄式搜索引擎,提供主題目錄檢索。5.按專業范疇劃分,可將搜索引擎劃分為綜合性搜索引擎和專業性搜索引擎。綜合性搜索引擎內容涵蓋各個學科和生產生活的各個領域,可檢索圖片、音頻、視頻等多種資源類型,適用對象廣泛。6.常用的綜合性搜索引擎包括哪些,專業性搜索引擎包括哪些
7.按檢索功能劃分,可將搜索引擎劃分為獨立搜索引擎和元搜索引擎。元搜索引擎是多個獨立搜索引擎的集合,通過一個統一的用戶界面,可同時對多個搜索引擎進行檢索操作。
8.調查顯示,截止2009年6月底,中國網民人數已達3.38億。其中約2.35億網民使用過搜索引擎,中國網民用得最多的搜索引擎是百度。在全球范圍內,2009年7月,搜索引擎用戶已達1137億次,其中Google市場份額最高。
9.綜合性搜索引擎的評價指標主要有:
(1)收錄范圍。即搜索引擎收錄的范圍是否完備充分。(2)分類。即搜索引擎的分類是否科學合理,分類的廣度與深度是否合適。(3)檢索功能與效果。檢索手段是否完善,檢索效果是否好。(4)對檢索結果的處理。結果的排序方式是否多樣、是否有去重功能、能否按照用戶反饋動態調整和顯示檢索結果。(5)頁面組織。頁面組織是否清晰、類目設置是否合理、界面是否友好。(6)其他功能與服務。能否滿足用戶多方面的信息需求。
第四章
1.國內重要的綜合性信息檢索系統
中國知網CNKI的《中國期刊全文數據庫》(CAJ)是目前世界上最大的連續動態更新的中國期刊全文數據庫,收錄了國內1994年至今的8200余種綜合性期刊與專業特色期刊的全文。
2.中國知網CNKI提供了導航檢索、邏輯式檢索、智能輔助檢索三種類型。
3.中國知網的源數據庫資源主要有:中國學術期刊全文數據庫,中國博士學位論文全文數據庫,中國優秀碩士學術論文全文數據庫,中國重要會議論文全文數據庫,中國重要報紙全文數據庫,中國年鑒網絡出版總庫,中國工具書網絡出版總庫。
4.維普資訊網VIP的前身是科學技術部西南情報中心的情報分析網站,目前已發展成為集外文獻、企業咨詢、動態新聞服務、行業信息資源等多種服務為一體的科技文獻知識資源門戶網站。
5.維普資訊網的主要資源有:中國科技期刊數據庫,中文科技期刊引文庫,外文科技期刊數據庫,中國科技經濟新聞數據庫,中國科學指標數據庫。6.維普資訊網設有專門的“專業檢索首頁”,為中文期刊專業文章提供一站式的檢索服務。檢索方式有快速檢索,傳統檢索,高級檢索,期刊導航。7.國家科技圖書文獻中心NSTL是經國務院領導批準,于2000年6月12日成立的一個基于網絡環境的科技信息資源服務機構。
8.國際科學引文數據庫(DISC)是國家科技圖書文獻中心(NTSL)于2006年首創的集文獻發現、引文鏈接、原文傳遞為一體的信息服務系統。它提供快速檢索,期刊瀏覽,來源文獻檢索,引文檢索。
9.中國高等教育文獻保障系統CALIS 是經國務院批準的我國高等教育“211工程”、“九五”、“十五”總體規劃中三個公共服務體系之一。它的數據資源主要有中文數據資源、外文數據資源兩大類。10.中國高等教育文獻保障系統(CALIS)中的聯合目錄公共檢索系統(OPAC)選擇多庫分類檢索,OPAC中的數據按照語種劃分,可分為中文、西文、日文、俄文四個數據庫。
11.中國科學院國家科學數字圖書館(CSDL)建設以來非常重視信息服務,其中:論文查收查引檢索及評價服務是根據用戶需要,在國內外權威數據庫中檢索其論文被收錄和被引用的情況,并出具相關檢索證明報告。定題、專題檢索服務是針對用戶事先選定的專題,定期或不定期地進行文獻跟蹤檢索,把經過篩選的最新檢索結果,以書目、索引、全文等方式提供給用戶??萍疾樾路帐歉鶕脩籼峁┑挠嘘P科研資料查證其研究結果是否具有新穎性,并做出結論。在線參考咨詢服務是用戶可按專業、機構或所處地理位置選擇專家提問,可在線提交咨詢表單。
第五章 國外重要的綜合性信息檢索系統
1.學術資源整合平臺(WOK)是基于互聯網建立的動態的學術信息資源整合平臺,提供自然科學、工程技術、社會科學、藝術與人文等多個領域中高質量的學術信息。
2.學術資源整合平臺(WOK)支持的運算有布爾邏運算,截詞檢索,短語檢索。3.在截詞檢索中,通常運用*代表多個字符,運用?代表一個字符。4.引文檢索是指從被引著者、被引文獻入手檢索文獻的被引用情況。
5.美國Dialog系統是世界上最早和最大的專業情報檢索系統,也是我國科技界廣泛使用的系統。6.美國Dialog聯機檢索系統支持的運算有布爾邏運算,位置限制檢索,短語檢索和截詞檢索。7.SDOL采取瀏覽與檢索相結合的方式,主要有期刊論文瀏覽、快速檢索、高級檢索、專家檢索。8.聯機計算機圖書館中心(或OCLC)創立于1967年,是全球最大的不以贏利為目的、維護和管理電子資源系統并提供計算機圖書館服務的會員制合作和研究組織。
9.PowerSearch 2.0檢索平臺支持對Gale的2萬多種出版物的瀏覽,提供5種檢索方式,包括基本檢索、主題詞瀏覽、出版物瀏覽、高級檢索、異構跨庫檢索。
10.CSA Illumina 是一個多學科、多信息類型的信息服務平臺,目前由美國Proquest公司提供服務,具有多語種文字檢索界面。
第六章 國外專業性書目信息檢索系統
1.SciFinder是美國化學學會的分支機構推出的基于網絡的文獻檢索系統。
2.在SciFinder檢索窗口最上方的主工具欄中列出了3種檢索模式:Explore References,Explore Substances,Explore Reactions。
3.在數據庫CASREACT中檢索化學反應及相關信息。檢索化學反應僅有1種檢索途徑。
4.用化學結構式檢索化學反應,可以用反應分類,報道反應信息的文獻來源,文獻出版年和反應步數
5.6.7.8.9.10.11.12.13.14.15.16.第七章
1.2.3.4.5.6.7.8.9.10.11.加以限定,以縮小檢索范圍。
在數據庫CAS Registry 中檢索化合物及相關信息,系統提供3種檢索途徑:化學結構檢索,分子式檢索,物質檢索.BP主界面上提供6種檢索方式:基本檢索,高級檢索,題錄檢索,檢索工具,字段檢索,多字段檢索。
工程索引(Engineering Village)系統所提供了5種檢索方式:簡單檢索,快速檢索,專家檢索,詞表檢索,標簽檢索。
PubMed提供概要、簡介、文摘、引文、MEDLINE等5種顯示檢索結果內容的記錄格式。
PubMed可以全部或部分保存文獻記錄,既可保存當前頁,又可以保存其中的幾條記錄。保存方式有:
網頁格式
和純文本方式。
荷蘭醫學文摘(Excerpta Medica,簡稱EM)創刊于1947年
美國教育資源信息中心(ERIC)的檢索方法有:初級檢索,高級檢索,ERIC敘詞表檢索。美國教育資源信息中心(簡稱ERIC)包括兩部分內容:教育資源 和當前教育期刊索引。
LexisNexis公司的數據庫產品有:律商聯訊、法律數據庫、國會大全、統計大全、環境大全和學術大全。
進入LexisNexis中文網站后,可見4個資源子庫:法律子庫,新聞和商業子庫,企業界信息子庫,在線查詢庫
LexisNexis在線服務數據庫主頁的特點是無檢索框。
LexisNexis系統默認的是Search方式,這種方式最符合用戶的檢索習慣。
Internet上多媒體信息的檢索
多媒體信息檢索是指對包括圖像和音頻、視頻等在內的多媒體信息進行特征元數據提取、索引建庫,同時根據用戶的檢索需求,將用戶的信息需求表達與多媒體索引庫進行相似度匹配運算,識別和返回用戶所需信息,并通過與用戶之間的反饋,不斷優化、調整顯示結果的過程。
目前,主流的多媒體信息檢索方式主要分為基于文本的和基于內容的多媒體信息檢索兩類。
現在,主流搜索引擎都有基于文本 的圖像檢索功能,具有基于內容的圖像檢索功能的搜索工具還不多見。
基于內容的圖像檢索的原理是:首先根據分析圖像的內容,提取其顏色、形狀、紋理,以及對象空間關系等信息,建立圖像的特征索引庫,而后將用戶的檢索提問與特征索引庫進行匹配計算,返回檢索結果。
常見的圖像檢索系統有10個:QBIC, WebSEEK, TinEye, Titomo, VAST, ImageRover, Scour, Amazing Picture Machine, Lycos, Image Surfer
QBIC:QBIC是基于內容的圖像檢索系統的簡稱,是IBM Almaden研究中心開發的第一個商用的基于內容的圖像及視頻檢索系統,主要為IBM的DB2大型數據庫提供圖像檢索,并支持基于Web的圖像檢索服務。它提供了對靜止圖像及視頻信息基于內容的檢索手段,是標準的基于內容特征檢索圖像的工具。
WebSEEK的檢索途徑有3種:一是使用關鍵詞進行自由全文檢索,但不支持短語檢索;二是利用不同的類目等級進行主題瀏覽;三是在檢出圖像的基礎上利用其可視屬性進行進一步檢索。視覺語義圖像查詢系統提供4種功能,分別是:(1)文本查詢功能:可以直接在文本檢索框中輸入想要查詢的文本關鍵字;(2)示例查詢功能:在示例圖像框中輸入想要查詢的樣例圖像,或者點擊瀏覽選擇圖片;(3)綜合查詢功能:在示例圖像框中輸入想要查詢的樣例圖像,或者點擊瀏覽選擇,同時在文本檢索框中輸入想要查詢的文本關鍵字;(4)相關反饋:在進行文本查詢后,如果滿意結果中的某張圖片,可以點擊該圖片下面的反饋鏈接,系統將返回與此圖片相似且與文本關鍵字相關的圖片集。
基于內容的視頻檢索通常有基于屬性和基于對象
兩種方法,可以通過顏色、紋理、形狀、空間聯系、原始語義、客觀屬性、主觀屬性、動作、文本和領域概念來表征視頻信息。基于內容的視頻檢索,其檢索過程分為數據庫建立和視頻檢索兩個階段,前一階段的任務主要是偵測視頻片段邊界、選擇關鍵屬性和提取諸如顏色、紋理、形狀等低級別的空間特征,后一階段則致力于通過顏色、形狀或顏色與其他類目的組合,來進行用戶需求向量與已有資源向量空間的相似度匹配。
現有的基于內容的視頻信息檢索工具主要有6個:VisualSeek,Informedia-II Digital Video Library, Google Video Search, Yahoo Video Search, Open V,VideoQ
12.音頻信息的檢索可通過同音比較、聽覺或知覺特征的提取、個人語言的主觀特征描述和 擬聲法 4種方式來實現。
八 專題信息的檢索
1.專利包含三層含義,分別是專利權、專利技術和
專利說明書。
2.專利權是指國家專利主管機關依據專利法授予申請人的一種實施其發明創造的專有權。3.我國專利法將專利分為三種,即發明、實用新型
和外觀設計。
4.專利信息是指以專利文獻作為主要內容或以專利文獻為依據,經分解、加工、標引、統計、分析、整合和轉化等信息化手段處理,并通過各種信息化方式傳播而形成的與專利有關的各種信息的總稱。
5.專利信息可分為5種:技術信息、法律信息、經濟信息、著錄信息、戰略信息。
6.專利文獻是包含已經申請或被確認為發現、發明、實用新型和工業品外觀設計的研究、設計、開發和試驗成果的有關資料,以及保護發明人、專利所有人及工業品外觀設計和實用新型注冊證書持有人權利的有關資料的已出版或未出版的文件(或其摘要)的總稱。7.專利文獻的類型有一次專利文獻,二次專利文獻,專利分類資料。
8.專利分類是按專利文獻的技術內容或 主題
進行分類,以便于查找,各國曾有不同的專利文獻分類法。
9.中國專利說明書的編號體系包括:申請號,專利號,公開號,授權公告號
10.專門檢索專利的搜索引擎有:FreePatentsOnline,IP-Discover,免費專利在線
11.商標是區別商品或服務來源的一種標志,每一個注冊商標都是指定用于某一商品或服務上的。12.商標信息檢索的途徑有:分類檢索,關鍵詞檢索,圖像檢索
13.商標信息的主要來源有:商標主管部門提供的商標信息,商業性的商標數據庫,專門的商標搜索引擎,某企業的商標數據庫。
14.專門的商標搜索引擎有:Trademarkia,桑尼維爾專利和商標中心,托馬斯網
15.商業性的科技報告數據庫:萬方數據中的科技成果類數據庫,NSTL的國外科技報告數據庫,NTIS美國政府報告數據庫。
16.科技報告按保密性可以分為:保密報告、非保密報告和
解密報告
。第九章 網絡信息檢索與利用中的有關問題
1.《時代》雜志自2003年起每年都會評選最佳網站。
2.Robert Harris是一名作家和具有多年大學教育經驗的教育家,他提出了因特網研究資源評價的著名的CARS指標體系,即:可信性、準確性、合理性、支持度。
3.我們將網絡信息的評價標準歸為兩大類:網站性能的評價標準和網站內容的評價標準。4.網站內容是網絡信息資源評估中最重要的指標。
5.網絡信息資源的評價方法一般劃分為定性評價法、定量評價法和綜合評價法。
6.網絡信息利用中應特別注意知識產權的四個特征,即法定性、專有性、地域性和時間性。7.個人文獻管理軟件是一種用于幫助用戶組織、管理與課題相關的參考文獻,建立個人參考文獻數據庫的軟件。
8.個人文獻管理軟件的主要作用是幫助用戶有效管理已經獲取的文獻信息,并且對已經獲得的文獻信息進行方便快捷的利用。
9.個人文獻管理軟件的基本功能包括:建立個人的書目文獻數據庫,或是個人虛擬圖書館;幫助用戶組織、管理已獲取的文獻信息;對個人的書目文獻數據庫進行快速檢索;按特定格式要求快速插入引文(參考文獻);導出/導入、備份/恢復個人文獻數據庫中的內容。
10.自動翻譯是在沒有人工翻譯參與的情況下,利用最新技術生成的翻譯,自動翻譯通常也稱為“機器翻譯”。
11.自動翻譯工具的功能有:文本翻譯、文檔翻譯、網站翻譯和翻譯電子郵件。第十章 信息檢索的主要應用-科技查新
1.“查新”一詞來源于專利審查,其本來意義是新穎性檢索,最早見于1978年6月公布的《專利合作條例》。
2.1991年國家科委正式制定《科技查新咨詢工作管理辦法(討論稿)》,并通過考核評定,公布了首批11個國家查新咨詢單位,查新工作納入制度化軌道?
3.查新咨詢分為以下幾類:科研咨詢;產品咨詢;技術、方法咨詢以及專利咨詢。4.查新質量主要表現在文獻檢索質量和查新報告質量兩方面。
5.查新報告的質量情況主要由對比分析質量、結論質量和表述質量反映。
第三篇:信息檢索資料
醫學信息檢索
1、信息素養(Information Literacy):是指一個人“能認識到何時需要信息,和有效地搜索、評估和使用所需要的信息的能力?!?/p>
2、信息素養的內涵:包括信息意識、信息知識、信息能力、信息倫理。四者互為基礎、相輔相成、相互促進。
3、ACRL標準(USA):①有信息素養的學生有能力決定所需信息的性質和范圍;②有信息素養的學生可以有效地獲得需要的信息;③有信息素養的學生評估信息和信息的出處,然后把挑選的信息融合到他(她)們的知識庫和價值體系中;④不管個人還是作為一個團體的成員,有信息素養的學生能夠有效地利用信息來實現特定的目的;⑤有信息素養的學生熟悉許多與信息使用有關的經濟、法律和社會問題,并能合理合法地獲取信息。
4、全球醫學教育最低基本要求(GMER):包括7個宏觀的教學結果和能力領域:①職業價值、態度、行為和倫理;②醫學科學基礎知識;③溝通能力;④臨床技能;⑤群體健康和衛生系統;⑥信息管理;⑦批判性思維和研究。
5、信息:是物質的一種方式、形態或運動狀態,是事物的一種普遍屬性、一般指數據、消息中包含的意義,可以使消息中所描述事件的不定性減少。分類:自然信息、生物信息、機器信息、社會信息。
6、知識:是人們在認識和改造客觀世界的實踐中所獲得的的認識和經驗的總和,是人類通過對信息的感知、獲取、選擇、處理和加工等一系列思維過程,形成的對客觀事物的本質和規律的認識。分類:知道是什么的知識、知道為什么的知識、知道怎么做的知識、知道是誰的知識。
7、情報:是“為了解決某一個特定問題去搜尋所需要的知識,它事激活了的知識?!比齻€基本屬性:知識性、傳遞性、效應性(經智力加工的知識和信息,通過傳遞后,使問題得到了解決,產生了效用,即為情報的效用性)。
8、文獻:是記錄有知識的一切載體。四個基本要素:①文獻以知識為內涵;②知識以符號來表現;③符號以一定手段來記錄;④以一定的物質載體魏文獻的外在表現。文獻根據對知識的加工深度劃分:一次文獻、二次文獻、三次文獻、零次文獻。
9、信息、知識、情報與文獻的相互關系:信息是知識的源泉,知識是系統化的信息,情報是活化的知識和信息,情報應用于時間,解決實踐中存在的問題,創再出物質財富或精神財富,產生新的信息,這樣就形成了一個無限循環的過程。
10、醫學文獻發展的特點:①數量龐大、增長速度快;②內容交叉滲透、分散重復;③文種繁多;④更新周期縮短、失效期加快;⑤交流傳播及變化速度加快;⑥日益向多元化發展。
11、信息檢索:是通過一定的方法和手段,是信息存儲和檢索這兩個過程所采用的特征標識達到一致,一邊有效地獲取和利用文獻信息的過程。廣義的信息檢索包括信息的存儲和檢索兩個過程;狹義的信息檢索則主要是指信息的檢索過程。
12、信息檢索主要類型:《中圖法》由五大部類、22個大類組成。(在“R 醫藥、衛生”這一級類目下又分出17個二級類目)。
13、醫學主題詞表(MeSH):是美國國立醫學圖書館(NLM)由1960年起編制的一部規范化的可擴充的動態性詞表。MeSH表具有以下特點:對醫學文獻中的自然語言進行規范,使概念和主題詞單一對應;保證文獻的標引和檢索過程在用詞上的一致;可以對主題詞進行擴檢和縮檢;具有動態性。
14、主題詞:是規范化的、用以描述文獻主題(內容特征)的有檢索意義的詞或詞組。
15、入口詞:也稱款目詞,不屬于MeSH詞表中規范化的主題詞,但與主題詞有同義關系,準同義關系,祖代關系,等同關系。
16、副主題詞:無獨立檢索意義,但與主題詞組配使用,目的在于提高對文獻主題標引及檢索的專指度。
17、樹狀結構表的作用:①可幫助從科學體系中選擇主題詞;②可幫助進行擴檢和縮檢;③可幫助確定詞的專業范圍。
18、MeSH參照系統:目前有四種參照:Entry Term(入口詞)、See Also(主題詞:指引主題概念相關的其他主題詞)、Consider Also(指引同義不同源的詞)、Entry Combination(主題詞:指引主題概念相關的其他組合形式的其他主題詞)。
19、數據庫的結構:①文檔:順排文檔、倒排文檔;②記錄(數據庫的記錄越多,數據庫的容量就越大);③字段(字段的數量越多,說明記錄包含的信息就越多,該數據庫就越加完備)。文檔、記錄、字段的關系可描述為:文檔是一個表,表中的每一行就是一個記錄,行數就代表了記錄的數量,而表中的每一列就是一個字段,每一個字段就是一個文獻的特征標識,指向文獻特征所在位置。
20、數據庫類型:文獻型、事實型、數據型、多媒體型。
21、檢索提問表達式=檢索詞+運算符
22、布爾邏輯檢索:①邏輯乘:運算符為“AND”或“*”,是表達概念交叉關系和限定關系的一種組配。AND兩側的檢索詞必須同時出現在同一條記錄中,該記錄才會命中,常用于縮小檢索范圍;②邏輯加:運算符為“OR”或“+”,是表達并列關系的一種組配。OR兩側的檢索詞只要有一個出現在同一條記錄中,該記錄命中。常用于擴大檢索范圍,提高查全率;③邏輯非:運算符為“NOT”、“AND NOT”或“-”,是表達排斥關系的一種組配,即從檢索結果中剔除不需要的概念。一般用于縮小檢索范圍,增強專指性。
23、字段限定檢索:①精確限制符“=”;②模糊限制符“in”、“[]”、“/”。
24、加權檢索:是一種定量檢索技術,其實質是判定檢索詞對文獻是否命中的影響程度。
25、短語檢索符:用于檢索圈定短語或專有名詞,常用“”。
26、調整檢索策略:(1)認真檢查所確定的檢索方法、檢索系統、檢索途徑是否對口,是否符合課題的要求;(2)修改檢索提問式:當檢出文獻量小于期望時,試用一下方法來擴大檢索范圍:①刪除某些用AND鏈接的不重要檢索詞;②增加用OR連接的檢索詞;③位置運算符放款;④檢索詞后用截詞符;⑤多用幾個副主題詞,甚至選用所有副主題詞;⑥選用上位主題詞擴檢,或選用擴展全部檢索;⑦同時用主題詞自由詞檢索,用OR鏈接;⑧從在某個學科范圍中輸詞檢索改為在所有學科中輸詞檢索;⑨多擁擠中檢索系統進行檢索。當檢出文獻量過多,其中一部分文獻并非真正需要時,試用一下方式進行檢索:①增加用AND鏈接的檢索詞,或用“二次檢索”;②用特定的副主題詞進行限定;③用字段限定檢索;④使用主要主題詞進行加權檢索、下位主題詞檢索或不擴展檢索;⑤進行文獻類型、語種、重要核心期刊、年份等限定檢索;⑥用邏輯非NOT來排除無關檢索詞。
27、檢索效果評價:查全率:是指系統在進行檢索時,檢出的相關文獻量與系統文獻庫中相關文獻總量的比率,它反映該系統文獻庫中實有的相關文獻量在多大程度上被檢索了出來。查準率:是指在進行某一檢索時,檢出的相關文獻量與檢出文獻總量的比率,它反映每次從該系統文獻庫實際檢出的全部文獻中有多少是相關的。
28、Sino Med檢索新功能:①智能檢索;②限定檢索;③鏈接檢索;④結果分析;⑤我的空間;⑥原文獲取。
29、Sino Med數據庫的檢索方法:(1)基本檢索:①默認字段檢索(“缺省”狀態檢索是同時在中文標題、摘要、作者、關鍵詞、主題詞和刊名字段中進行檢索);②全部字段檢索;③指定字段檢索;④二次檢索;⑤通配符建多次可使用單子通配符“?”和任意通配符“%”。(2)主題詞檢索;(3)分類檢索;(4)期刊檢索;(5)作者檢索;(6)限定檢索:可以在檢索前限定(“先限定”),或者對已有檢索式做限定(“后限定”)。取消限定檢索前,限定設置始終有效;(7)檢索歷史。
30、中國國家知識基礎設施工程(CNKI)與維普、萬方、Google學術均可查被引次數。中國生物醫學文獻數據庫(CBM)是我國最早的生物醫學文獻數據庫之一,為二次文獻數據庫;CNKI為綜合性數據庫;維普期刊資源整合服務平臺(VIP)只收錄期刊;萬方數據知識服務平臺(WANFANG DATA)資源類型主要包括:期刊論文、學位論文、會議論文、科技成果、報告、標準、專利等,與CNKI不同的是,對所有醫學主題詞進行PubMed標準。
31、PubMed收錄了來自以下四個數據庫的數據:MEDLINE:是世界公認的最重要、最具權威性、使用頻率最高的生物醫學文獻數據庫;PreMEDLINE;Publisher Supplied Citation;PubMed-OLDMEDLINE。
32、在PubMed主頁的檢索提問框中鍵入檢索詞,系統將按順序使用如下4種表或索引,對檢索詞進行轉換后再檢索:①MsSH轉換表;②刊名轉換表;③短語表;④著者索引:姓(全稱)在前,名(首字母縮寫)在后。
33、臨床咨詢是專為臨床醫生設置的循證醫學證據檢索界面。
34、搜索引擎使用高級檢索的限定:①語種限定;②位置限定;③網站或域名限定;④類型限定。Google學術搜索結果提供:標題、作者、簡介及被引用次數、相關文獻、版本信息、引用鏈接。
35、HONselect:是一個針對醫藥衛生領域的不同種類的網絡信息資源的多語種搜索引擎,功能很強大。瀏覽主題詞表(Explore the 33000 separate MeSH terms):單擊鏈接,可檢索33000個醫學主題詞的完整的樹狀結構表。
36、開放存?。∣A):發端于20世紀90年代,是全球科技界、學術界、出版界、信息傳播界為推動科研成果的自由傳播和利用而發起的運動。開放存?。∣A)期刊:即可以通過網絡免費閱讀和下載的期刊。
37、醫學圖像資源:①通過綜合性的圖片搜索引擎獲得:Baidu圖片、雅虎圖片搜索、有道圖片搜索;②通過專業搜索引擎獲取:HONmedia;③通過專業圖庫獲?。篘ucleus。
38、循證醫學(EBM):慎重、準確和明智地應用當前所有能獲得的最好的研究證據,同時結合臨床醫生的個人專業技術和多年臨床經驗,考慮病人價值和愿望,將三者完美結合制定出最佳的診療措施。
39、循證醫學基本步驟:①提出問題;②查找證據;③評價證據;④應用證據;⑤總結提高。40、實踐循證醫學醫學對臨床醫生的要求:①熟悉循證醫學實踐的每一個過程要求;②掌握計算機檢索之時和技術,能從數據庫和網上獲得相關證據;③了解臨床流行病學知識,特別是對病因、危險因素、診斷、治療和預后文獻的評價標準和方法,會對已獲得證據進行嚴格評價,考察其真實性、有效性和可靠性;④了解醫學統計學、醫學倫理學知識,充分考慮病人的價值,從病人實際出發,全心全意為病人服務。
41、證據的分類:①系統評價;②隨機對照試驗;③臨床實踐指南;④衛生技術評估。證據的分級:分為8級,質量依次降低。
42、著名的循證醫學數據庫(二次研究證據庫):Cochrane Libuary:①Cochrane系統評價全文庫;②Cochrane療效評價文摘庫;③Cochrane臨床試驗中心注冊庫;④Cochrane評價方法數據庫。
43、檢索提問四要素:PICO四要素:①患者或人群;②干預措施或暴露因素;③對比;④結果。檢索策略:①在原始研究文獻庫中檢索系統評價、臨床研究、臨床指南等的策略;②在原始研究文獻庫中檢索病因、診斷、療效、轉歸、經濟學評估、衛生需求等的策略;③檢索循證醫學數據庫的策略;④不同檢索策略的敏感度和特異度。
44、醫學論文的基本格式中的基本內容:①標題;②作者;③摘要(指示性文摘、報道性文摘、報道-指示性摘要);④關鍵詞;⑤中圖分類號;⑥文獻標識碼;⑦英文摘要;⑧正文(引言、材料和方法、結果討論、結論);⑨致謝;⑩參考文獻。
45、學習這門課的意義:①醫學信息檢索與利用課交給學生獲取知識的知識,為其自主學習和終身教育打好基礎;②信息檢索與利用課是培養學生信息素養的重要途徑;③信息檢索與利用課培養學生獨立工作能力、批判性思維和創造性思維能力,喚起學生的主體意識。
46、主題詞:是規范化的、用以描述文獻主題(內容特征)的有檢索意義的詞或詞組;關鍵詞:是從文獻題名、文摘或全文中抽取出的表達文獻主題概念,起關鍵作用,具有實際意義的名詞術語。關鍵詞屬自然范疇,關鍵詞的最大優點是詞語直接取自文獻,一些最新的科學術語能及時進入搜索系統。其缺點主要是同一概念會有多種表達形式,這樣就會使同一內容的文獻分散在不同的關鍵詞下,檢索時必須查遍不同詞形的同義和近義詞才可能避免漏檢。
第四篇:計算機信息檢索實驗報告
1、國內主要計算機檢索系統 1、1 《中國學術期刊全文數據庫》(2004年10月1日前系統檢索)1、1、1課題:查找有關2001-2004年高層建筑結構抗震分析和設計方面的文章 從安大圖書館主頁進入中國知網,選擇高級檢索;
在左邊的查詢范圍中選擇理工A、B、C,第一個檢索項為關鍵詞,檢索詞為高層建筑,第二個檢索項為關鍵詞,檢索詞為抗震,第三個檢索項為關鍵詞,檢索詞為設計,選擇時間從2001到2004,排序為相關度,匹配為精確,點擊檢索按鈕; 輸出檢索結果,共有142條記錄; 選擇第一條記錄輸出題錄信息:《高層建筑混凝土結構技術規程(JGJ 3-2002)》的學習體會/伊新富;方鴻強,來源:浙江建筑, , 編輯部郵箱 2003年 05期 1、1、2 查找葉繼元教授所撰寫的有關“期刊”方面的論文被哪些論文引用過?(高級檢索)
進入中國知網數字出版物超市,選擇學術文獻總庫,選擇中國引文數據庫,選擇高級檢索;
選中期刊類型論文、學位論文類型論文、會議論文類型論文,第一行檢索項為被引作者,檢索詞為葉繼元,第二行檢索項為被引關鍵詞,檢索詞為期刊,排序為相關度,點擊檢索按鈕;
輸出檢索結果,共28條記錄;總被引頻次為408次。
選擇第一條記錄輸出:呼喚圖書館學情報學期刊的學術規范意識——紀念《圖書與情報》出版第100期/葉繼元,圖書與情報/2004/06 1、1、3 查找吳慰慈教授1994年至今所發表的學術論文題錄情況,以及論文被引用情況。
在中國引文數據庫中點擊源文獻檢索,檢索項為作者,檢索詞為吳慰慈,匹配為精確,排序為出版日期,發布時間為1994到2010,點擊檢索; 輸出檢索結果,共有98條記錄; 選擇第一條記錄輸出題錄:試論數字時代圖書館對著作權權利限制制度的有效運用/吳慰慈,圖書情報研究2010/01
點擊引文檢索,檢索項為被引作者,檢索詞為吳慰慈,資源范圍為全部期刊,匹配為精確,排序為被引頻次,發布時間從1994到2010,點擊檢索; 輸出檢索結果,共有84條記錄;總被引頻次為2038次。1、1、4查找《大學圖書情報學刊》中刊載的有關題名中含有“圖書館管理”方 面 的文章。
進入期刊導航,在檢索欄里選擇檢索項為刊名,檢索詞為大學圖書情報學刊,點擊檢索;
在輸出的結果點擊進入大學圖書情報學刊,在檢索欄里選擇檢索項為篇名,檢索詞為圖書館管理,點擊檢索,; 輸出檢索結果,共有152條記錄;
選擇第一條記錄輸出題錄:論高校圖書館內部溝通管理策略/朱林,胡亮生;頁碼25—27;2010/05 1、1、5 第一題再以2004年10月1日推出的“CNKI網格資源共享平臺”中《中國知識資源總庫》中檢索。(選擇若干個數據庫檢索)
將首頁的數據庫都選中,點擊高級檢索;
在左邊的查詢范圍中選擇理工A、B、C,第一個檢索項為關鍵詞,檢索詞為高層建筑,第二個檢索項為關鍵詞,檢索詞為抗震,第三個檢索項為關鍵詞,檢索詞為設計,選擇時間從2001到2004,排序為相關度,匹配為精確,點擊檢索按鈕; 輸出檢索結果,共有147條記錄; 選擇第一條記錄輸出題錄信息:《高層建筑混凝土結構技術規程(JGJ 3-2002)》的學習體會/伊新富;方鴻強,來源:浙江建筑, , 編輯部郵箱 2003年 05期 1、2 《中國科技期刊數據庫》(實習題目同實習一)1、2、1課題:查找有關2001-2004年高層建筑結構抗震分析和設計方
面的文章
從安大圖書館主頁進入維普資訊,選擇高級檢索; 在檢索欄中第一個檢索項為關鍵詞,檢索詞為高層建筑,第二個檢索項為關鍵詞,檢索詞為抗震,第三個檢索項為關鍵詞,檢索詞為設計,點擊擴展檢索條件,時間為2001到2004,期刊范圍為全部期刊,點擊檢索按鈕; 輸出檢索結果,共有90條記錄;
選擇第一條記錄輸出題錄:港利新城大廈結構設計簡介/馬才書,姚敏,陳德文;出處:江蘇建筑2004年B12期。1、2、2 查找葉繼元教授所撰寫的有關“期刊”方面的論文被哪些論文引用過? 使用傳統檢索,檢索入口為A=作者,檢索式為葉繼元,精確匹配,點擊檢索; 輸出結果,共有76條記錄;
接著選擇檢索入口為K=關鍵詞,檢索式為期刊,精確匹配,邏輯與,點擊二次檢索;
輸出檢索結果,共有42條記錄; 1、2、3查找吳慰慈教授1994年至今所發表的學術論文題錄情況,以及論文被引用情況。
使用快速檢索,范圍為全部期刊,年限為1994到2010,檢索式為作者=吳慰慈,點擊搜索;
輸出檢索結果,共有65條記錄;
選擇第一條記錄輸出題錄信息:新年獻詞/吳慰慈,圖書館工作2010年1期。1、2、4查找《大學圖書情報學刊》中刊載的有關題名中含有“圖書館管理”方
面 的文章。
進入期刊導航,選擇期刊名,在檢索框中輸入大學圖書情報學刊,點擊期刊搜索; 輸出搜索結果:
點擊進入大學圖書情報學刊,在在本刊中檢索的檢索框中輸入圖書館管理,點擊搜索;
輸出檢索結果,共有296條記錄;
選擇第一條記錄輸出題錄信息:解析學科館員制度及其在中國的價值/徐文杰,大學圖書情報學刊2010年第4期。1、3 《萬方數據資源系統》 1、3、1 查找城市交通設計方面的文獻(從《科技信息子系統》中查找)(采用“一般檢索”)
從安大圖書館主頁進入萬方數據庫;
在跨庫檢索的檢索框里輸入“城市交通設計”,點擊檢索按鈕;
輸出檢索結果,按相關度優先排列,其中期刊論文504篇,會議論文109篇,學位論文22篇;
選擇其中一篇的題錄信息:城市道路交叉口交通設計研究/李定;分類號:U491.23 U412.35;關鍵字: 城市道路交通 城市路網節點 道路交叉口 通行空間 交通設計 交通管理。1、3、2 查找文題中有關“搜索引擎”、全文中含有“圖書館”方面的文章。(從《科技信息子系統》中的“學位論文數據庫”和“學術會議論文數據庫”中檢索)
在跨庫檢索下面第一欄輸入“標題=搜索引擎”,第二欄輸入“關鍵詞=圖書館”,選中學位論文和會議論文兩個數據庫,點擊檢索按鈕;
輸出檢索結果,共10篇文章符合要求,其中學位論文4篇,會議論文6篇; 輸出一篇文章的題錄信息:基于DRIS理論的新型網絡搜索引擎設計/蔡建超 ;學科專業:控制理論與控制工程 ;授予學位:碩士;學位授予單位:華中科技大學;導師姓名:汪秉文、郭一平;分類號:TP393.092 G250.76 ;關鍵詞:資源整合 搜索引擎 Web服務 信息檢索 分布式系統 數字圖書館。1、3、3查找有關文題中有“高校圖書館信息檢索”或關鍵詞中含有“搜索引擎”方面的文章。(從《數字化期刊子系統》中查)
在跨庫檢索下面第一欄輸入“標題=高校圖書館信息檢索”,第二欄輸入“關鍵詞=搜索引擎”,選中學術期刊數據庫,點擊檢索按鈕; 輸出檢索結果,只有1篇文章;
題錄信息:基于Internet的高校圖書館集成化信息檢索系統/ 梁震戈,王文君,楊國福;作者單位:梁震戈,王文君(河北科技大學,石家莊,050054),楊國福(河北科技大學電氣信息學院,石家莊,050054);刊名:現代情報2005-25-(9);分類號:G252.7;關鍵詞:高校圖書館 Internet 元搜索引擎 集成化信息檢索。1、3、4 查找《大學圖書情報學刊》上發表的有關“圖書館管理”方面的文章。(從《數字化期刊子系統》中查)
在跨庫檢索下面第一欄輸入“期刊名=大學圖書情報學刊”,第二欄輸入“關鍵詞=圖書館管理”,選中學術期刊數據庫,點擊檢索按鈕; 輸出檢索結果,共有文章38篇,按相關度優先排列;
題錄信息:孔子管理思想對數字圖書館管理工作的影響和作用/ 王東波;作者單位:曲阜師范大學;2005年23卷第2期;分類號:G250;關鍵詞:孔子管理思想 數字圖書館管理 圖書館管理。1、4 《超星數字圖書館》(存盤輸出有關書目題錄信息1—5條)1、4、1 查找有關“信息檢索”方面的圖書(初級檢索)從安大圖書館主頁進入超星數字圖書館;
在快速檢索欄里輸入“信息檢索”,選擇書名,點擊檢索按鈕; 輸出檢索結果,共有209本相關主題的書;
題錄信息:A、互聯網信息檢索/曾祥瑞編著.—2002年 科技信息檢索/劉志堅等編.—2000年
C、文獻信息檢索與利用(第2版)/張勝全.—2005年第2版 D、信息檢索與利用/陳惠蘭主編.—2004年 1、4、2 查找有關“網絡信息資源”方面的圖書(高級檢索)
選擇高級檢索,在第一欄輸入“書名=網絡信息資源”,點擊檢索按鈕; 輸出檢索結果,共有18本相關圖書;
題錄信息:A、化學化工網絡信息資源檢索與利用/錢樹云.—2005年 B、科技網絡信息資源檢索與利用/劉阿多主編.—2005年
B、網絡信息資源的組織 從信息組織到知識組織/劉嘉.—2002年 1、5 《全國報刊索引》 1、5、1 查找標題中有“圖書館信息檢索”方面的文章。從安大圖書館主頁選擇進入“中文電子資源”,選擇“全國報刊索引”進入; 在數據庫檢索這一項中,第一個檢索框中選擇“題名”,第二個檢索框中輸入“圖書館信息檢索”,點擊檢索按鈕;
輸出結果,把結果按相關度排列,共有20篇記錄; 題錄信息:A、西安交通大學圖書館信息系統簡介/崔志正,李迂延;收錄刊名:當代圖書館,1995年第1卷。
B、試論圖書館信息檢索系統實現的目標/朱渝,劉澤民;收錄刊名:圖書館建設,1998年第5卷。C、數字圖書館信息檢索技術/劉建華,袁祖強;收錄刊名:微型電腦應用,2000年第16(9)卷。1、5、2 查找題名中有“文獻檢索”、著者姓“李”,年份為1990年以后的文獻。
選擇高級檢索,在第一行檢索框選擇“題名”,輸入“文獻檢索”;在第二行檢索框選擇“著者”,輸入“李?”,點擊檢索按鈕; 輸出結果,把結果按相關度排列,共有136篇記錄;
題錄信息:A、談談文獻檢索課教材中存在的若干問題/李健康;收錄刊名:醫學情報工作,1991年第2卷。
B、論計算機用于“文獻檢索與利用”教學/李夏虹;收錄刊名:冶金高校圖書館,1991年第1卷。
C、大學生文獻檢索能力的培養/李冕斌;收錄刊名:海南師院學報,1993年第6(1)卷。1、6 1、6、1 自擬一個研究課題檢索,并將有關文章根據需要或題錄或全文存盤。?(分別用《中國學術期刊全文數據庫》、《中國科技期刊數據庫》、《萬方數字化期刊子系統》檢索)
檢索課題:題名中包含“參考咨詢”,作者單位“安徽大學”,時間為“2000年以后”。CNKI檢索:
選擇高級檢索,在第一行檢索框選擇“題名”,輸入“參考咨詢”;在第二行檢索框選擇“作者單位”,輸入“安徽大學”;選擇時間“從2000年到2010年”,選擇按相關度排列,點擊檢索按鈕; 輸出檢索結果,共有17條記錄; 題錄信息:高校圖書館數字參考咨詢服務新探/楊勤;收錄刊名:現代情報2007年11期。
維普檢索
選擇高級檢索,在第一行檢索框選擇“題名或關鍵詞”,輸入“參考咨詢”;在第二行檢索框選擇“機構”,輸入“安徽大學”;選擇時間“從2000年到2010年”,點擊檢索按鈕; 輸出檢索結果,共有17條記錄;
題錄信息:數字參考咨詢服務評價研究/葉丹;收錄刊名:圖書館工作2009年4期。
萬方檢索
在跨庫檢索下,在第一行檢索框選擇“標題”,輸入“參考咨詢”;在第二行檢索框選擇“單位”,輸入“安徽大學”;選擇時間“從2000年到2010年”,只選中第一個“學術期刊”,點擊檢索按鈕; 輸出檢索結果,共有28條記錄;
題錄信息:知識地圖在圖書館參考咨詢中的構建模式研究/楊杰;收錄刊名:情報資料工作2010年2期。
2、國外主要計算機檢索系統 2、1 Spring Link(任選三題)2、1、1 檢索有關金屬阻蝕劑的文獻(metal corrosion,corrosion inhibitor)
從安大圖書館主頁選擇進入西文電子資源,選擇Springer Link現刊庫(1997年至今)進入; 在Search For的檢索框中輸入“metal corrosion”and“corrosion inhibitor”,點擊go按鈕;
輸出檢索結果,共有91條記錄;
選擇第一條記錄輸出:Title:Some results of a research in the problem “inhibitors of metal corrosion.Toxicology and industrial hygiene” Author:V.V.Paustovskaya
Journal:Protection of Metals
Volume 36, Number 1, 89-93, DOI: 10.1007/BF02766745 2、1、5 檢索有關水污染方面的文獻(water pollution)在Search For的檢索框中輸入“water pollution”,點擊go按鈕; 輸出檢索結果,共有54128條記錄; 選擇第一條記錄輸出:Title:Assessment of anthropogenic sources of water pollution using multivariate statistical techniques: a case study of the Alqueva’s reservoir, Portugal
Author:Patricia Palma, Paula Alvarenga, Vera L.Palma, Rosa Maria Fernandes, Amadeu M.V.M.Soares and Isabel Rita Barbosa
Journal:Environmental Monitoring and Assessment Volume 165, Numbers 1-4, 539-552, DOI: 10.1007/s10661-009-0965-y 2、1、7 檢索一本圖書,題名是:Milan Journal of Mathematics 點擊Advanced Search進入高級檢索,在content檢索框中輸入“Milan Journal of Mathematics”,選擇TITLE ONLY,在Category and Date Limiters下拉框中選擇Only Books,點擊go按鈕; 輸出檢索結果,共有0條記錄。2、2 EBSCO(任選三題)2、2、1 檢索有關痛苦體驗的文獻(Pain Practice)從安大圖書館主頁選擇進入西文電子資源,選擇EBSCO數據庫進入,點擊EBSCO Web進入,將所有數據可選中,點擊繼續; 在檢索框中輸入“Pain Practice”,點擊檢索按鈕; 輸出檢索結果,共有489條記錄;
選擇第一條記錄輸出:題名:Using Evidence in Pain Practice: Part II: Interpreting and Applying Systematic Reviews and Clinical Practice Guidelines.來源:Pain Medicine Jul/Aug2008, Vol.9 Issue 5, p531 11p.2、2、3 檢索有關勞動力歷史的文獻(Labor History)在檢索框中輸入“Labor History”,點擊檢索按鈕; 輸出檢索結果,共有12867條記錄; 選擇第一條記錄輸出:題名:Symposium: Lifting the Curse of Dimensionality: Measures of the States' Labor Legislation Climate in the United States during the Progressive Era: Global Warming of the Labor Legislation Climate: Comments on Fishback, Holmes, and Allen 作者:Boyer, George R.來源:Labor History, August 2009, v.50, iss.3, pp.350-55 2、2、4 檢索有關安全性管理的文獻(Safety Management)在檢索框中輸入“Safety Management”,點擊檢索按鈕; 輸出檢索結果,共有5141條記錄;
選擇第一條記錄輸出:題名:STUDY OF OCCUPATIONAL SAFETY AND HEALTH AUDIT ON FACILITIES AT UNGKU OMAR COLLEGE, UNIVERSITI KEBANGSAAN MALAYSIA(UKM): A PRELIMINARY ANALYSIS.111作者:Ariffin, Kadir,Ahmad, Shaharuddin,Aiyub, Kadaruddin,Awang, Azhan1,Aziz, Azmi1, Mohamad, Lukman Z.2,Mamat, Samsu Adabi3 來源:College Student Journal;Sep2010, Vol.44 Issue 3, p737-751, 15p, 13 Charts
3、網絡信息檢索 3、1 搜索引擎Yahoo 3、1、1 通過Yahoo目錄查詢“艾滋病的基本知識
輸入網址http://cn.yahoo.com/,進入Yahoo主頁,在搜索框里輸入“艾滋病的基本知識”,點擊搜索;
輸出檢索結果,共有736097條記錄;
選擇第一條記錄輸出:艾滋病基本知識經典13問答專家講堂,www.tmdps.cn/。3、2、2 通過Sohu查Peterson’s Guide(美國大學招生信息工具書)主頁 在檢索框中輸入“Peterson’s Guide”,點擊搜索; 輸出檢索結果,符合要求的為第一條記錄,Peterson's-Your Comprehensive Guide to College Information,www.tmdps.cn/。3、3 中國地圖搜索引擎(http://www.tmdps.cn)3、3、1 查詢出“北京大學“位置地圖
輸入網址http://www.tmdps.cn,在地圖搜索欄的檢索框里輸入“北京大學”,點擊搜索;
輸出檢索結果: 3、3、2 查詢“北京大學—清華大學北門最短距離的公交線路方案
第五篇:計算機信息檢索習題集
計算機信題
息集
檢
索習
一、單項選擇題
1、因特網上的信息資源中被成為網上“最成功”的領域是()。
A.教育信息 B.科研信息 C.文化信息 D.消閑娛樂信息
2、因特網上的信息資源中被認為是最有價值的信息是是()。
A.教育信息 B.科研信息 C.政府信息 D.消閑娛樂信息
3、將因特網信息資源劃分為www.tmdps.cn D.http://www.tmdps.cn
46、Usenet用來設置和組織新聞討論組的形式是()。
A.層次型的分類結構 B.關鍵字分類 C.數據庫查詢 D.網狀結構
47、由美國教育部和國家教育圖書館創建的用于提供教育相關文獻的信息系統是()。
A.ERIC B.CIJE C.Medline數據庫 D.EI Village
48、提供社會科學信息資源的檢索工具的是()。
A.SOSIG B.ERIC C.Medline數據庫 D.Archie
49、EI Village可以檢索的領域包括()。
A.工程領域 B.社會科學領域 C.計算機科學領域 D.A 和C
50、查詢因特網上工程技術領域高質量信息資源的專業性檢索工具是()。A.ERIC B.CIJE C.EELS D.EI Village
51、因特網上檢索Telnet資源的常用工具是()。A.Hytelnet B.Archie C.ERIC D.EI Village
52、因特網上檢索FTP資源的常用工具是()。
A.Hytelnet B.Archie C.ERIC D.EI Village
53、因特網上檢索醫學信息資源的常用工具是()。
A.Hytelnet B.Archie C.Medline數據庫 D.EI Village
54、獲取Archie服務的途徑中最容易的途徑是()。
A.Telnet B.WS Archie客戶程序 C.WEB瀏覽器 D.E_mail方式
55、獲取Archie服務的途徑中最有效的途徑是()。
A.Telnet B.WS Archie客戶程序 C.WEB瀏覽器 D.E_mail方式
56、獲取Archie服務的途徑中最節省資源的途徑是()。
A.Telnet B.WS Archie客戶程序 C.WEB瀏覽器 D.E_mail方式
57、世界上最大的最流行的因特網文件搜索引擎是()。
A.FAST FTP Search B.yahoo!C.DOGPILE D.Alta Vista
58、專門用于查詢Usenet網絡新聞組的搜索引擎是()。
A.FAST FTP Search B.Lycos C.DOGPILE D.Deja News
59、郵件列表的官方目錄是()。
A.Catalist B.Yahoo!C.Galaxy D.VL
60、EI提供的檢索工程技術文獻的門徑是()。
A.文摘和索引數據庫 B.多語言服務 C.聯機服務 D.高級檢索
61、EI提供的專利數據庫是()。A.APIPAT B.APILIT C.PaperChen D.Compendex web 62、世界上最大的文獻信息服務機構之一以及非贏利、成員制的在線計算機圖書館服務服務研究機構的是()。
A.OCLC B.Archie C.CARL D.Yahoo
63、當前世界上規模最大、內容更新最快的期刊數據庫之一是()。
A.OCLC B.Archie C.CARL D.Yahoo 64、檢索、獲取圖書信息的傳統方法是()。
A.各種印刷本的書目 B.搜索引擎 C.聯機檢索 D.網絡目錄
65、OCLC的FirstSearch檢索系統中用于檢索圖書信息的數據庫是()。
A.WorldCat B.ArticleFirst C.NetFirst D.PaperFirst 66、OCLC的FirstSearch系統中用于提供各種學科會議論文的索引的數據庫是()。A.WorldCat B.ArticleFirst C.NetFirst D.PaperFirst 67、OCLC的FirstSearch系統中用于提供學術期刊中論文的書目信息的數據庫是()。A.WorldCat B.ArticleFirst C.NetFirst D.PaperFirst 68、關于CARL的Uncover系統的說法正確的是()。
A.其宗旨是為獲取期刊信息的用戶提供及時、全面、高效的服務 B.其目標是提供期刊文獻資料的信息產品和服務
C.是世界上規模最大、內容更新最快的期刊數據庫之一 D.向用戶提供脫機檢索服務
69、把檢索語言分為分類語言和主題語言的依據是()。
A.語言的結構原理 B.語言的形成方式 C.語言內容 D.語言的語法 70、把檢索語言分為自然語言和人工語言的依據是()。
A.語言的結構原理 B.語言的形成方式 C.語言內容 D.語言的語法 71、計算機信息檢索的發展階段中不包含的是()。
B.人工檢索 B.脫機批處理 C.聯機檢索 D.因特網檢索 72、網絡環境下信息檢索與開發的版權保護問題的核心是()。
A.數據庫的版權保護 B.印刷品的版權保護 C.著作權保護 D.信息在網絡上的傳播 73、網絡環境下信息資源組織和管理的核心是()。
A.網絡信息資源的有序化 B.信息編目 C.信息組織方式 D.數據庫的構建 74、評價檢索工具的基本要素是()。
A.數據庫的規模和質量 B.信息組織管理 C.信息收集方法 D.位置檢索
二、多選題
1、因特網上可以找到的信息資源包含()
A.教育信息 B.科研信息 C.文化信息
D.消閑娛樂信息 E.政府信息
2、對因特網上的信息資源與服務的誤解包含()
A.認為因特網無所不包、無所不能;所有信息均可在網上找到 B.認為在網上找到的、下載的信息都是正確的 C.認為因特網可以取代其他的媒體或信息渠道 D.認為因特網上的信息無太多利用價值
E.認為因特網上的信息有好有差,要給予合理的取舍來加以利用
3、因特網上的信息資源的特點是()
A.信息資源極為豐富 B.超文本、超媒體、集成式的提供信息
C.信息來源分散、無序,沒有統一的管理機構和發布標準 D.價廉,是一種比印刷品便宜的信息提供方式
E.新穎、深入,提供了獲取非出版信息的豐富機會
4、因特網上的信息資源的種類包含()
A.萬維網信息資源 B.GOPHER信息資源 C.用戶服務組信息資源
D.Telnet 信息資源 E.FTP 信息資源
5、URL包含的三部分是:()
A.所使用的傳輸協議 B.服務器地址 C.www.tmdps.cnp)B.多方面論題新聞組(Misc)C.娛樂專題新聞組(Rec)
D.科學技術與應用新聞組(Sci)E.實事新聞討論組(Talk)
41、屬于Usenet新聞討論組及文檔的獲取途徑和方法有()。
A.請教他人 B.瀏覽以news開頭的Usenet C.使用搜索引擎
D.網絡目錄 E.FTP方式
42、社會科學信息檢索工具SOSIG功能的組成部分包含()。
A.信息檢索 B.信息瀏覽 C.最新信息 D.添加新資源 E.幫助信息
43、社會科學信息檢索工具SOSIG的信息檢索功能中用以限制檢索范圍的參量有()。
A.title B.keyword C.description D.and E.or
44、Ei檢索工具中的數據庫包含()。
A.APIPAT B.APILIT C.PaperChen D.Compendex web E.API EnCompass
45、EELS的組成部分包含()。
A.Browse B.search C.comments D.help E.what’s new
46、OCLC的FirstSearch檢索系統的服務方式包含()。
A.萬維網(Web)B.TTY方式 C.FTP方式 D.人工 E.脫機服務方式
47、OCLC的FirstSearch檢索系統的數據庫包括()
A.WorldCat B.ArticleFirst C.NetFirst D.PaperFirst E.ContentsFirst
48、Uncover系統的主要聯機服務包含()。
A.免費檢索題錄或文摘 B.最新期刊文獻報道 C.文章訂購 D.原文速遞 E.網關檢索服務
49、中國高等教育文獻保障系統CALIS引進的Uncover的主要服務有()。
A.免費檢索題錄或文摘 B.Uncover Reveal最新文獻報道 C.文章訂購 D.Document delivery原文速遞
E.CALIS Uncover Gateway網關檢索服務
50、以下屬于網絡信息檢索工具的數據庫評價指標是()。A.數據庫規模 B.數據庫范圍 C.數據庫質量控制
D.數據庫字段的多少 E.數據庫數據的使用頻率
51、以下屬于網絡信息檢索工具的信息組織管理評價指標的是()
A.信息收集方法 B.信息更新周期 C.信息組織管理方式 D.數據庫規模 E.數據庫質量控制
52、以下屬于網絡信息檢索工具的信息檢索功能評價指標的是()
A.邏輯組配功能 B.截詞功能 C.精確檢索功能 D.位置檢索功能 E.限制檢索功能
53、以下屬于網絡信息檢索工具的檢索結果評價指標的是()
A.檢索結果的滿意度 B.響應時間 C.相關性排序 D.輸出量的選擇 E.顯示內容形式
54、網絡檢索工具的評價指標體系包括()
A.數據庫評價指標 B.信息組織管理評價指標 C.信息檢索功能評價指標 D.檢索結果評價指標 E.檢索界面評價指標
55、網絡信息檢索技巧可以體現在以下那些方面()。
A.明確檢索目的和要求,確定查詢策略 B.選擇合適的網絡檢索工具 C.提高檢索的精度、準確性 D.擴大檢索范圍
E.加快檢索速度,降低檢索耗費
56、擴大檢索范圍的檢索技巧包含()
A.使用同義詞、近義詞 B.使用多個搜索引擎
C.利用某些搜索引擎所具備的自動擴檢功能 D.直接去相關的網站
E.利用進階、精練檢索功能
57、提高檢索的精度、準確性的檢索技巧包含()
A.選擇合適的檢索詞 B.構造合適的檢索提問
C.利用某些搜索引擎所具備的自動擴檢功能 D.使用限定條件、限定詞 E.利用進階、精練檢索功能
58、網絡環境下信息資源組織管理的含義包含()
A.網絡信息的組織方式 B.網絡信息的編目方法 C.網絡信息的檢索語言 D.網絡信息的有序化 E.網絡信息的表現形式
59、網絡信息的組織方式包含()
A.文件方式 B.數據庫方式 C.主題樹方式 D.超媒體方式 E.書目方式
三、名詞解釋
1、超文本傳輸協議
2、URL
3、瀏覽器
4、Telnet信息資源
5、定性評價
6、定量評價
7、www信息資源
8、FTP協議
9、Gopher信息資源
10、WEB檢索工具
11、自動索引程序
12、網絡信息檢索工具
13、布爾邏輯檢索
14、相關度排序
15、目錄型檢索工具
16、搜索引擎
17、自然語言檢索
18、詞組檢索
19、概率方法 20、摘要方法
21、位置方法
22、分類或聚類方法
23、網絡目錄
24、搜索引擎目錄
25、多元搜索引擎
26、CBIR
27、FTP
28、Archie
29、Telnet 30、Usenet
31、社會科學
32、工程
33、專利文獻
34、標準文獻
35、網絡信息資源有序化
36、超文本信息組織方式
37、檢索語言
38、編目
四、問答題
1、簡述Telnet和FTP協議的異同點。
2、簡述通過FTP獲取文件的一般步驟。
3、簡述對因特網信息資源的評價標準。
4、簡述普通用戶對獲取的因特網信息資源的進行初步評價的途徑。
5、簡述網絡信息檢索的特點。
6、簡述網絡信息檢索工具的組成部分及其主要功能。
7、簡述使用Z39.50網絡信息檢索標準的檢索軟件的工作過程。
8、列舉不少于5種常見的搜索引擎。
9、列舉搜索引擎的檢索功能。
10、簡述影響搜索引擎的檢索結果相關性的各種因素。
11、圖書分類法的優勢。
12、分面組配法的工作原理。
13、簡述網絡目錄和搜索引擎的異同點。
14、簡述多元搜索引擎的檢索特性。
15、簡述多元搜索引擎和搜索引擎目錄的異同。
16、列舉不少于5種常見的多元搜索引擎。
17、簡述C4(CYBER 411)多元搜索引擎的檢索特點。
18、簡述CBIR的工作原理。
19、簡述CBIR的特點。20、簡述CBIR的功能。
21、簡述Archie檢索工具的工作原理。
22、簡述通過Telnet途徑獲取Archie服務的一般步驟。
23、簡述獲取Archie服務的途徑。
24、簡述獲取郵件列表的途徑及其具體方法。
25、簡述獲取Hytelnet服務的途徑。
26、簡述OCLC的FirstSearch系統的特點。
27、簡述OCLC的FirstSearch系統的檢索步驟與方法。
28、簡述CARL的Uncover檢索系統的檢索步驟。
29、簡述CARL的Uncover檢索系統的主要聯機服務。30、簡述電子期刊的特點。
31、簡述學術文獻的網上獲取的方法。
32、簡述中國高等教育文獻保障系統CALIS引進的Uncover的主要服務。
33、列舉至少5個以上的因特網上的免費的專利數據庫。
34、簡述對網絡檢索工具進行分析、研究的主要方面。
35、簡述網絡信息檢索工具評價的指標體系。
36、簡述提高檢索網絡信息檢索技巧。
37、簡述加快檢索速度,降低檢索消耗的檢索技巧。
38、簡述網絡環境下信息資源組織管理的內涵。
39、簡述網絡環境下資源編目的特點。40、簡述網絡信息資源的組織方式。
五、論述題
1、網絡信息檢索工具的工作原理。
2、網絡信息檢索工具的類型及其具體類型。
3、論述利用搜索引擎進行信息檢索的全過程(包括數據準備,數據檢索和結果顯示)。
4、論述搜索引擎的工作原理。
5、論述網絡目錄之間的異同。
6、論述選擇合適的網絡信息檢索工具的一些參考原則。
7、論述加快檢索速度,降低檢索消耗的檢索技巧。附錄
《計算機信息檢索》習題集部分參考答案 說明:這里只給出了習題集中的第一大題單項選擇的參考答案,其它各大題的答案均可以在教材上找到,請各位同學自行作題。
一、單項選擇題
1~5: D C A A B 6~10: A C A A D 11~15: A A D A B 16~20: D A B C A 21~25: A A B D C 26~30: A D C C C 31~35: C A A C C 36~40: C A A A A 41~45: C B A C A 46~50: A A A D C 51~55: A B C C A 56~60: B A D A A 61~65: A A C A A 66~70: D B C A B 71~74: A A A A
二、多項選擇題
1、A B C D E
2、A B C D E
3、A B C D E
4、A B C D E
5、A B E
6、A B C D E
7、A B C D
8、A B C E
9、A B
10、B C D E
11、A B C D E
12、A B C
13、A B C
14、B C D
15、A B C
16、A B C D E
17、A B C D E
18、A B
19、A B C D E 20、A B C E
21、A B D E
22、A B C
23、A B
24、A B C D
25、A B C D
26、A B C D
27、A B C
28、A B C E
29、A B C D E 30、A B C D E
31、A B
32、A B
33、A B C D
34、A B C D
35、A B C D E
36、B C D
37、A B C
38、A C D E
39、A B C 40、A B C D E
41、A B C
42、A B C D E
43、A B C
44、A B C D E
45、A B C D
46、A B
47、A B C D E
48、A B C D
49、B D E 50、A B C
51、A B C
52、A B C D E
53、A B C D E
54、A B C D E
55、A B C D E
56、A B C
57、A B D E
58、A B C
59、A B C D