第一篇:相關(guān)反饋技術(shù)在數(shù)字圖書館信息檢索中的應(yīng)用研究
相關(guān)反饋技術(shù)在數(shù)字圖書館信息檢索中的應(yīng)用研究
經(jīng)典的信息檢索理論認(rèn)為,信息需求決定信息檢索的效率。網(wǎng)絡(luò)環(huán)境下,信息需求的提出及表達(dá)都是由用戶決定的,因而可以說,用戶表達(dá)是檢索效率關(guān)鍵性因素。實(shí)踐中,以下兩個(gè)原因會(huì)影響檢索效率。
用戶檢索需求的不確定性。一般認(rèn)為,用戶的檢索需求總是處于不確定的狀態(tài),在檢索過程中會(huì)由于檢索結(jié)果發(fā)生變化或進(jìn)行修正。
用戶構(gòu)造檢索表達(dá)式的模糊性。在信息系統(tǒng)中精確的構(gòu)造用戶查詢是非常困難的,因?yàn)榻^大多數(shù)檢索系統(tǒng)的標(biāo)引和檢索過程是不透明的,用戶很可能不熟悉檢索語言或檢索式的表達(dá),另外,用戶需求與查詢表達(dá)的對(duì)應(yīng)轉(zhuǎn)換也可能存在不一致的地方,所以,準(zhǔn)確無誤的構(gòu)造反映用戶真正需求的檢索式并不是一件很容易的事情。
在信息檢索中,為改善用戶的檢索效率,往往采取各種調(diào)節(jié)方法和反饋途徑對(duì)檢索策略進(jìn)行修改、擴(kuò)展和完善。查詢擴(kuò)展就是為了滿足信息需求來修正檢索表達(dá)式的一系列技術(shù)。相關(guān)反饋就是其中備受關(guān)注的一種自動(dòng)擴(kuò)展查詢方法。
相關(guān)反饋技術(shù)概述 相關(guān)反饋的研究歷史
相關(guān)反饋技術(shù)的主要思想是:檢索系統(tǒng)在初始查詢到一組樣本文檔的基礎(chǔ)上,根據(jù)用戶在樣本文檔中的相關(guān)性選擇,構(gòu)造出改進(jìn)的查詢表達(dá)式,據(jù)此再次進(jìn)行檢索。這種通過調(diào)整檢索策略來增強(qiáng)對(duì)相關(guān)文獻(xiàn)的響應(yīng)抑制非相關(guān)文獻(xiàn)的查詢擴(kuò)展技術(shù)就是相關(guān)反饋。
20世紀(jì)60年代初,Maron和Kubns指出與原始查詢相近的特征可加到查詢中以檢出更多的相關(guān)文獻(xiàn)。1971年Rocchio在基于SMART系統(tǒng)的向量空間模型中進(jìn)行相關(guān)反饋實(shí)驗(yàn),顯示出在比較小的測(cè)試集中檢索性能有顯著改進(jìn)。此后,相關(guān)反饋得到了廣泛的重視,被擴(kuò)展到了概率模型以及布爾模型中。最近幾屆的TREC實(shí)驗(yàn)也反映出應(yīng)用相關(guān)反饋技術(shù)能給檢索性能帶來極大的改進(jìn)。目前,在知識(shí)檢索、Web智能檢索、圖像檢索中,相關(guān)反饋是一種被普遍采用的改進(jìn)檢索效率的方法。相關(guān)反饋的處理過程
用戶向信息檢索系統(tǒng)提交代表著其信息需求的查詢表達(dá)式,系統(tǒng)進(jìn)行初始的查詢,返回的檢索結(jié)果集根據(jù)文獻(xiàn)與查詢的相關(guān)性排列,然后,用戶進(jìn)行相關(guān)判斷,指出其哪些文獻(xiàn)是有用的。
系統(tǒng)基于前一次查詢檢索到的文獻(xiàn)的相關(guān)判斷,進(jìn)行相關(guān)反饋,自動(dòng)重新構(gòu)建查詢表達(dá)式,目前主要采用的方法有兩種,即檢索詞加權(quán),提高在相關(guān)文獻(xiàn)中出現(xiàn)的檢索詞的權(quán)值,降低在非相關(guān)文獻(xiàn)中出現(xiàn)的檢索詞的權(quán)值;查詢擴(kuò)展:將相關(guān)文獻(xiàn)中新的有用的檢索詞用于擴(kuò)展查詢。在形成新查詢表達(dá)式時(shí),可以同時(shí)使用檢索詞加權(quán)和檢索詞選擇這兩種方法,也可以任選其一。
新的“反饋查詢請(qǐng)求”再與文獻(xiàn)集進(jìn)行匹配,從其中檢索出更多的相關(guān)文獻(xiàn)和更少的不相關(guān)文獻(xiàn)。
該過程可以循環(huán)進(jìn)行,直到用戶最終獲得較為精確的查詢,并據(jù)此得到較為滿意的檢索結(jié)果。
帶相關(guān)反饋機(jī)制的信息系統(tǒng)相關(guān)反饋的核心技術(shù)
從相關(guān)反饋的處理過程可以看出,檢索詞加權(quán)和查詢擴(kuò)展中的新檢索詞的選擇是相關(guān)反饋中的核心技術(shù)。
檢索詞重新加權(quán)是根據(jù)查詢結(jié)果文檔中的相關(guān)文檔和無關(guān)文檔的分布,重新計(jì)算查詢和文檔的特征權(quán)重,在相關(guān)文檔中的查詢特征在后來的檢索中相應(yīng)的增加權(quán)重,在無關(guān)文檔中的特征相應(yīng)減少權(quán)重。
查詢擴(kuò)展中新檢索詞的選擇依賴于用戶的相關(guān)性判斷,在原始查詢的基礎(chǔ)上,構(gòu)造一個(gè)新的查詢。Makoto Iwrdyana通過試驗(yàn)證明用戶相關(guān)反饋的數(shù)量在10~30之間最為合適。
數(shù)字圖書館環(huán)境下的相關(guān)反饋技術(shù)數(shù)字圖書館環(huán)境對(duì)檢索提出的要求
數(shù)字圖書館不僅僅是館藏資源的數(shù)字化,而是一個(gè)海量的信息應(yīng)用系統(tǒng),是網(wǎng)絡(luò)社會(huì)人們學(xué)習(xí),工作和生活的重要平臺(tái)。它使信息檢索的方式發(fā)生了根本的變化,主要表現(xiàn)在以下幾方面。
檢索操作的實(shí)時(shí)性:由于用戶要直接參與檢索并即時(shí)得到檢索結(jié)果,因而對(duì)信息獲取的實(shí)時(shí)性要求很高。
檢索服務(wù)的個(gè)性化針對(duì)不同的用戶,要設(shè)計(jì)出適應(yīng)不同需求、友好的、交互式的多種用戶界面,提供一些實(shí)用的用戶小工具。
檢索效率的精確性:通過對(duì)數(shù)字資源的整合,數(shù)字圖書館提供給用戶海量的信息,信息資源的充分比以往任何時(shí)代都表現(xiàn)得突出。這種信息應(yīng)用環(huán)境下,用戶對(duì)信息檢索的準(zhǔn)確性要求大大加強(qiáng)了。相關(guān)反饋在數(shù)字圖書館環(huán)境下的應(yīng)用意義
數(shù)據(jù)庫技術(shù),網(wǎng)絡(luò)技術(shù)及知識(shí)管理的方法給數(shù)字圖書館的發(fā)展帶來了全新的發(fā)展契機(jī),取得了很大的成效,但縱觀數(shù)字圖書館發(fā)展的現(xiàn)狀,仍存在不少問題,研究的當(dāng)務(wù)之急不在于如何建立一個(gè)數(shù)字圖書館,而在于如何滿足數(shù)字圖書館對(duì)檢索提出的新需求,從而使用戶輕松地從數(shù)字圖書館中獲得所需的資源,實(shí)現(xiàn)真正的資源共享。因此,以用戶為中心,研究用戶的需求,提供用戶真正需要的信息是當(dāng)前研究者關(guān)注的重點(diǎn)和熱點(diǎn)。
現(xiàn)階段的用戶研究內(nèi)容多側(cè)重于用戶行為,特點(diǎn)、偏好等理論內(nèi)容,相關(guān)反饋技術(shù)則從解決用戶與計(jì)算機(jī)的”隔閡”入手,將用戶行為、特點(diǎn)。偏好對(duì)信息需求的影響從理論研究轉(zhuǎn)化為檢索技術(shù)應(yīng)用。這一全新變革在手工環(huán)境和聯(lián)機(jī)很難得到應(yīng)用。只有在交互式的實(shí)時(shí)檢索機(jī)制中才能實(shí)現(xiàn)。而在交互式的用戶環(huán)境中,高效的檢索性能必定依賴于正確的用戶反饋。相關(guān)反饋在數(shù)字圖書館的應(yīng)用現(xiàn)狀
相關(guān)反饋?zhàn)鳛橐环N日益成熟的檢索技術(shù),已逐步應(yīng)用在大型數(shù)據(jù)庫系統(tǒng),并走入數(shù)字圖書館。但從目前現(xiàn)狀看,相關(guān)反饋技術(shù)還沒有在數(shù)字圖書館系統(tǒng)中得到廣泛應(yīng)用。這主要有兩方面的原因。
系統(tǒng)設(shè)計(jì)人員對(duì)交互式的實(shí)時(shí)檢索中用戶參與對(duì)檢索準(zhǔn)確性的認(rèn)識(shí)不夠。傳統(tǒng)的檢索系統(tǒng)提供的是以信息資源為中心的服務(wù)模式,在數(shù)字圖書館環(huán)境下沿用這一服務(wù)模式無疑是不適用的。因而,很多數(shù)字圖書館系統(tǒng)的檢索子系統(tǒng)中沒有相應(yīng)的相關(guān)反饋功能。
用戶對(duì)相關(guān)反饋的重要性認(rèn)識(shí)不夠,認(rèn)識(shí)不到單靠用戶構(gòu)造的檢索式往往得不到最優(yōu)的檢索性能。因此,即使有的數(shù)字圖書館系統(tǒng)本身帶有相關(guān)反饋功能,但用戶應(yīng)用相關(guān)反饋對(duì)自己構(gòu)造的檢索式進(jìn)行再修正的意識(shí)卻不夠強(qiáng)。
建議與思考
綜上所述,針對(duì)相關(guān)反饋技術(shù)在數(shù)字圖書館環(huán)境中應(yīng)用的現(xiàn)狀,提出以下構(gòu)思。在數(shù)字圖書館檢索系統(tǒng)中引入用戶相關(guān)反饋模塊
未來的數(shù)字圖書館信息服務(wù)模式應(yīng)該是一種“用戶中心”服務(wù)模式。它生存于一個(gè)聚合化數(shù)字信息空間環(huán)境里,基于并全程跟蹤用戶信息活動(dòng),強(qiáng)調(diào)服務(wù)者與用戶主體雙方的主觀能動(dòng)性,克服了基于信息資源的服務(wù)模式中將信息系統(tǒng)與用戶信息利用過程相對(duì)隔絕的局限的問題。在數(shù)字圖書館檢索系統(tǒng)中引入相關(guān)反饋技術(shù)將有利于促進(jìn)用戶在信息利用過程中對(duì)數(shù)字信息對(duì)象的靈活處理,知識(shí)提煉和協(xié)作交流,從而更直接,深入、有效地支持用戶自助檢索、處理,利用信息來解決現(xiàn)實(shí)問題的全過程,最終達(dá)到用戶滿意,從而增進(jìn)用戶利益超越用戶期望。搭建相關(guān)反饋界面與檢索結(jié)果的友好結(jié)口
用戶接口的智能化、友好化是未來信息系統(tǒng)的發(fā)展趨勢(shì)。因而,良好的用戶接口將是數(shù)字圖書館提供給用戶信息服務(wù)的重要保證。智能化用戶接口就應(yīng)幫助用戶擺脫繁雜的對(duì)操作方法的記憶,高效地利用數(shù)字圖書館中的各類信息,使用戶在發(fā)生信息行為時(shí)不會(huì)因使用方法、方便程度的不適而影響功能使用。應(yīng)而一個(gè)接口不友好的用戶界面,無論其檢索功能如何強(qiáng)大,其系統(tǒng)性能也會(huì)大打折扣。同樣,如果用戶相關(guān)反饋界面不友好,再加上用戶對(duì)這一檢索擴(kuò)展的功能不熟悉不了解,即使引入了相關(guān)反饋功能也是形同虛設(shè)。加強(qiáng)用戶培訓(xùn)
傳統(tǒng)圖書館的用戶培訓(xùn)大都很側(cè)重信息資源的利用,在數(shù)字環(huán)境下用戶對(duì)圖書館數(shù)字信息資源的檢索和利用已經(jīng)變成了現(xiàn)實(shí)。數(shù)字信息資源形式的多樣性和信息檢索界面的復(fù)雜性對(duì)用戶的信息獲取能力提出了更高的要求。尤其是相關(guān)反饋技術(shù),盡管從技術(shù)研究的角度講已日趨成熟,但在實(shí)際檢索系統(tǒng)中的應(yīng)用卻遠(yuǎn)不如其技術(shù)研究那樣廣泛,對(duì)大多數(shù)用戶而言還很陌生。在新的環(huán)境下用戶培訓(xùn)重點(diǎn)不應(yīng)僅僅放在已有的功能的使用上,而要以多種形式介紹新開發(fā)的檢索功能,從而更好地為用戶利用數(shù)字信息資源服務(wù)。
第二篇:Web集成信息檢索在數(shù)字圖書館中的應(yīng)用研究論文
摘要:本文針對(duì)數(shù)字圖書館領(lǐng)域的特點(diǎn),提出了一種實(shí)現(xiàn)數(shù)字圖書館Web集成信息檢索及知識(shí)庫的建立管理機(jī)制,以RDF作為信息和知識(shí)的表示模型,采用中介器和包裝器框架來實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)源的集成信息檢索,并在此基礎(chǔ)上建立基于RDF的知識(shí)庫,實(shí)現(xiàn)全局查詢,在知識(shí)服務(wù)方面做了初步的實(shí)現(xiàn)。最后,本文介紹了基于該機(jī)制實(shí)現(xiàn)的一個(gè)原型系統(tǒng),并以此原型系統(tǒng)為例,分析了系統(tǒng)性能。
關(guān)鍵詞:數(shù)字圖書館;Web集成信息檢索;RDF;說明式查詢語言
0引言
數(shù)字圖書館是海量電子資源的集合,它所提供的功能涵蓋并遠(yuǎn)遠(yuǎn)超過了傳統(tǒng)的數(shù)據(jù)庫、信息檢索系統(tǒng)。數(shù)字圖書館已經(jīng)成為世界范圍內(nèi)、日益重要的基于Web的應(yīng)用框架體系。其基本目的是實(shí)現(xiàn)信息的集成共享,給用戶提供統(tǒng)一資源查詢服務(wù),保障數(shù)字資源的最大可用性、系統(tǒng)之間的互操作性和集成性。
但是,如果數(shù)字圖書館像現(xiàn)有的Web一樣僅僅提供簡單的信息瀏覽功能,則同樣會(huì)讓用戶陷入“信息過載”的困境,不能共享經(jīng)驗(yàn)知識(shí),無法滿足用戶對(duì)信息、知識(shí)的需求。因此,需要針對(duì)數(shù)字圖書館異構(gòu)信息源的特點(diǎn),采取一種適用的集成信息檢索框架,同時(shí)要求系統(tǒng)能夠積累交互運(yùn)行中的知識(shí),建立知識(shí)庫,從而給用戶提供智能的、主動(dòng)的、動(dòng)態(tài)的知識(shí)服務(wù)。
1RDF查詢語言——RQuery
RDF查詢語言RQuery與XML相比,RDF支持語義信息,然后,XML的設(shè)計(jì)動(dòng)機(jī)是關(guān)心文檔的結(jié)構(gòu),目的在于提供多元的文檔表示結(jié)構(gòu),關(guān)注的焦點(diǎn)不是文檔中數(shù)據(jù)所代表的語義信息。通過比較得知,RDF查詢語言可以根據(jù)實(shí)際需要,使用多元的機(jī)制,同時(shí)可以定制應(yīng)用領(lǐng)域內(nèi)資源、語義信息、知識(shí)的表達(dá)規(guī)則。因此,采用RDF查詢語言作為信息表示標(biāo)準(zhǔn),更方便實(shí)現(xiàn)數(shù)字圖書館領(lǐng)域異構(gòu)、半結(jié)構(gòu)化數(shù)據(jù)源IIR的語義相互操作。
RQuery的作用有兩個(gè),實(shí)現(xiàn)對(duì)RDF數(shù)據(jù)和RDFS的查詢,為了給用戶提供超出普通信息查詢更多的知識(shí),系統(tǒng)將上述查詢方法結(jié)合起來。
設(shè)計(jì)的RQuery解析器是一個(gè)簡單的語法分析器,針對(duì)RQuery的上下文無關(guān)文法的特點(diǎn),采用了自上而下的語法分析方法。顧名思義,自上而下就是從文法的開始符號(hào)出發(fā),向下推導(dǎo),推出句子。其主旨是:對(duì)任何輸入串,試圖用一切可能的辦法,從文法開始符號(hào)(根節(jié)點(diǎn))出發(fā),為輸入串獲取確定的最左推導(dǎo)。
提出的RDF查詢語言RQuery,是一種融合了謂詞邏輯的說明式查詢語言,它的設(shè)計(jì)基于數(shù)字圖書館IIR需求,與其它RDF查詢語言相比,具有如下特點(diǎn):支持語義映射、可邏輯解析、模式查詢和數(shù)據(jù)查詢相融合。
2數(shù)字圖書館集成信息檢索框架
基于中介器,包裝器的數(shù)字圖書館集成信息檢索(DLIIR)系統(tǒng)結(jié)構(gòu)如圖1所示。系統(tǒng)采用RDF作為中間信息表示規(guī)范:即系統(tǒng)各組件間交換的數(shù)據(jù)皆為符合RDF規(guī)范和RDFS定義的信息。因此組件之間以計(jì)算機(jī)可理解的語義信息進(jìn)行通訊,提高了處理信息的效率和準(zhǔn)確度,適合海量數(shù)據(jù)的查詢。
DLIIR系統(tǒng)包含用戶接口和中介器2個(gè)模塊:包裝器生成組件(WrapperDispatcher,WD):包裝器(Wrapper);知識(shí)獲取器(KnowledgeAcquireAgent,KAA):知識(shí)庫搜索器(KBSearchAgent,KBSA)。它們彼此通信,相互協(xié)作,共同完成檢索功能。同時(shí),在DLIIR系統(tǒng)中增加了RDF知識(shí)庫。RDF知識(shí)庫包含一個(gè)知識(shí)獲取(KAA)組件,將來自中介器的RDF文檔轉(zhuǎn)換成RDF知識(shí)庫中的記錄。
3組件間通訊規(guī)則
DLIIR系統(tǒng)包含若干個(gè)共同協(xié)作、彼此獨(dú)立的單元模塊,這樣的目的在于增加系統(tǒng)的可擴(kuò)展性。為了進(jìn)一步實(shí)現(xiàn)組件之間的通訊和數(shù)據(jù)交換,提高系統(tǒng)性能、查詢準(zhǔn)確率以及工作效率。整個(gè)系統(tǒng)的數(shù)據(jù)流如圖2所示。
采用RDF作為統(tǒng)一的數(shù)據(jù)格式,完成彼此的數(shù)據(jù)交換和通信,協(xié)同工作,從而實(shí)現(xiàn)整個(gè)系統(tǒng)的功能,為用戶提供查詢服務(wù)。
4用戶接口Agent
用戶接口Agent的主要功能是協(xié)助用戶明確、細(xì)化查詢請(qǐng)求。同時(shí),將MA返回的查詢結(jié)果以友好、清晰的格式顯示給用戶。
UIA的功能包括:①協(xié)助用戶明確、細(xì)化查詢請(qǐng)求,將查詢請(qǐng)求提交給MA;②接收MA返回的查詢結(jié)果,以普通HTML頁面形式將結(jié)果顯示給用戶;③為用戶提供查詢RDF知識(shí)庫的導(dǎo)航服務(wù)。UIA主要和MA進(jìn)行通信,完成和用戶交互的功能,這就是主體和其它主體協(xié)作共同實(shí)現(xiàn)系統(tǒng)功能的過程。從主體的運(yùn)行周期來看,UIA的狀態(tài)周期如圖3所示。
DLIIR系統(tǒng)中,主體之間的通信數(shù)據(jù)均以RDF表示,MA接收到該消息之后,把該查詢請(qǐng)求轉(zhuǎn)換成RQuel查詢語句。DLIIR提供給用戶基于Web的查詢界面,當(dāng)用戶提交查詢請(qǐng)求時(shí),激活UIA,開始響應(yīng)用戶的請(qǐng)求。DLIIR給用戶提供了兩種查詢方式:基于關(guān)鍵詞的查詢和基于語義的查詢。基于語義的查詢僅僅限于對(duì)RDF知識(shí)庫進(jìn)行查詢,由于知識(shí)庫中存放的是經(jīng)過處理的、以RDF格式表示的知識(shí),它們之間存在可處理的語義關(guān)聯(lián),可以根據(jù)語義聯(lián)系查找用戶所需要的信息。
5中介器的實(shí)現(xiàn)機(jī)制
中介器依靠包裝器完成信息集成。在DLIIR系統(tǒng)中,中介器(MediatorAgent,MA)需要和其它五種組件通信,協(xié)調(diào)各個(gè)組件彼此協(xié)作,共同完成查詢?nèi)蝿?wù)。從MA的內(nèi)部結(jié)果來看,MA就是一個(gè)查詢映射、結(jié)果集成的模塊。
DLIIR系統(tǒng)中,所有組件之間傳遞的信息均以RDF格式表示,采用提出的RQuery來實(shí)現(xiàn)對(duì)這些數(shù)據(jù)的查詢。在MA中,對(duì)查詢請(qǐng)求的轉(zhuǎn)換,其實(shí)質(zhì)就是將RDF格式描述的查詢請(qǐng)求,轉(zhuǎn)換成RQuery語句。
為了更清楚地給用戶提供查詢結(jié)果,往往需要HTML文檔具有一定的格式,如不同數(shù)據(jù)以不同顏色顯示,采用表格、鏈接給用戶提供更友好的界面等。此外,考慮到系統(tǒng)的靈活性,便于將來修改結(jié)果顯示的形式,在設(shè)立了一個(gè)系統(tǒng)文件——顯示模式(DisplaySchema)文檔。MA在進(jìn)行查詢結(jié)果到轉(zhuǎn)換時(shí),根據(jù)提前定義的顯示模式,將RDF文檔轉(zhuǎn)換成具有一定格式的HTML文檔,然后提交給UIA,以供在用戶端的Web瀏覽器上顯示。
6包裝器自動(dòng)構(gòu)造及知識(shí)庫框架
包裝器(Wrapper)具體工作流程如下:首先該Wrapper將全局查詢請(qǐng)求轉(zhuǎn)換成對(duì)該數(shù)據(jù)源進(jìn)行檢索的命令格式,按照接口協(xié)議和數(shù)據(jù)源通信,獲得檢索結(jié)果。然后該包裝器將結(jié)果遵循全局RDFSchema構(gòu)造成RDF文檔,返回給MA。完成此次查詢?nèi)蝿?wù)后,Wrapper進(jìn)入空閑狀態(tài),等待下次檢索任務(wù)。
DLIIR中的RDF知識(shí)庫以關(guān)系數(shù)據(jù)庫形式存儲(chǔ)的知識(shí)記錄,采用兩個(gè)組件實(shí)現(xiàn)對(duì)關(guān)系數(shù)據(jù)庫的操作:知識(shí)獲取器和知識(shí)庫搜索器。圖4給出了RDF知識(shí)庫的框架結(jié)構(gòu)。
以RDF圖模型表示的知識(shí)按照類和屬性的關(guān)系,以關(guān)系型數(shù)據(jù)庫格式存儲(chǔ)在MicrosonSQLServer數(shù)據(jù)庫中。因此,KAA和KBSA組件需要更新、訪問關(guān)系數(shù)據(jù)庫,實(shí)現(xiàn)對(duì)知識(shí)庫的維護(hù)和查詢。這個(gè)過程涉及到RDF的解析與RDF圖的恢復(fù)。
7性能評(píng)估
傳統(tǒng)的應(yīng)用程序往往由程序員手工為每個(gè)信息源編制包裝器代碼,采用包裝器自動(dòng)生成機(jī)制避免了程序員手工編寫代碼。傳統(tǒng)方式中手工開發(fā)包裝器代碼耗費(fèi)的開發(fā)代價(jià)最大,而DLIIR中建立數(shù)據(jù)源接口描述文檔的開發(fā)代價(jià)遠(yuǎn)遠(yuǎn)小于它。
DLIIR系統(tǒng)在實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)源檢索的基礎(chǔ)上,同時(shí)從檢索結(jié)果中獲取知識(shí),構(gòu)造了以RDF進(jìn)行知識(shí)表示的知識(shí)庫。利用本文提出的RQuery語言對(duì)知識(shí)庫進(jìn)行檢索。因此,衡量DLIIR系統(tǒng)的知識(shí)庫檢索性能(P-RKBIR)也就是衡量RQuery語言的檢索性能。采用知識(shí)庫檢索時(shí)間作為P_RKBIR的衡量標(biāo)準(zhǔn)。
在數(shù)據(jù)量很小時(shí)(10萬條記錄以下),數(shù)據(jù)量的變化對(duì)查詢時(shí)間的影Ⅱ向無法衡量出來,查詢時(shí)間相等。在數(shù)據(jù)量在百萬級(jí)別以上時(shí),才體現(xiàn)出查詢時(shí)間隨著數(shù)據(jù)量的增大而增加的趨勢(shì)。此外,查詢時(shí)間與記錄數(shù)是線性關(guān)系的。
基于結(jié)果,DLIIR系統(tǒng)符合設(shè)計(jì)要求,滿足了對(duì)數(shù)字圖書館領(lǐng)域異構(gòu)數(shù)據(jù)源集成檢索的需要,而系統(tǒng)的RDF知識(shí)庫通過設(shè)計(jì)的專用查詢語言RQuery進(jìn)行檢索時(shí)性能良好。
8結(jié)論
數(shù)字圖書館已經(jīng)成為國家信息化水平的標(biāo)志,是社會(huì)信息知識(shí)共享的框架平臺(tái)。因此,實(shí)現(xiàn)對(duì)該領(lǐng)域內(nèi)異構(gòu)信息源的互操作,給用戶提供智能的、主動(dòng)的知識(shí)服務(wù)是數(shù)字圖書館的發(fā)展方向。本文提出了一種實(shí)現(xiàn)異構(gòu)信息源集成信息檢索的互操作框架,并對(duì)知識(shí)庫的建立和檢索進(jìn)行了初步研究。
第三篇:多媒體信息檢索技術(shù)與數(shù)字化圖書館
多媒體信息檢索技術(shù)與數(shù)字化圖書館
楊勻
(鹽城師范學(xué)院圖書館,江蘇 鹽城 224002)
[摘要] 隨著信息技術(shù)的發(fā)展和數(shù)字化進(jìn)程的加快,傳統(tǒng)的圖書館的管理模式也正在經(jīng)歷著一場革命。本文作者對(duì)什么是數(shù)字化圖書館以及數(shù)字化圖書館的重要特征和數(shù)字化圖書館的發(fā)展方向進(jìn)行了重點(diǎn)研究和論述。
[關(guān)鍵詞]
多媒體 信息檢索 數(shù)字化 圖書館
圖書館作為知識(shí)和信息的交流中心,幾百年來一直受到人們的重視,并逐漸形成了一套完善的管理模式和科學(xué)方法。但隨著信息技術(shù)的發(fā)展和數(shù)字化進(jìn)程的加快,傳統(tǒng)的圖書館的管理模式也正在經(jīng)歷著一場革命。將計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)應(yīng)用于圖書管理之后,就實(shí)現(xiàn)了圖書的電子化管理和檢索,但這并不是真正意義上的數(shù)字化圖書館。有些人認(rèn)為將傳統(tǒng)圖書館中的文本文獻(xiàn)全部轉(zhuǎn)化成電子文檔就是數(shù)字化圖書館,這種觀點(diǎn)也是錯(cuò)誤的。一個(gè)完整意義上的數(shù)字化圖書館應(yīng)具有以下幾個(gè)特征:1)采用計(jì)算機(jī)和數(shù)據(jù)庫技術(shù)進(jìn)行文獻(xiàn)管理和檢索;2)館藏文獻(xiàn)不僅包括文本文獻(xiàn),而且包括各種多媒體形式的文獻(xiàn);3)在分布式網(wǎng)絡(luò)環(huán)境中以信息庫的形式存在。當(dāng)前,大多數(shù)圖書館都已基本具備了第一個(gè)特征。但具備第二和第三個(gè)特征的圖書館還寥寥無幾。
一、什么是數(shù)字化圖書館
所謂數(shù)字化圖書館,簡而言之,就是一種擁有多種媒體內(nèi)容豐富的數(shù)字化信息資源,能為讀者方便、快捷地提供信息的服務(wù)機(jī)制。雖然被稱之為“館”,但它并不占用空間,很大程度上也不受時(shí)間的限制,因?yàn)樗拇嬖诜绞绞菍⑽淖帧D像、聲音等信息數(shù)字化,并通過國際互聯(lián)網(wǎng)傳輸,從而做到信息資源全球共享。與以往的圖書館最大的不同就在于:它變集中“人”為集中信息和服務(wù)——“館”的形式并不重要,其水平高低取決于“軟件”質(zhì)量。在專家眼中,一個(gè)建設(shè)完備的數(shù)字圖書館應(yīng)當(dāng)成為重要信息的生產(chǎn)基地,多種信息資源的聚集中心;讀者、專家、圖書館員交互的樞紐;信息發(fā)現(xiàn)、搜索、捕捉的導(dǎo)航站點(diǎn);為用戶提供高水平服務(wù)的知識(shí)噴泉。
二、信息資源檢索的數(shù)字化與網(wǎng)絡(luò)化是數(shù)字化
圖書館的重要特征
電子計(jì)算機(jī)技術(shù)、通訊技術(shù)和多媒體技術(shù)相結(jié)合的現(xiàn)代信息數(shù)據(jù)處理技術(shù)的迅猛發(fā)展,加快了社會(huì)信息化的進(jìn)程。遍布世界各地的Internet加速了世界范圍內(nèi)數(shù)字化和網(wǎng)絡(luò)化的信息環(huán)境的形成。高校圖書館正是借助于現(xiàn)代信息技術(shù)在圖書館的應(yīng)用,推動(dòng)改革和擴(kuò)展了圖書館的各項(xiàng)職能。信息資源檢索服務(wù)也是其中之一。
信息資源檢索(Information Resource Retrieval)是將信息按一定的方式 組織或存儲(chǔ)起來,當(dāng)讀者或用戶需要時(shí)找出或提供有關(guān)信息的過程。或者說,信息檢索是將檢索者提問的特征與檢索標(biāo)識(shí)進(jìn)行比較,將檢索和提問特征一致或相似的信息查找出來。信息檢索包含資源存儲(chǔ)的檢索。信息檢索有文獻(xiàn)檢索,數(shù)據(jù)檢索和事實(shí)檢索三種類型。文獻(xiàn)檢索是檢索文獻(xiàn)資料,是從已存儲(chǔ)的文獻(xiàn)中查找出所需文獻(xiàn)的過程。文獻(xiàn)檢索可檢索出某一國家和某一作者的文章和著作,事實(shí)檢索是檢索所需的事實(shí),數(shù)據(jù)是檢索確切的數(shù)據(jù)。
隨著以計(jì)算機(jī)技術(shù),尤其是網(wǎng)絡(luò)技術(shù)為核心的現(xiàn)代信息技術(shù)的不斷進(jìn)步和在圖書館的運(yùn)用,高校圖書館的信息檢索服務(wù)正在由傳統(tǒng)的手工文獻(xiàn)資源檢索向計(jì)算機(jī)系統(tǒng)的OPAC檢索發(fā)展。尤其是廣大師生員工查找圖書館資料所需的時(shí)間進(jìn)一步縮短,加快了信息檢索的速度,提高了信息檢索的效率。
今天的計(jì)算機(jī)檢索技術(shù)發(fā)展極快,已由脫機(jī)向聯(lián)機(jī)檢索和網(wǎng)絡(luò)檢索過渡。脫機(jī)檢索是指以獨(dú)立的計(jì)算機(jī)為單位,利用光盤、磁盤、磁帶等存儲(chǔ)介質(zhì)進(jìn)行的信息檢索。聯(lián)機(jī)檢索系統(tǒng)是20世紀(jì)70年代隨著計(jì)算機(jī)和通訊技術(shù)的飛速發(fā)展,信息檢索服務(wù)進(jìn)入網(wǎng)絡(luò)環(huán)境而發(fā)展起來的信息檢索系統(tǒng)。聯(lián)機(jī)檢索是利用通訊設(shè)備與存儲(chǔ)有信息的計(jì)算機(jī)相聯(lián)結(jié)查找有關(guān)信息的過程。檢索者在通訊線路暢通的環(huán)境下,應(yīng)用計(jì)算機(jī)終端設(shè)備與主機(jī)進(jìn)行人機(jī)對(duì)話查找信息的過程。檢索者可在檢索過程中隨時(shí)修改自記的檢索策略,直到獲得滿意的結(jié)果。世界上規(guī)模最大的計(jì)算機(jī)聯(lián)機(jī)數(shù)據(jù)庫檢索服務(wù)系統(tǒng)有美國俄亥俄州圖書館計(jì)算機(jī)中心的OCLC,美國絡(luò)克希德公司的DOALOG,美國系統(tǒng)發(fā)展公司的ORBIT,美國醫(yī)學(xué)圖書館的MEDLINE,歐洲空間組織的ESA,日本的JOIS等。聯(lián)機(jī)檢索不受地理位置的限制,多用戶可同時(shí)進(jìn)行檢索。檢索速度快,功能多,打印輸出靈活方便。
今天,高校圖書館依托Internet開發(fā)和應(yīng)用的服務(wù)項(xiàng)目眾多。網(wǎng) 絡(luò)信息檢索只是其中最具優(yōu)勢(shì)的服務(wù)項(xiàng)目之一。Internet上運(yùn)行有功能完善的信息檢索工具,如Gopher、WAIS、WWW等。Gopher(分布式信息服務(wù)系統(tǒng))是Internet的重要信息檢索工具。它采用客戶機(jī)/服務(wù)器結(jié)構(gòu),通過多級(jí)菜單界面便于檢索者查看校園網(wǎng)的各種信息。WAIS(廣域信息網(wǎng))是Internet上的文本信息資源檢索工具。它為檢索者提供的自然語言界面受到檢索者的普通歡迎。WWW(環(huán)球網(wǎng))是Internet上最先進(jìn)的網(wǎng)絡(luò)信息檢索系統(tǒng)。它集超文本技術(shù),網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)為一體。WWW的瀏覽器/服務(wù)器模式具有優(yōu)化的結(jié)構(gòu)和強(qiáng)大的功能,也是最受檢索者喜愛的信息檢索系統(tǒng)之一。Internet技術(shù)遵循統(tǒng)一的協(xié)議將不同的信息系統(tǒng)連結(jié)起來,將世界上成千上萬臺(tái)服務(wù)器聯(lián)成一體,實(shí)現(xiàn)了各個(gè)信息系統(tǒng)向整體化和集成化的轉(zhuǎn)換。各高校圖書館應(yīng)用Internet技術(shù)建立本館的Web網(wǎng)站和OPAC,便于檢索者在各個(gè)地理位置的聯(lián)機(jī)終端訪問圖書館并快速地檢索各學(xué)科的專業(yè)信息。因此,無論你在家中或在辦公室都可以檢索到高校圖書館網(wǎng)頁上的網(wǎng)絡(luò)數(shù)據(jù)庫或全文數(shù)據(jù)庫。
高校圖書館作為各校教學(xué)和科研的信息資源中心,大多購置和擁有豐富的館藏印刷文獻(xiàn)資源,電子文獻(xiàn)資源和網(wǎng)絡(luò)信息資源。尤其是大量的國內(nèi)外光盤全文數(shù)據(jù)庫和網(wǎng)絡(luò)信息資源在高校圖書館的Web網(wǎng)站的OPAC上可無縫鏈接檢索。如“中國學(xué)術(shù)期刊數(shù)據(jù)庫”,“中國高等教育文獻(xiàn)保障目錄”、“萬方數(shù)據(jù)光盤檢索系統(tǒng)”、“科學(xué)引文索引”Web版數(shù)據(jù)庫,美國俄亥俄州OCLC書目數(shù)據(jù)庫和全文數(shù)據(jù)庫等等。此外,有的高校圖書館還根據(jù)本校重點(diǎn)學(xué)科建設(shè)引進(jìn)一些入編質(zhì)量高 和數(shù)量大的世界高水平的學(xué)術(shù)性網(wǎng)絡(luò)數(shù)據(jù)庫及電子期刊全文數(shù)據(jù)庫。
總之,擁有豐富的信息資源和多渠道檢索方式的高校圖書館借助現(xiàn)代信息技術(shù)的確為檢索者訪問圖書館,尤其是訪問圖書館的Web網(wǎng)站及時(shí)獲取所需的信息和及時(shí)了解所學(xué)專業(yè)的發(fā)展動(dòng)態(tài)提供了極大的便利。
三、多媒體與超媒體信息檢索技術(shù)是數(shù)字化
圖書館的發(fā)展方向
隨著信息查詢系統(tǒng)的不斷發(fā)展,多媒體與超媒體信息檢索已得到廣泛應(yīng)用,多媒體與超媒體信息檢索服務(wù)系統(tǒng)是一種人機(jī)交互的、以多媒體信息庫為基礎(chǔ)的、提供信息服務(wù)的系統(tǒng)。在多媒體與超媒體信息檢索服務(wù)系統(tǒng)問世以前,在電信領(lǐng)域有可視圖文系統(tǒng),在計(jì)算機(jī)領(lǐng)域有文獻(xiàn)資料檢索系統(tǒng)和各種數(shù)據(jù)庫檢索系統(tǒng)。因此,從信息檢索服務(wù)的角度來看,多媒體與超媒體信息檢索服務(wù)是可視圖文、各種數(shù)據(jù)庫檢索服務(wù)的自然發(fā)展。這種發(fā)展和變化的動(dòng)因是信息從單一媒體表示發(fā)展為多媒體表示。高校圖書館要成為名符其實(shí)的數(shù)字化圖書館,必須逐步發(fā)展和提供多媒體與超媒體信息檢索服務(wù)體系。
多媒體與超媒體信息技術(shù)是一個(gè)新的領(lǐng)域,其有關(guān)技術(shù)正在發(fā)展之中,尚有許多待研究的課題。多媒體與超媒體信息技術(shù)的發(fā)展對(duì)信息存儲(chǔ)管理、人機(jī)界面的開發(fā)提供有力的支持,它作為人類信息通信與信息聯(lián)想的工具,將促進(jìn)計(jì)算機(jī)和多媒體技術(shù)應(yīng)用的深入與發(fā)展,也有利于促進(jìn)數(shù)字化圖書館的高速發(fā)展和功能的不斷完善。
[參考文獻(xiàn)] [1] 張文俊.當(dāng)代傳媒新技術(shù).上海:復(fù)旦大學(xué)出版社,1998.年8月
[2] 張樹京.陳漁源.多媒體通信和發(fā)展和應(yīng)用.上海鐵道大學(xué)學(xué)報(bào), 1994年3月第15卷第1期
[3] 劉國亮.多媒體通信的技術(shù)基礎(chǔ)與應(yīng)用領(lǐng)域.長春郵電學(xué)院學(xué)報(bào),1994年第12卷第2期
第四篇:對(duì)數(shù)字技術(shù)在工程測(cè)量中的應(yīng)用研究
對(duì)數(shù)字技術(shù)在工程測(cè)量中的應(yīng)用研究
摘要:隨著信息化的高速發(fā)展,我國的測(cè)繪技術(shù)也已經(jīng)從傳統(tǒng)的人工測(cè)繪發(fā)展為數(shù)字化測(cè)繪,測(cè)繪技術(shù)取得了突飛猛進(jìn)的發(fā)展,本文探討了數(shù)字測(cè)繪技術(shù)的優(yōu)點(diǎn)以及應(yīng)用。
關(guān)鍵字:數(shù)字技術(shù)測(cè)繪技術(shù)應(yīng)用
數(shù)字化測(cè)繪技術(shù)是伴隨著計(jì)算機(jī)、網(wǎng)絡(luò)技術(shù)的發(fā)展及測(cè)量儀器的智能化而興起的一門新興的測(cè)繪技術(shù)。數(shù)字中國、數(shù)字城市等概念的提出以及相關(guān)數(shù)字化工程的啟動(dòng),特別是全球定位系統(tǒng)(GPS)、地理信息系統(tǒng)(GIS)、攝影測(cè)量與遙感(RS)以及數(shù)字化測(cè)繪和地面測(cè)量先進(jìn)技術(shù)的發(fā)展,使工程測(cè)量的手段和方法產(chǎn)生了深刻的變化。工程測(cè)量的服務(wù)領(lǐng)域也相應(yīng)進(jìn)一步延伸,而且正朝著測(cè)量數(shù)據(jù)采集和處理的自動(dòng)化、實(shí)時(shí)化和數(shù)字化方向發(fā)展。
一、數(shù)字化測(cè)繪技術(shù)的優(yōu)點(diǎn)
1.它可以通過計(jì)算機(jī)的模擬,在屏幕上直觀生動(dòng)地(分層)反映出地形、地貌特征以及地籍要素,而且一目了然,基本上改變和彌補(bǔ)了傳統(tǒng)產(chǎn)品線條、符號(hào)和數(shù)字、文字等綜合包羅,非具一定專業(yè)知識(shí)才能讀懂的缺陷。
2.數(shù)字化測(cè)繪產(chǎn)品在使用、維護(hù)和更新上具有方便快捷的特性,能夠隨時(shí)保持產(chǎn)品信息的現(xiàn)勢(shì)性,可以隨時(shí)補(bǔ)充修改,隨時(shí)出新圖提供使用。
3.根據(jù)不同用戶的需要,可以對(duì)產(chǎn)品的各種要素進(jìn)行數(shù)據(jù)再加工,得到不同用途的圖件,而且還可以隨意對(duì)圖形進(jìn)行拼接、縮放,用途更廣泛。
4.利用數(shù)字化(地形、地籍)測(cè)繪成果,作為底圖,可在計(jì)算機(jī)上進(jìn)行各種規(guī)劃與設(shè)計(jì)(如土地資源開發(fā)規(guī)劃和城市道路網(wǎng)的設(shè)計(jì)等),可方便地進(jìn)行許多方案的設(shè)計(jì)與比較,對(duì)各種要素的統(tǒng)計(jì)、匯總、疊加、分析也方便、準(zhǔn)確。在計(jì)算機(jī)的幫助下,大大提高了測(cè)繪生產(chǎn)作業(yè)的自動(dòng)化、科學(xué)化、規(guī)范化程度,數(shù)字化測(cè)繪產(chǎn)品的應(yīng)用水平也將達(dá)到新的高度。除此以外,在其他方面還顯示出很多優(yōu)越性,但從以上幾點(diǎn)足以可見數(shù)字化(地形、地籍)測(cè)繪很符合現(xiàn)代社會(huì)信息的要求,是現(xiàn)代測(cè)繪的發(fā)展方向。因而,以前以傳統(tǒng)測(cè)繪為主的專業(yè)測(cè)繪單位,現(xiàn)在是以發(fā)展數(shù)字化測(cè)繪技術(shù)作為發(fā)展的目標(biāo)與方向。
二、數(shù)字化測(cè)繪中作業(yè)模式的選擇問題
數(shù)字化測(cè)繪設(shè)備是全站儀加電子手簿或電子平板,作業(yè)分為編碼方法和無碼方法。編碼方法在記錄測(cè)量數(shù)據(jù)時(shí)必須按碎部點(diǎn)的類型及相互間幾何關(guān)系輸入特征編碼, 作業(yè)員不僅要熟記編碼,為正確輸入編碼,測(cè)站與棱鏡間還需要較多有關(guān)測(cè)點(diǎn)的信息交流,因此作業(yè)速度慢。尤其當(dāng)?shù)匦螐?fù)雜、通視困難、對(duì)一個(gè)地物的測(cè)量是不連續(xù)的,甚至要經(jīng)過幾個(gè)測(cè)站的觀測(cè)才能完成時(shí),作業(yè)難度大,出錯(cuò)機(jī)會(huì)多。無碼作業(yè)則不需輸入任何編碼,代之以繪制草圖記錄所測(cè)點(diǎn)位及相鄰關(guān)系。測(cè)站與棱鏡間聯(lián)絡(luò)較少,測(cè)站照準(zhǔn)目標(biāo)操作電子手簿驅(qū)動(dòng)全站儀測(cè)取數(shù)據(jù)后,只需向棱鏡處作業(yè)員報(bào)告碎部點(diǎn)號(hào)而已。具有平板測(cè)圖知識(shí)的作業(yè)員隨棱鏡現(xiàn)場繪制草圖,輕松且不易出錯(cuò)。測(cè)圖工作實(shí)際上主要在棱鏡處進(jìn)行,測(cè)站觀測(cè)速度很快,一臺(tái)全站儀可觀測(cè)2~3個(gè)棱鏡,相當(dāng)2~3個(gè)圖板的平板測(cè)圖。所以無碼作業(yè)方法更容易為測(cè)量人員所接受。數(shù)字化測(cè)繪記錄設(shè)備過去以電子手簿為主,但目前有關(guān)電子平板的介紹、報(bào)道較多。所謂內(nèi)外業(yè)一體化的作業(yè)方法,即利用電子平板(便攜機(jī))在野外實(shí)現(xiàn)碎部點(diǎn)展繪成圖被描繪成最先進(jìn)的方法。但實(shí)際上若電子平板與全站儀聯(lián)機(jī)則由于通視不一定好,加之?dāng)?shù)字化測(cè)圖測(cè)程較遠(yuǎn),繪圖員在電子平板上編輯繪圖很困難。若靠遠(yuǎn)距離觀察輔之以鏡站作業(yè)員的描述來繪圖,則不僅對(duì)電子平板繪圖員的技術(shù)、經(jīng)驗(yàn)要求較高,且既慢又容易出錯(cuò)。就這一點(diǎn)而言,類似傳統(tǒng)的平板測(cè)圖的作業(yè)方法,不同之處僅在于不需展點(diǎn)、計(jì)算機(jī)編輯代替手工繪圖而已。為解決這一問題,市場上推出了遙控電子平板。雖然采用遙控平板可使繪圖員隨棱鏡現(xiàn)場繪圖,但設(shè)備投資遠(yuǎn)高于電子手簿。野外作業(yè)速度也低于電子手簿加草圖方法。實(shí)際上是付出高昂的代價(jià)以外業(yè)時(shí)間換取內(nèi)業(yè)時(shí)間。若考慮到野外作業(yè)條件艱苦,作業(yè)人員的愿望恰恰相反;即寧愿用內(nèi)業(yè)時(shí)間換取外業(yè)時(shí)間。加之電子平板還有惡劣條件下可靠性差,攜帶不如電子手簿方便的缺點(diǎn)。所以大多數(shù)情況下,尤其是復(fù)雜地區(qū),電子手簿加草圖方法仍是最適合的作業(yè)方法。
三、數(shù)字化測(cè)繪技術(shù)在地籍測(cè)量中的應(yīng)用
1.數(shù)字測(cè)圖的主要內(nèi)容
1.1原圖數(shù)字化
當(dāng)一個(gè)地區(qū)需要用到數(shù)字地形圖而一時(shí)因經(jīng)費(fèi)困難或受到時(shí)間等原因的限制時(shí),該方法是最適宜的。它能夠充分利用現(xiàn)有的地形圖,僅需配備計(jì)算機(jī)、數(shù)字化儀或掃描儀、繪圖儀再配以數(shù)字化軟件就可以開展工作,并且可以在很短的時(shí)間內(nèi)獲得數(shù)字化成果。它的工作方法有兩種:手扶跟蹤數(shù)字化及掃描矢量化,其中后一種的精度、效率更高。但是,利用該方法所獲得的數(shù)字地圖其精度因受原圖精度的影響,加上數(shù)字化過程中所產(chǎn)生的各種誤差,因而它的精度要比原圖的精度差。而且它所反映的只是白紙成圖時(shí)地表上各種地物地貌,現(xiàn)時(shí)性不是很好。所以它僅能作為一種應(yīng)急措施而非長久之計(jì)。為了充分利用該法得到數(shù)字地圖,可通過修測(cè)、補(bǔ)測(cè)等方法,實(shí)測(cè)一部分地物點(diǎn)的精確坐標(biāo),再用這些點(diǎn)的坐標(biāo)代替原來的坐標(biāo),通過調(diào)整,可在一定程度上提高原圖的精度。而隨著地圖的不斷更新,實(shí)測(cè)坐標(biāo)的增加, 地圖的精度也就會(huì)相應(yīng)地得到提高。
1.2地面數(shù)字測(cè)圖
在沒有合乎要求的大比例尺地圖的地區(qū),可直接采用地面數(shù)字測(cè)圖的方法,該方法也稱為內(nèi)外業(yè)一體化數(shù)字測(cè)圖,是我國目前各測(cè)繪單位用得最多的數(shù)字測(cè)圖方法。采用該方法所得到的數(shù)字地圖的特點(diǎn)是精度高,只要采取一定的措施,重要地物相對(duì)于鄰近控制點(diǎn)的精度控制在5cm內(nèi)是可以做到的。
1.3航測(cè)數(shù)字成圖
當(dāng)一個(gè)地區(qū)(或測(cè)區(qū))很大時(shí),可以利用航空攝影機(jī)在空中攝取地面的影像,通過外業(yè)判讀,在內(nèi)業(yè)建立地面的模型,通過計(jì)算機(jī)用繪圖軟件在模型上量測(cè),直接獲得數(shù)字地形圖。隨著測(cè)繪技術(shù)的發(fā)展,數(shù)字?jǐn)z影測(cè)量已在我國部分地區(qū)取得成功,不久將會(huì)得到推廣。它是通過在空中利用數(shù)字?jǐn)z影機(jī)所獲得的數(shù)字影像,內(nèi)業(yè)通過專門的航測(cè)軟件,在計(jì)算機(jī)上對(duì)數(shù)字影像進(jìn)行像對(duì)匹配,建立地面的數(shù)字模型,再通過專用的軟件來獲得數(shù)字地圖。可以說,這將是今后數(shù)字測(cè)圖的一個(gè)重要發(fā)展方向。該方法的特點(diǎn)是可將大量的外業(yè)測(cè)量工作移到室內(nèi)完成,它具有成圖速度快、精度高而均勻、成本低,不受氣候及季節(jié)的限制等優(yōu)點(diǎn),特別適合于城市及大測(cè)區(qū)的大面積成圖。
2.數(shù)字測(cè)圖在地籍測(cè)量中的應(yīng)用
隨著國家小城鎮(zhèn)建設(shè)步伐的加快,城鎮(zhèn)地籍測(cè)量工作在全國范圍內(nèi)展開,各地對(duì)地籍圖的需求將急劇膨脹。地籍測(cè)量的目的是為了全面澄清城鎮(zhèn)土地的屬性、位置、面積、用途、經(jīng)濟(jì)價(jià)值及相互之間的關(guān)系,為建立全國土地管理信息系統(tǒng)奠定基礎(chǔ)。隨著高新測(cè)繪技術(shù)的開發(fā)和應(yīng)用,數(shù)字化測(cè)繪技術(shù)的應(yīng)用得到迅速發(fā)展。較之傳統(tǒng)的大(小)平板儀(地形、地籍)測(cè)繪技術(shù),數(shù)字化測(cè)繪可以讓測(cè)繪產(chǎn)品更加多樣化,技術(shù)含量和應(yīng)用水平更高,產(chǎn)品的使用與維護(hù)更加方便、快捷、直觀,與傳統(tǒng)的測(cè)繪產(chǎn)品(地形、地籍圖件)相比,數(shù)字化測(cè)繪產(chǎn)品具有明顯的優(yōu)越性。作業(yè)流程的科學(xué)化是數(shù)字測(cè)量的關(guān)鍵所在,結(jié)合測(cè)區(qū)已有的資料,以有關(guān)規(guī)程、規(guī)范為依據(jù),設(shè)計(jì)作業(yè)流程,數(shù)字地籍測(cè)量的作業(yè)流程見下圖:
3.數(shù)字測(cè)繪在數(shù)字地球中的應(yīng)用
簡言之,數(shù)字地球就是把經(jīng)濟(jì)和社會(huì)發(fā)展方方面面的信息,加載于一個(gè)統(tǒng)一的地理坐標(biāo)框架中按數(shù)字的形式存貯于計(jì)算機(jī),任何機(jī)構(gòu)或個(gè)人均可通過網(wǎng)絡(luò)通訊技術(shù), 足不出戶便獲取所需的信息做到“秀才不出門,全知天下事”。數(shù)字地球是一個(gè)十分龐大的系統(tǒng)工程,技術(shù)復(fù)雜,涉及部門多,沒有任何一個(gè)部門或團(tuán)體能單獨(dú)承擔(dān),它需要地球科學(xué)、信息科學(xué)、空間技術(shù)和眾多應(yīng)用部門的配合。測(cè)繪作為地學(xué)和信息學(xué)的重要組成部分,在國家空間數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)中具有不可替代的地位, 空間基礎(chǔ)信息的獲取、處理,向信息高速公路提供內(nèi)容豐富、形式多樣的信息貨物等工作已歷史地落在測(cè)繪工作者肩上。可以說,數(shù)字地球始于測(cè)繪。我國測(cè)繪部門從20世紀(jì)八十年代初期開始,對(duì)傳統(tǒng)測(cè)繪技術(shù)進(jìn)行了大規(guī)模的數(shù)字化改造。傳統(tǒng)的光學(xué)定位技術(shù)已被光電技術(shù)、GPS技術(shù)所取代,傳統(tǒng)的白紙測(cè)圖已被數(shù)字測(cè)圖和地理信息系統(tǒng)所取代,以地面測(cè)量為主向以衛(wèi)星定位(GPS)、衛(wèi)星遙感(RS)測(cè)繪等高技術(shù)為主的對(duì)地觀測(cè)方面轉(zhuǎn)變,被動(dòng)的靜態(tài)測(cè)量向動(dòng)態(tài)的實(shí)時(shí)測(cè)量方面轉(zhuǎn)變"測(cè)繪部門在數(shù)字地球基礎(chǔ)框架建設(shè)方面做了大量工作,主要包括:建立了全國A級(jí)、B級(jí) GPS網(wǎng);完成了全國1:100萬、1:25萬基礎(chǔ)地理數(shù)據(jù)庫和數(shù)據(jù)服務(wù)設(shè)施;建立了國情和省情綜合地理信息系統(tǒng);研制成功了從遙感立體影像自動(dòng)建立數(shù)字地面模型的數(shù)字?jǐn)z影測(cè)量系統(tǒng);研制成功了數(shù)字高程模型(DEM)、數(shù)字正射影像(DOM)、數(shù)字線劃圖(DLG)、數(shù)字柵格圖(DRG)等“4D”產(chǎn)品生產(chǎn)線。數(shù)字地球的雛形已經(jīng)形成。
當(dāng)然,數(shù)字測(cè)繪技術(shù)應(yīng)用于很多方面,由于篇幅有限,就不在此一一列舉了。
總之,數(shù)字測(cè)繪技術(shù)在工程測(cè)量中應(yīng)用廣泛,精確且使用,并且數(shù)字測(cè)繪技術(shù)也在日新月異地發(fā)展,廣大測(cè)繪工作者要更新思維、堅(jiān)持學(xué)習(xí),做數(shù)字化的測(cè)繪工作者。
參考文獻(xiàn):
[1]賀麗娟,曹振一數(shù)字化測(cè)繪技術(shù)在工程測(cè)量中的應(yīng)用西北水電2002
[2]覃其進(jìn)淺談數(shù)字化技術(shù)在地籍測(cè)繪中的應(yīng)用廣西地質(zhì)2001
[3]高恒昌,段朝輝,張澎數(shù)字化測(cè)圖在城鎮(zhèn)地籍測(cè)量中的應(yīng)用[J]城市勘測(cè),2002,(2)1
[4]宋其友,等1數(shù)字地籍測(cè)量[J]北京:測(cè)繪出版社,1991
第五篇:圖書館數(shù)字資源檢索指南(2013版)
南昌大學(xué)科學(xué)技術(shù)學(xué)院圖書館
各位讀者:
歡迎使用圖書館各類數(shù)字資源,在使用過程中請(qǐng)尊重并維護(hù)原作者和出版者的知識(shí)產(chǎn)權(quán)利益,遵守版權(quán)法的規(guī)定,嚴(yán)禁惡意下載數(shù)據(jù)或?qū)?shù)據(jù)用于任何商業(yè)或其他營利性用途。
請(qǐng)認(rèn)真閱讀以下注意事項(xiàng),有任何疑問或者建議,請(qǐng)前往8樓數(shù)字資源檢索室。聯(lián)系電話:88305485
感謝你們的合作與支持!數(shù)字資源使用指南
圖書館主頁:http://172.16.41.14
﹡﹡﹡﹡2013年3月
數(shù)字資源檢索室制作﹡﹡﹡﹡
【數(shù)字資源檢索室簡介】
本檢索室承擔(dān)全院的數(shù)字資源建設(shè)與宣傳、文獻(xiàn)檢索課教學(xué)及培訓(xùn)講座等工作,為讀者的數(shù)字資源檢索提供咨詢和指導(dǎo)服務(wù)。
目 錄
一.如何使用圖書館數(shù)字資源????????????? 第2 頁
二、圖書館網(wǎng)站功能介紹(不斷更新)??????????.第2 頁 三.檢索步驟及參考????????????????? 第2 頁 四.如何選擇所需數(shù)字資源?????????????? 第3 頁
五.檢索過程中可能遇到的問題 ??????????? 第4 頁 六.什么是文獻(xiàn)傳遞服務(wù)??????????????? 第4 頁
﹡﹡﹡﹡﹡
一、如何使用圖書館數(shù)字資源?﹡﹡﹡﹡﹡﹡﹡﹡
2、館內(nèi)指南 本館概況l開放時(shí)間l本館布局l讀者須知l常見問題l聯(lián)系方式l 答:在校園網(wǎng)范圍內(nèi)(不含教工、學(xué)生寢室)可免費(fèi)使用圖書館各類數(shù)字資源。
步驟一:使用有線、無線網(wǎng)絡(luò)訪問圖書館主頁
1.有線網(wǎng)絡(luò)
讀者可在我館二樓電子閱覽室和八樓數(shù)字資源檢索室使用檢索機(jī),或者自帶電腦在八樓南北室使用網(wǎng)線連接;教師可在辦公室或資料室訪問。2.無線網(wǎng)絡(luò)
讀者可自帶電腦在我館的六、七、八樓使用無線網(wǎng)絡(luò)(只限訪問內(nèi)網(wǎng))訪問。【無線網(wǎng)絡(luò)連接方法】在無線網(wǎng)絡(luò)列表查找任意一個(gè)用戶名(7lou a1、7lou a2或7lou a4),連接成功后,在網(wǎng)頁地址欄輸入圖書館網(wǎng)址http://172.16.41.14。win7系統(tǒng)連接時(shí)會(huì)跳出提示框(如圖),點(diǎn)擊第三行字“在不設(shè)置網(wǎng)絡(luò)的情況下連接到網(wǎng)絡(luò)”即可。
步驟二:登錄圖書館主頁
答:1.在瀏覽器地址欄輸入http://172.16.41.14登錄圖書館主頁。
2.從學(xué)院主頁進(jìn)入圖書館網(wǎng)站。
步驟三:選擇并使用所需圖書館資源
﹡﹡﹡﹡﹡
二、圖書館網(wǎng)站各版塊功能介紹(不斷更新)﹡﹡﹡﹡﹡
1、電子資源 館藏查詢l中文數(shù)據(jù)庫l外文數(shù)據(jù)庫l電子圖書l學(xué)習(xí)題庫l工具下載
中國圖書館分類法
3、讀者園地
新書通報(bào)l借閱排行榜l讀者薦購l新生專欄l畢業(yè)生專欄l l讀書日l
讀者留言
4、館內(nèi)服務(wù) 文獻(xiàn)檢索教學(xué)l圖書館講座l定題服務(wù)l文獻(xiàn)傳遞服務(wù)l特色導(dǎo)讀
5、咨詢通道 QQ在線l圖書館微博l電話咨詢服務(wù)
﹡﹡﹡﹡﹡三.檢索步驟及參考﹡﹡﹡﹡﹡
步驟一:分析課題或論文題目,選擇合適的檢索詞
【注】在檢索過程中請(qǐng)盡量使用準(zhǔn)確的檢索詞,不要輸入一個(gè)句子,題目中的“分析”、“研究”、“應(yīng)用”等詞一般不作為檢索詞;
步驟二:選擇合適的數(shù)據(jù)庫(詳見圖書館各數(shù)據(jù)庫介紹)步驟三:查找文獻(xiàn)線索
【注】如果對(duì)檢索結(jié)果不滿意,可以不斷對(duì)檢索項(xiàng)和檢索詞進(jìn)行調(diào)整;
步驟四:下載原始文獻(xiàn)
數(shù)據(jù)庫的原始文獻(xiàn)需要閱讀器才能閱讀全文(不能使用word打開),常用閱讀器有CAJ和Adobe Reader,讀者需自行下載。
【例】論文題目: “《百家講壇》與《世紀(jì)大講堂》比較研究 ”
步驟一:分析論文題目,選擇合適的檢索詞
【小知識(shí)】邏輯算符:或(+)、與(*)、非(-)
1、初次檢索,將論文的中心詞定為:百家講壇和世紀(jì)大講堂,使用“并且”的關(guān)系將兩組檢索詞“百家講壇*世紀(jì)大講堂”和“百家講壇*世紀(jì)大講堂*比較”到數(shù)據(jù)庫檢索,看是否有學(xué)者對(duì)這兩個(gè)概念做過比較;
2、通過檢索,我們了解到已經(jīng)有部分學(xué)者對(duì)百家講壇與世紀(jì)大講堂在某些方面做過研究,接下來我們對(duì)這兩個(gè)概念分開檢索:百家講壇+世紀(jì)大講堂,看看分別作了哪些研究值得借鑒;
3、提供更多的同義詞:講壇文化、學(xué)術(shù)型電視節(jié)目,電視講壇節(jié)目等同義詞。步驟二:選擇中國知網(wǎng)、萬方、維普三個(gè)中文數(shù)據(jù)庫,多庫檢索擴(kuò)大查全率; 步驟三:查找文獻(xiàn)線索,按照步驟一的選詞策略不斷調(diào)整; 步驟四:選擇CAJ格式下載文獻(xiàn)并查看。
檢索注意事項(xiàng)
1、輸入檢索詞,可是查詢不到內(nèi)容?
查詢文獻(xiàn)需要掌握一定的技巧。請(qǐng)先確認(rèn)你是否選擇了正確的數(shù)據(jù)庫,該數(shù)據(jù)庫收錄的學(xué)科范圍,再注意 “檢索項(xiàng)”“檢索詞”的選擇。
每個(gè)數(shù)據(jù)庫都提供給讀者檢索項(xiàng)的選擇(見上),包括:主題、題名(篇名)、關(guān)鍵詞、全文、作者等,即你輸入的檢索詞要求出現(xiàn)在文獻(xiàn)的題名、全文題目里。
查全率由高至低的排序?yàn)椋喝摹⒅黝}、篇名、關(guān)鍵詞,讀者可根據(jù)具體情況選擇;除此之外,如果您的論文選題較新穎,也有可能查找不到相關(guān)文獻(xiàn)。
﹡﹡﹡﹡﹡
四、如何選擇所需數(shù)字資源?﹡﹡﹡﹡﹡
檢索論文資料—— 常用中文、外文數(shù)據(jù)庫、試用數(shù)據(jù)庫 閱讀 —— 電子圖書 考級(jí)、考證 —— 網(wǎng)絡(luò)學(xué)習(xí)的平臺(tái) 下載光盤 —— 隨書光盤下載系統(tǒng)
(一)檢索論文資料——常用中文、外文數(shù)據(jù)庫、試用數(shù)據(jù)庫(不斷更新)
一般檢索中文文獻(xiàn)資源使用中國知網(wǎng)、萬方、維普這三個(gè)數(shù)據(jù)庫,可以滿足讀者檢索中文文獻(xiàn)的要求,還可以選擇使用專業(yè)類的期刊庫,如經(jīng)濟(jì)類、工程類等等,獲取和了解更加專業(yè)的學(xué)科背景知識(shí)。1)【綜合類】中國知網(wǎng)CNKI
資源:中國期刊全文數(shù)據(jù)庫、中國博碩士學(xué)位論文全文數(shù)據(jù)庫、中國重要報(bào)紙全文數(shù)據(jù)庫和中國重要會(huì)議文論全文數(shù)據(jù)庫等。
檢索服務(wù):文獻(xiàn)、數(shù)字搜索、翻譯助手、圖形搜索、學(xué)術(shù)資源、學(xué)術(shù)統(tǒng)計(jì)分析;每個(gè)數(shù)據(jù)庫都提供初級(jí)檢索、高級(jí)檢索和專業(yè)檢索三種檢索功能。2)【綜合類】萬方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)
資源:
特色之處:類型豐富,尤以理工類文獻(xiàn)為特色;還可提供很多實(shí)用生活方面的信息,如院校信息、醫(yī)藥信息、交 通旅游信息、商品和通訊信息等,可適合不同層次讀者的需求。
3)【綜合類】維普中文科技期刊數(shù)據(jù)庫
維普中文科技期刊數(shù)據(jù)庫包含了1989年至今文獻(xiàn),主要以期刊文獻(xiàn)為主。4)【綜合類】江西高校數(shù)字圖書館
檢索平臺(tái)以超星學(xué)術(shù)搜索為依托,把江西省各高校圖書館的數(shù)字資源整合在一起,資源共享。將檢索結(jié)果與館藏各種資源庫對(duì)接,讀者檢索任何一個(gè)知識(shí)點(diǎn),都可以直獲取圖書館內(nèi)與其相關(guān)的紙質(zhì)圖書、電子圖書全文等。不需要再對(duì)各種資源逐一登錄檢索查找,避免了反復(fù)收集和查找的困擾。特色之處:即時(shí)的參考咨詢服務(wù)——以260萬種中文圖書的海量資源為基礎(chǔ),通過文獻(xiàn)傳遞,直接將相關(guān)學(xué)術(shù)資料發(fā)送到讀者郵箱,使讀者零距離獲取珍稀學(xué)術(shù)資源。5)【綜合類】 Socolar平臺(tái)(收錄OA期刊)
6)【綜合類】 ISI Web of Knowledge信息檢索平臺(tái)(SCI、ISTP、CCR/IC)7)【綜合類】 Springer數(shù)據(jù)庫 8)【綜合類】 Elsevier數(shù)據(jù)庫
9)【學(xué)位論文】ProQuest博碩士論文全文數(shù)據(jù)庫 10)【工程類.文摘】 Ei Compendex工程索引 11)【物理類】 Scitation檢索平臺(tái)(AIP/APS)
12)【電氣/電子工程】IEEE/IEE Electronic Library 13)【化學(xué)類.文摘】 Chemical Abstracts(CA)
其他數(shù)據(jù)庫請(qǐng)參考圖書館鏈接。二)閱讀——電子圖書(不斷更新)
1)九羽數(shù)字圖書館
2)超星數(shù)字圖書館 在線閱讀圖書近130萬冊(cè),需使用超星閱讀器。
三)考級(jí)、考證——網(wǎng)絡(luò)學(xué)習(xí)的平臺(tái)(不斷更新)
1)銀符考試模擬題庫
四)下載光盤——隨書光盤下載系統(tǒng)(不斷更新)
一樓或者三樓借閱的圖書附帶光盤,可使用該系統(tǒng)下載所需資源。若在系統(tǒng)未找到所需資源,請(qǐng)帶好證件及50元/張押金到一樓咨詢處借出光盤下載。
﹡﹡﹡﹡﹡ 五. 檢索過程中可能遇到的問題﹡﹡﹡﹡﹡、1.圖書館數(shù)據(jù)庫需要密碼嗎?
答:只要讀者在校園網(wǎng)范圍內(nèi)登陸圖書館主頁試用數(shù)據(jù)庫,無需輸入讀者證號(hào)和密碼(查詢借閱情況除外)。若不小心跳出默認(rèn)頁面(如中國知網(wǎng)),只需點(diǎn)擊“IP登錄”,或者在相應(yīng)的數(shù)據(jù)庫跳轉(zhuǎn)頁面上手動(dòng)輸入說明的用戶名和密碼即可。
2.為什么在下載文章的過程中速度比較慢?
答:可能有兩種情況:(1)數(shù)據(jù)庫處于更新狀態(tài);(2)數(shù)據(jù)庫限制用戶數(shù)量,若多人同時(shí)使用數(shù)據(jù)庫下載文章,速度較慢。如果出現(xiàn)以上情況,請(qǐng)各位師生耐心等待,或另擇時(shí)間段。
3.為何在中國知網(wǎng)有些選擇的文章顯示“未購買該數(shù)據(jù)庫”?
答:圖書館沒有購買該庫的使用版權(quán),可以試著在其他的數(shù)據(jù)庫進(jìn)行檢索。
4.拷回去的文章為什么不能直接用word閱讀?不能存為word格式嗎?
答:數(shù)據(jù)庫中收藏的文章都是把各類期刊掃描成電子版的上傳到各數(shù)據(jù)庫,多為PDF格式,或者CAJ等其他格式。同學(xué)們?cè)谧约弘娔X上閱讀的時(shí)候需要下載閱讀器才能看文章。常用閱讀器有Adobe Reader、CAJ等閱讀器。
5. 為什么一些試用數(shù)據(jù)庫有些版塊不能用?
答:我館有部分?jǐn)?shù)據(jù)庫為試用數(shù)據(jù)庫,尚未購買。圖書館會(huì)根據(jù)讀者使用情況和需求量考慮是否購買。如果讀者覺得該試用數(shù)據(jù)庫實(shí)用且方便,可以與我們聯(lián)系,到時(shí)將
酌情考慮購買。外文文獻(xiàn)怎么找,為什么外文文獻(xiàn)很少?
答:外文文獻(xiàn)請(qǐng)到外文數(shù)據(jù)庫查找,但必須在檢索項(xiàng)輸入外文的檢索詞!與中文文獻(xiàn)相比,數(shù)據(jù)庫里的外文文獻(xiàn)資源相對(duì)較少,再加上讀者外語水平的限制,檢索起來較困難。讀者可先在圖書館鏈接的數(shù)據(jù)庫里檢索,檢索不到內(nèi)容的,我們建議讀者采取文獻(xiàn)傳遞的方式(個(gè)人付費(fèi))獲取全文,詳情請(qǐng)參照下部分內(nèi)容。
﹡﹡﹡﹡﹡六.什么是文獻(xiàn)傳遞服務(wù)?﹡﹡﹡﹡﹡
CALIS、CASHL文獻(xiàn)傳遞服務(wù)是我院圖書館為了幫助師生更方便快捷獲取中、外文原文文獻(xiàn),分別與南昌大學(xué)圖書館以及CASHL服務(wù)中心簽訂的服務(wù)項(xiàng)目。凡是我院師生需要的原文文獻(xiàn),并不能在我院圖書館及本部圖書館的館藏?cái)?shù)據(jù)庫中找到資源的,可通過自費(fèi)方式獲取。付費(fèi)標(biāo)準(zhǔn)請(qǐng)參考附表,傳遞的文獻(xiàn)類型主要包括期刊論文、會(huì)議錄文獻(xiàn)以及圖書部分章節(jié)等,通過e-mail傳遞文獻(xiàn)。如需了解具體詳情,請(qǐng)關(guān)注圖書館網(wǎng)站相關(guān)版塊或前往數(shù)字資源檢索室咨詢。
服務(wù)對(duì)象
校內(nèi)讀者——擁有本館有效證件的校內(nèi)教職員工及在校學(xué)生。服務(wù)滿足條件
1、讀者在我館所有數(shù)據(jù)庫中沒有查找到所需文獻(xiàn)的;
2、讀者通過CALIS、CASHL這兩個(gè)平臺(tái)查找到所需文獻(xiàn)。
服務(wù)內(nèi)容
CALIS和CASHL文獻(xiàn)傳遞服務(wù)方式和步驟各有不同,請(qǐng)參照?qǐng)D書館網(wǎng)站具體版塊。
咨詢電話 : 88305485
版權(quán)聲明 讀者在使用圖書館提供的文獻(xiàn)時(shí),必須遵循中華人民共和國有關(guān)的版權(quán)
法,進(jìn)行合理使用,不得直接用于以盈利為目的的活動(dòng)。