第一篇:檔案館數(shù)字化、數(shù)字化檔案館、數(shù)字檔案館
關(guān)于檔案館數(shù)字化建設(shè)的思考
2006-11-9 網(wǎng)友評論 0 條 點擊進(jìn)入論壇
當(dāng)二十世紀(jì)的尼葛洛龐帝(Nicholas Negroponte)在《數(shù)字化生存》(Being Digital)一書中,向人們描述著數(shù)字時代對我們的生活方式、工作方式甚至思維方式帶來的各種沖擊時,人類文明已經(jīng)真實地邁進(jìn)了二十一世紀(jì),數(shù)字化信息時代的大潮朝著我們撲面而來。檔案管理和利用如何應(yīng)對及適應(yīng)數(shù)字化信息時代的需求,是我們檔案工作者要思考的。
一、傳統(tǒng)檔案館的數(shù)字之路
2000年12月,國家檔案局、中央檔案館印發(fā)的《全國檔案事業(yè)發(fā)展“十五”計劃》,把“加快檔案信息化建設(shè)”、“加快現(xiàn)有檔案的數(shù)字化進(jìn)程”列入其中,同月國家檔案局在中國檔案管理現(xiàn)代化建設(shè)研討會上宣布:十五期間,我國將加快數(shù)字化檔案館的建設(shè)。由此,傳統(tǒng)檔案館數(shù)字化建設(shè)的問題引起了人們的關(guān)注,并且有一些檔案館已經(jīng)開始對此投資建設(shè)。我們認(rèn)為,傳統(tǒng)檔案館的數(shù)字之路并非一蹴而就,而是一個循序漸進(jìn)的過程,對這個過程的各個環(huán)節(jié)進(jìn)行深入的分析研究是十分必要的,只有在有了清楚認(rèn)識的基礎(chǔ)上,才能規(guī)劃和解決好檔案館的數(shù)字化之路,為今后的數(shù)字化檔案館進(jìn)而是數(shù)字檔案館、虛擬檔案館的建設(shè)打好基礎(chǔ)。
傳統(tǒng)檔案館的數(shù)字之路由三個相互聯(lián)系的階段組成:
(一)檔案館數(shù)字化。檔案館的數(shù)字化包含著以下三層含義,其一是隨著計算機技術(shù)的引入,建立檔案館的自動化系統(tǒng),實現(xiàn)檔案館自動化管理,完成檔案管理的數(shù)字化;其二是館藏信息數(shù)字化,數(shù)字化的館藏檔案信息能直接被計算機識別和處理,建成完備的信息數(shù)據(jù)庫;其三是構(gòu)建平滑高效的檔案信息數(shù)字化傳輸平臺,實現(xiàn)檔案的統(tǒng)一管理和資源共享。
(二)數(shù)字化檔案館。在檔案館數(shù)字化基礎(chǔ)上,形成以數(shù)字化信息為館藏內(nèi)容,以計算機為管理手段,以網(wǎng)絡(luò)傳遞為利用方式的一種新型檔案館,是采用現(xiàn)代高新技術(shù)的數(shù)字信息資源系統(tǒng)。
(三)數(shù)字檔案館。通過國家信息基礎(chǔ)工程聯(lián)合數(shù)字化檔案館,運用網(wǎng)絡(luò)互聯(lián)技術(shù),將個體數(shù)字化檔案館聯(lián)合起來,進(jìn)行擴張、伸展,組成完全意義的數(shù)字檔案館,遵循共同協(xié)議,實現(xiàn)數(shù)字化信息共享,是超大規(guī)模的、便于使用的、沒有時空限制的知識信息中心。用戶可以通過網(wǎng)絡(luò)計算機終端提出需求,由數(shù)字檔案館系統(tǒng)完成查找和調(diào)閱檔案信息,完全不受時間和地理條件的限制。如果說運用虛擬技術(shù),建立虛擬檔案館的話,那么,檔案館發(fā)展到第三個階段,才真正可以稱得上是虛擬檔案館。
二、檔案館數(shù)字化——數(shù)字化的起點
檔案館的數(shù)字化建設(shè)作為傳統(tǒng)檔案館數(shù)字之路的起點,如何走好這首要一步,就顯得至關(guān)重要。為此我們就著重于這一點來談一下我們的觀點。
計算機技術(shù)的普及,為檔案館數(shù)字化建設(shè)奠定了良好的基礎(chǔ)。檔案館數(shù)字化建設(shè)包含以下幾個方面:
(一)檔案管理的數(shù)字化。檔案管理自動化是對檔案館自身管理行為現(xiàn)代化的確定,而這種現(xiàn)代化是建立在計算機數(shù)字化管理基礎(chǔ)上的。這個特征是基礎(chǔ)性的,有普遍意義的,是開展其他數(shù)字化工作的前提條件。現(xiàn)在許多文章在探討數(shù)字檔案館或虛擬檔案館時,較多是對檔案館美好前景的預(yù)測與憧憬,很少涉及傳統(tǒng)檔案館的現(xiàn)代化管理問題,忽視檔案管理具體業(yè)務(wù)環(huán)節(jié)的計算機數(shù)字化管理問題,如檔案自動編目和自動檢索、檔案自動全文存儲與檢索、檔案業(yè)務(wù)工作輔助管理、計算機輔助立卷、檔案自動標(biāo)引、文檔一體化管理、檔案館辦公自動化、檔案庫房保護(hù)技術(shù)現(xiàn)代化、檔案數(shù)據(jù)庫設(shè)計與建立等。而這些不僅是檔案管理基本的業(yè)務(wù)環(huán)節(jié),也是檔案管理自動化的具體體現(xiàn),更是檔案管理數(shù)字化全面實現(xiàn)的基礎(chǔ)。這些問題不解決,檔案館數(shù)字化建設(shè)就是“空中樓閣”,無從談起。
20世紀(jì)90年代以來,我國各級各類檔案館開始進(jìn)行檔案管理數(shù)字化的實踐與探索,大致可以歸納為三方面的發(fā)展方向。
1、建立著錄檔案信息檢索系統(tǒng)。著錄檔案信息檢索系統(tǒng),應(yīng)該說是計算機技術(shù)與檔案工作的最早結(jié)合點。由于檔案館的館藏量巨大,檔案的信息資源又是如此豐富多樣,為了方便利用者,提高查詢效率,檔案館利用計算機技術(shù)進(jìn)行檔案目錄或?qū)n}文件級目錄著錄,以達(dá)到快速檢索的目的,檢索工具的數(shù)字化帶來的優(yōu)勢盡顯無遺。
2、“文檔一體化”管理。1992年國家檔案局提出“文檔一體化”管理思路,許多檔案部門紛紛嘗試?yán)糜嬎銠C技術(shù)實現(xiàn)文件與檔案的一體化管理,從文件形成之時到文件辦結(jié)歸檔乃至檔案管理成為一條流水線的操作過程。“文檔一體化”操作管理軟件與傳統(tǒng)手工操作相比,避免應(yīng)歸檔的文件材料人為遺漏,提高了文件歸檔的完整性和準(zhǔn)確性,提高了文件立卷的效率,提高了檔案的質(zhì)量。但它也只是利用計算機技術(shù)來模擬傳統(tǒng)手工操作流程,不是真正意義上的文檔管理數(shù)字化。
3、檔案館數(shù)字化管理系統(tǒng)的建設(shè)。我國檔案工作數(shù)字化管理起步時間較晚,目前還是以針對上述檔案信息檢索系統(tǒng)和文檔一體化數(shù)據(jù)庫系統(tǒng)的管理為主,停留在檔案工作數(shù)字化管理的初級階段,數(shù)字化管理的優(yōu)勢和潛能并未充分發(fā)掘出來。檔案工作數(shù)字化管理系統(tǒng)實際上是一個可以涵蓋檔案館行政管理和業(yè)務(wù)管理、檔案信息開發(fā)利用工作等諸方面的大型的系統(tǒng)工程。檔案館數(shù)字化管理應(yīng)該以此為契入點,朝著這個方向積極發(fā)展。
(二)館藏信息的數(shù)字化。根據(jù)《檔案法》的規(guī)定,綜合性檔案館作為黨和國家的科學(xué)文化事業(yè)機構(gòu),是永久集中保存檔案的基地,與國家歷史同在。綜合性檔案館通常都有數(shù)量龐大的館藏,內(nèi)容及形式也是豐富多樣的。就傳統(tǒng)的檔案載體而言,其記錄信息都是平面的,文字、圖像、聲音等不同載體的信息難以有機地結(jié)合起來。通過運用計算機技術(shù)與多媒體技術(shù),所有的館藏信息都能以數(shù)字化的形式存儲,做到圖、文、聲并茂,檔案信息的記錄功能與顯示功能得到了極大的強化;而且更有前景的是數(shù)字化后的檔案信息能隨心所欲地從一種媒介轉(zhuǎn)換到另一種媒介,給長期以來沉悶、形式單一的檔案信息貼上吸引人的“標(biāo)簽”。館藏信息的數(shù)字化是檔案館數(shù)字化建設(shè)的核心,其數(shù)字化建設(shè)的工程量巨大,各級檔案部門應(yīng)根據(jù)自身特點采取不同的建設(shè)模式:
1、大型綜合性檔案館,它們的館藏基礎(chǔ)一般都較好,館藏信息的利用也較頻繁,在建設(shè)經(jīng)費充足的情況下,可以采取技術(shù)優(yōu)先的原則,劃出專項經(jīng)費,成立館藏信息數(shù)字化部門,專門負(fù)責(zé)檔案信息數(shù)字化工作。這種模式見效快,但投入高,需要很強的經(jīng)濟(jì)支持和技術(shù)支持。
2、中小型綜合檔案館,在建設(shè)經(jīng)費不夠充足的情況下,可以采取資源優(yōu)先的原則,購置少量的設(shè)備,對重要的檔案資源先期進(jìn)行數(shù)字化處理,循序漸進(jìn)逐步擴大數(shù)字化規(guī)模。這種模式見效慢,投入較少,對技術(shù)要求也不高。館藏檔案信息經(jīng)數(shù)字化后轉(zhuǎn)化為數(shù)字信息,以數(shù)據(jù)庫的形式存在。
目前大部分檔案館館藏檔案載體仍然是以紙質(zhì)為主,紙質(zhì)檔案數(shù)字化制作方式一般有二種:第一種是通過計算機人工錄入或通過掃描儀掃描由字符識別軟件(OCR)識別,制成文本文件;第二種是將檔案文件的每一頁看成是一張圖片,不管上面具體是什么內(nèi)容,由掃描儀按頁掃入計算機制成圖形文件。第一種方式占據(jù)空間小,是一種真正意義上的全文數(shù)字化,但紙質(zhì)檔案信息的記錄方式是多種多樣的,有的是手寫體、繁體字,有的字跡褪化及非文字形式等,此時采用第一種方式就會暴露出如下致命弱點:用OCR字符識別的準(zhǔn)確率低;若采用人工錄入,不但需要大量的錄入人員,而且一時還不能馬上勝任此項工作,差錯率大且核對困難,投入大,收效慢。而第二種方式實現(xiàn)容易,一般檔案工作人員只要稍加培訓(xùn),即可操作機器,且工作可以定量化,差錯率相對較低,即便有一些錯掃、漏掃等,也能很快被發(fā)現(xiàn)。至于圖形文件占空間大的問題,在計算機技術(shù)日新月異的今天,相信適合的軟件很快就會被開發(fā)出來,如果能采用先進(jìn)的高速掃描機,那么對檔案信息數(shù)字化無疑是如虎添翼。另外,還因為圖像掃描保持了檔案原件本來面目,可以使利用者在看到文字內(nèi)容的同時,也能看到紙質(zhì)檔案的其它一些特征,如原件的紙色、墨跡、印章、圈點、批注等各種原貌,使利用者可以獲得更多的線索,開展一些更深入的研究。
(三)檔案信息傳輸平臺數(shù)字化。檔案信息只有在傳遞過程中才能體現(xiàn)出它應(yīng)有的價值,以往信息存在于一次文獻(xiàn)即檔案原件或經(jīng)過處理的二次文獻(xiàn)范疇內(nèi),人們需要檔案信息,往往需要親臨檔案館,通過閱覽摘錄、靜電復(fù)制或拍攝等形式來獲取需要的信息。但檔案信息在完成數(shù)字化后以數(shù)字形式存在時,數(shù)字網(wǎng)絡(luò)系統(tǒng)就將成為其主要的傳輸平臺,為檔案信息的快速流動提供可能。數(shù)字化了的檔案信息在傳遞過程中可以同時進(jìn)行多向傳遞,形成傳遞網(wǎng)絡(luò),而且通過因特網(wǎng)可以方便地進(jìn)行遠(yuǎn)程傳遞,不受時間與空間的限制,利用者不必親臨檔案館,就可以在任何時間任何地點通過計算機方便地利用檔案信息。
如果把檔案館數(shù)字化建設(shè)比作一個人體的話,那么檔案管理數(shù)字化和館藏信息數(shù)字化的建設(shè)就是這個人體的骨架和血肉,數(shù)字網(wǎng)絡(luò)系統(tǒng)就是它的神經(jīng)網(wǎng)絡(luò)。檔案館信息傳輸平臺應(yīng)首先構(gòu)建的是檔案館局域網(wǎng)也可稱為內(nèi)網(wǎng),一般的要求是在遵循統(tǒng)一的通信協(xié)議前提下,通過網(wǎng)絡(luò)連線將各個部門的計算機資源整合在一起。可根據(jù)不同的應(yīng)用設(shè)置服務(wù)器,部門的個體計算機通過網(wǎng)絡(luò)共享網(wǎng)絡(luò)信息資源,為檔案館核心數(shù)據(jù)庫提供檔案信息,也可以得到權(quán)限范圍內(nèi)的檔案信息。其次是構(gòu)建外網(wǎng)、公眾網(wǎng)等,可使檔案信息通過數(shù)字網(wǎng)絡(luò)系統(tǒng)進(jìn)入信息交流的大動脈----互聯(lián)網(wǎng),實現(xiàn)檔案資源的共享。
三、檔案館數(shù)字化建設(shè)需要注意的幾個方面
(一)建立標(biāo)準(zhǔn)化的規(guī)范體系。《中華人民共和國標(biāo)準(zhǔn)化管理條例》指出:“標(biāo)準(zhǔn)化是組織現(xiàn)代化生產(chǎn)的重要手段,是科學(xué)管理的重要組成部分,在社會主義建設(shè)中推行標(biāo)準(zhǔn)化,是國家的一項重要技術(shù)經(jīng)濟(jì)政策。”這充分闡明了標(biāo)準(zhǔn)化的地位和作用。現(xiàn)在各地的檔案館對數(shù)字化建設(shè)還都處在試驗和探索階段,采用的方式方法也不盡相同,因此在檔案館數(shù)字化建設(shè)中,標(biāo)準(zhǔn)化的規(guī)范體系的確立就顯得尤為重要,它是檔案館數(shù)字化建設(shè)高質(zhì)量的堅實基礎(chǔ)。如浙江省檔案局指出數(shù)據(jù)庫建設(shè)要本著保證質(zhì)量、規(guī)范標(biāo)準(zhǔn)的精神,并決定在2002年正式出臺統(tǒng)一的《浙江省綜合檔案館電子目錄數(shù)據(jù)庫結(jié)構(gòu)與交換格式》相關(guān)標(biāo)準(zhǔn),對全省各級檔案館現(xiàn)有的數(shù)據(jù)庫與軟件進(jìn)行修改、規(guī)范,提高數(shù)據(jù)質(zhì)量,完善軟件功能,特別是數(shù)據(jù)標(biāo)準(zhǔn)接口功能。在建立標(biāo)準(zhǔn)化的規(guī)范體系方面我們應(yīng)遵循以下原則:
1、以標(biāo)準(zhǔn)化管理為主,制度管理為輔。標(biāo)準(zhǔn)化適合于技術(shù)工作領(lǐng)域的規(guī)范化管理,可操作性強,而且與管理體制的關(guān)系較為超脫,因此在不與法律相沖突的情況下,標(biāo)準(zhǔn)化管理更有利于不同部門之間的協(xié)調(diào)。制度通常以法規(guī)形式出現(xiàn),特別是約束力強,但管理范圍有限,所以在標(biāo)準(zhǔn)化管理的基礎(chǔ)上,配合制度可以形成檔案館數(shù)字化工作所需的嚴(yán)密的規(guī)范化管理體系。
2、首先考慮采用國際標(biāo)準(zhǔn),其次才是國家、行業(yè)及地方標(biāo)準(zhǔn)。由于檔案信息的范圍和種類處于不斷擴展和變化之中,因此即使在檔案館數(shù)字化階段也應(yīng)優(yōu)先采用適用范圍盡可能廣泛的標(biāo)準(zhǔn),盡量做到一次到位。檔案館數(shù)字化建設(shè)中確定標(biāo)準(zhǔn)的原則是:面向計算機和網(wǎng)絡(luò)及信息平臺的處理,直接采用國際和國家標(biāo)準(zhǔn);面向綜合性信息的處理優(yōu)先采用國家標(biāo)準(zhǔn);面向檔案信息的處理以借鑒為主進(jìn)行補充,由此形成標(biāo)準(zhǔn)化的規(guī)范體系。
(二)建設(shè)高質(zhì)量的檔案信息數(shù)據(jù)庫。早在1992年就有學(xué)者指出檔案工作現(xiàn)代化的核心是建設(shè)高質(zhì)量的數(shù)據(jù)庫,這個認(rèn)識到今天仍然具有指導(dǎo)意義。現(xiàn)在我們檔案館數(shù)字化建設(shè)的核心依然是建設(shè)檔案信息數(shù)據(jù)庫,并通過網(wǎng)絡(luò)平臺進(jìn)行信息傳遞和信息交流。
檔案館計算機數(shù)據(jù)庫類型以檢索性數(shù)據(jù)庫和文件性數(shù)據(jù)庫兩種較為常見,檢索性數(shù)據(jù)庫主要用于揭示館藏內(nèi)容,介紹開放檔案的范圍、目錄和提供網(wǎng)上檢索途徑;文件性數(shù)據(jù)庫,主要用于完整地載入檔案文件,使人們可以通過網(wǎng)絡(luò)獲得檔案信息。檔案信息數(shù)字化后以數(shù)據(jù)形式集合成數(shù)據(jù)庫,檔案信息組織形式就發(fā)生了本質(zhì)上的變化,從原先紙張上順序的、線形的方式轉(zhuǎn)變?yōu)橛嬎銠C的直接的、網(wǎng)狀的方式,索引文件、超文本技術(shù)可以使信息按本身的邏輯關(guān)系組織成相互聯(lián)系的網(wǎng)狀結(jié)構(gòu),依賴先進(jìn)的智能化信息管理技術(shù),以人工語言或自然語言進(jìn)行搜索,為用戶提供方便、高效的服務(wù)。一個高質(zhì)量的數(shù)據(jù)庫中的數(shù)字信息要達(dá)到以下質(zhì)量標(biāo)準(zhǔn):第一、數(shù)據(jù)的準(zhǔn)確性;第二、數(shù)據(jù)項目和內(nèi)容的完整性;第三、數(shù)據(jù)的規(guī)范性;第四、數(shù)據(jù)的穩(wěn)定性。
(三)檔案信息安全問題。安全是檔案館數(shù)字化建設(shè)不可忽視的一個重要方面。檔案館與圖書館最根本的不同在于圖書信息基本上是面對普通公眾,而檔案信息則對安全保密有嚴(yán)格的要求,有相當(dāng)一部分檔案信息是需要控制使用的,所以檔案館數(shù)字化建設(shè)中必須采取一系列措施保證檔案信息的保密和安全。通常采取的措施可以分為制度管理和技術(shù)保證兩類,檔案館在數(shù)字化建設(shè)中對此應(yīng)該形成一套管理制度體系,此外還需要有相應(yīng)的技術(shù)措施進(jìn)行自動控制,才能做到更加嚴(yán)密。如中國第二歷史檔案館在進(jìn)行民國檔案數(shù)字化建設(shè)的探索時就十分重視數(shù)據(jù)的安全問題。他們認(rèn)為在黑客猖獗和網(wǎng)絡(luò)安全保護(hù)手段不健全的情況下,為了確保檔案信息的保密和安全,可以有計劃、有步驟、分階段地進(jìn)行數(shù)字化民國檔案網(wǎng)絡(luò)化服務(wù)。他們首先對已有的檔案信息系統(tǒng)進(jìn)行改進(jìn)分化,對館內(nèi)不同用戶根據(jù)權(quán)限提供全文檔案信息,使館藏信息首先在館內(nèi)達(dá)到資源共享。當(dāng)館內(nèi)數(shù)據(jù)庫接入Internet網(wǎng)時,除盡最大可能保證網(wǎng)絡(luò)安全外,將那些有機密性的、不開放的檔案不存放在網(wǎng)絡(luò)服務(wù)器上。在當(dāng)前的技術(shù)條件下,為了解決檔案信息的安全問題,也可以使用Intranet技術(shù),提供授權(quán)的檔案信息服務(wù)。
(四)加快相關(guān)人才的培養(yǎng)和使用。人才問題是關(guān)系到檔案館數(shù)字化建設(shè)成敗的另一關(guān)鍵。檔案館數(shù)字化建設(shè)的過程是與新知識、新技術(shù)的普及密不可分的,所以各類相關(guān)人才的引進(jìn)和培養(yǎng)必須引起高度的重視。檔案館數(shù)字化建設(shè)過程中必須考慮培養(yǎng)的人員有以下幾類:系統(tǒng)開發(fā)與維護(hù)、數(shù)字化加工與管理、標(biāo)準(zhǔn)化建設(shè)、數(shù)據(jù)庫運行管理等。
目前我國的檔案專業(yè)教育,無論是高等教育,還是各種專業(yè)知識培訓(xùn),都顯得知識陳舊,內(nèi)容更新慢,缺乏計算機技術(shù)與檔案及檔案工作關(guān)系的內(nèi)容,其結(jié)果也就使得檔案界嚴(yán)重缺乏既具有檔案專業(yè)知識又具有計算機等相關(guān)知識的復(fù)合性人才,阻礙了計算機等現(xiàn)代化技術(shù)在檔案事業(yè)上的運用。對此,檔案教育界必須引起高度重視,奮起直追,加大培訓(xùn)力度。
同時檔案館也必須重視對在職人員的培訓(xùn)工作,重視引進(jìn)相關(guān)的專業(yè)人才,以適應(yīng)檔案館數(shù)字化建設(shè)的需要。在相關(guān)的崗位培訓(xùn)及人才引進(jìn)時應(yīng)該遵守以下原則:
1、做到有提前量,使有關(guān)人員對新技術(shù)新設(shè)備提前了解。
2、針對不同對象分層次培養(yǎng),要求知識技能與崗位相適應(yīng)。
3、充分依靠社會支持,引進(jìn)人才但不浪費人才,做到人員結(jié)構(gòu)合理。
以上是我們對檔案館數(shù)字化建設(shè)的一些淺見。現(xiàn)在各地檔案部門都很重視這方面的信息,有些單位已將此擺上了議事日程,但相對于圖書館部門,檔案部門的動作已經(jīng)滯后。中國數(shù)字圖書館工程現(xiàn)已進(jìn)入了實質(zhì)性操作階段,其在數(shù)字圖書館的總體結(jié)構(gòu)、標(biāo)準(zhǔn)規(guī)范、技術(shù)線路等方面已經(jīng)積累了相當(dāng)?shù)慕?jīng)驗。1999年3月成立的“國家圖書館文獻(xiàn)數(shù)字化中心”年生產(chǎn)規(guī)模已經(jīng)達(dá)到5000萬至6000萬頁全文影像數(shù)據(jù),它的網(wǎng)絡(luò)可以提供1000G存儲量的網(wǎng)上信息服務(wù)。檔案館如果還不重視檔案館的數(shù)字化建設(shè),不能在網(wǎng)絡(luò)上有效地傳遞檔案信息,就無法融入信息時代的快車道,最終將被信息社會淘汰。因此,為適應(yīng)社會發(fā)展的需要,檔案館數(shù)字化建設(shè)不僅僅是一項具有前瞻性的舉措,它還具有更深刻的戰(zhàn)略意義。
第二篇:檔案館數(shù)字化管理解決方案(定稿)
中晶檔案館電子化管理解決方案
檔案館是收集、保管檔案的機構(gòu),負(fù)責(zé)接收、征集、管理檔案和開展檔案利用等。檔案館的資料可分為紙質(zhì)檔案、照片檔案、錄音檔案、錄像檔案、實物等。由于檔案館是存放重要信息和有歷史或存儲價值信息的機構(gòu),且其保管的資料量十分龐大,故將其保管的檔案資料安全電子化就顯得尤為重要。而檔案電子化的基本原則是使檔案信息資源準(zhǔn)確方便快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會對檔案利用的需求。
傳統(tǒng)人工管理流程存在的弊端:
檔案館檔案掃描除了對高品質(zhì)、高效率的需求外,信息管理也非常重要。由于資料掃描量巨大,傳統(tǒng)方案在掃描后需要人工進(jìn)行管理,所以經(jīng)常會出現(xiàn)信息錯亂的現(xiàn)象,需要花費大量的時間在整個檔案庫中尋找遺漏的信息,費時費力。
檔案館日常業(yè)務(wù)需求: ● 紙質(zhì)檔案錄入:
√ 高速掃描,將各種紙質(zhì)檔案等轉(zhuǎn)換成電子檔案
√ 高精度的彩色圖片檔案掃描
√ 可承受批量性連續(xù)掃描
√ 操作便捷,穩(wěn)定耐用
√ 重張檢測,不能漏掃 ● 電子檔案預(yù)處理:
√ 影像清晰,便于識別
√ 識別條碼對文件進(jìn)行自動分類
√ 紙質(zhì)檔案和電子錄像檔案關(guān)聯(lián),比對審閱
√ 不同資料按需分類,歸整管理 ● 檔案管理:
√ 資料在線審核 √ 分權(quán)限進(jìn)行檔案管理 √ 多平臺檔案查閱 √ 檔案安全管理 √ 檔案備份
中晶檔案館電子化管理解決方案
● 檔案館電子化管理系統(tǒng),對于已有的各種載體形式的檔案采用數(shù)字化處理技術(shù)進(jìn)行加工處理,以實現(xiàn)不同載體形式檔案的數(shù)字化管理和檔案信息資源的數(shù)字化共享。● 由于實施了電子化管理,電子檔案存放占用的空間比紙質(zhì)檔案存放占用的空間大幅地減少,并能有效避免資料重復(fù)提交。同時,在網(wǎng)絡(luò)環(huán)境下,檔案館電子化管理系統(tǒng)將紙質(zhì)檔案和電子錄像檔案緊密關(guān)聯(lián)起來。通過掃描方式生成電子檔案,經(jīng)過分級授權(quán),不同部門的檔案館人員可在線查閱相關(guān)等級的檔案信息,縮短檔案信息傳遞時間,提高工作效率。● 利用檔案編號對每份檔案進(jìn)行唯一標(biāo)識,讓每個檔案都擁有一個屬于自己的文檔,實現(xiàn)快速編輯、管理、索引的功能。通過掃描端進(jìn)行自動識別分類,自動完成同個檔案編號下全部檔案資料分類的綁定,減少了人工干預(yù)。并強化其他上傳通道,保證檔案資源的電子數(shù)據(jù)與錄音檔案、錄像檔案等的結(jié)合,有效地確保檔案原件和數(shù)字化檔案信息的一致性。● 采用軟件自動校對的方式,對目錄數(shù)據(jù)庫的建庫質(zhì)量進(jìn)行檢查。核對著錄項目是否完整、著錄內(nèi)容是否規(guī)范、準(zhǔn)確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進(jìn)行修改或重錄。
● 同時,檔案館電子化管理系統(tǒng)也同步加強了紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密管理機制,有效地確保檔案原件和數(shù)字化檔案信息的安全性。本系統(tǒng)針對紙質(zhì)檔案數(shù)字化的各個環(huán)節(jié)均進(jìn)行詳細(xì)的登記,并及時整理、匯總,裝訂成冊,在數(shù)字化工作完成的同時建立起完整、規(guī)范的記錄索引。
中晶檔案館電子化管理解決方案優(yōu)勢
標(biāo)準(zhǔn)的掃描設(shè)備,高效快捷、耐用穩(wěn)定、精準(zhǔn)呈現(xiàn):
√ 快速連續(xù)掃描:可將紙質(zhì)較好的A4紙質(zhì)檔案資料通過批量性快速掃描轉(zhuǎn)化成電子化檔案資料,既節(jié)省掃描等待時間,又便于已掃檔案的整理歸檔,徹底提高工作效率。
√ 完美精確掃描:可將畫冊、照片等紙質(zhì)較厚的檔案資料通過平板掃描的方式轉(zhuǎn)化成電子化檔案資料,有效地保證原檔案資料的高精度信息。
√ 一次采購,多年使用:維護(hù)保養(yǎng)操作簡單,維護(hù)成本低,堅固耐用,達(dá)成長時間的日常使用需求。
完美的影像采集及識別技術(shù),讓影像更清晰、美觀
√ 支援自動節(jié)選糾偏、背景平滑、黑邊補白、二值化、去污漬、去裝訂孔、亮度對比度等影像調(diào)整功能,確保掃描影像接近原稿甚至優(yōu)于原稿。
√ 支持刪除空白頁、智能拆頁、空白頁分割、指定掃描頁數(shù)、折疊掃描、插入掃描、導(dǎo)入頁面等更多人性化功能,讓掃描不再是枯燥的作業(yè)。
√ 支持重張檢測功能可有效減少檔案信息遺漏,有助于提升檔案信息的完整性。
√ 支持PDF文檔加密,把自動歸檔后的檔案進(jìn)行加密,可有效的防止信息的泄漏。
智能人性化檔案歸整功能,為管理服務(wù)
對于已掃描的影像,可以做當(dāng)前掃描批次的排序、替換、追加、刪減、二值化、裁剪影像、亮度對比度的調(diào)整,確認(rèn)調(diào)整完畢后再行上傳。
第三篇:檔案館檔案數(shù)字化和信息化工作制度
檔案館檔案數(shù)字化和信息化工作制度
為確保國家秘密安全,促進(jìn)檔案信息化工作健康發(fā)展,杜絕檔案數(shù)字化和檔案信息化過程中的失泄密隱患,加強檔案整理和數(shù)字化管理工作,現(xiàn)結(jié)合本館實際特制定如下制度:
第一條
標(biāo)有密級且未經(jīng)解密的涉密檔案,不得數(shù)字化和信息化。
第二條
對聘用工作人員的家庭背景情況進(jìn)行審核,工作人員戶籍必須為中國大陸公民。
第三條
與數(shù)字化和信息化工作人員簽訂安全保密協(xié)議,規(guī)定其不得下載、留存、持有和使用任何檔案信息,違者承擔(dān)法律責(zé)任并予嚴(yán)厲經(jīng)濟(jì)處罰。
第四條
所有數(shù)字化和信息化工作必須在我館自備檔案數(shù)字化場地進(jìn)行,所有數(shù)字化設(shè)備和軟件須進(jìn)行安全保密技術(shù)檢測,有安全保密隱患的一律不得使用。數(shù)字化工作中使用的軟件必須是正版軟件。對工作中使用到的計算機的輸出接口采用物理和軟件的方式進(jìn)行屏蔽處理,防止數(shù)據(jù)外拷,計算機局域網(wǎng)與互聯(lián)網(wǎng)等外網(wǎng)物理隔離,加工數(shù)據(jù)由專人負(fù)責(zé)管理,其他人員未經(jīng)授權(quán)無權(quán)訪問。
第五條
數(shù)字化場地必須安裝視頻監(jiān)控設(shè)備,做到凡是有檔案實體的地方都有視頻監(jiān)控。視頻監(jiān)控錄像由專人保管,無關(guān)人員不得使用。
第六條
明確本館負(fù)責(zé)檔案數(shù)字化和信息化安全管理工作的分管領(lǐng)導(dǎo),落實責(zé)任科室和人員,責(zé)任人員定期對所有數(shù)字化設(shè)備和軟件進(jìn)行保密技術(shù)檢測。建立安全值班制度,每天定時由責(zé)任人員對工作現(xiàn)場進(jìn)行監(jiān)督,及時解決工作中出現(xiàn)的問題,消除安全隱患。
第七條
禁止非本項目人員進(jìn)入數(shù)字化場地,如因特殊情況需向局(館)分管領(lǐng)導(dǎo)報告,獲得批準(zhǔn)后方能進(jìn)入。
第八條
嚴(yán)禁在工作室進(jìn)行任何形式的有線或無線互聯(lián)網(wǎng)連接,嚴(yán)禁采取手抄、拍攝、復(fù)印、打印、發(fā)短信或電子郵件等手段復(fù)制或摘錄檔案內(nèi)容外傳。
第九條
不得在工作室私自使用計算機、打印機、掃描儀、復(fù)印機、通信工具、攝錄器材等設(shè)備;禁止使用外來的磁盤、U盤、MP3或光盤等存儲載體。
第十條
工作人員上班時按規(guī)定穿工作服,禁止攜帶任何食物、流質(zhì)等進(jìn)入工作間;禁止喧嘩、聊天、隨意走動等與工作無關(guān)的事情;禁止私自亂拆、亂放、亂換辦公設(shè)備,禁止私自改變計算機的硬件、軟件程序;禁止攜帶易燃、易爆、有毒、有害等物品進(jìn)入工作間。
第十一條
工作人員下班后必須迅速離開,禁止將辦公物品、紙張等帶出工作間外。
第十二條
工作人員每天下班后做好數(shù)字化場地環(huán)境保潔,負(fù)責(zé)檢查燈、電腦及空調(diào)的電源關(guān)閉情況,并將門窗關(guān)好,注意防火防盜,做好安全防范工作。
第十三條
數(shù)字化整理過程中所產(chǎn)生的廢紙必須存放在指定地點,每星期集中清理一次。清理時需安排專人對廢棄紙張進(jìn)行檢查,確保其中沒有夾帶任何檔案文件方能清出工作場地。
第十四條
檔案數(shù)字化任務(wù)完成后,必須清除設(shè)備中的所有信息并作安全技術(shù)處理。
第四篇:綜合性檔案館館藏檔案數(shù)字化鑒定探討
【正文】
近年來,隨著信息技術(shù)的廣泛應(yīng)用,一些檔案館開始實施數(shù)字檔案館計劃,或開始對部分館藏檔案進(jìn)行數(shù)字化處理,以便為今后實現(xiàn)檔案全文信息絡(luò)化查閱作準(zhǔn)備,但館藏數(shù)量較大的單位很快都遇到了一個棘手問題:挑選什么檔案進(jìn)行數(shù)字化?在確定將某一全宗檔案進(jìn)行數(shù)字化時,又面臨是否將所有檔案部進(jìn)行數(shù)字化的難題?在對館藏檔案進(jìn)行數(shù)字化時,面對著龐雜紛繁甚至“魚龍混雜”的檔案,大家不約而同地感覺到面臨一個新的課題:檔案在進(jìn)行數(shù)字化前的鑒定。當(dāng)今之際,檔案數(shù)字化,雖同高科技、高投入相伴隨,但一旦形成共識,擺上日程,其經(jīng)費和設(shè)備等問題似不難解決,然數(shù)字化鑒定,卻不那么容易,它政策性強,又是勞動和知識密集型工作,至今尚缺乏明確的指導(dǎo)理念,弄得不好即成為數(shù)字化的“瓶頸”,拖了檔案數(shù)字化進(jìn)程的后腿。因此,從某種意義上來說,檔案數(shù)字化鑒定能否順利開展,關(guān)系到檔案數(shù)字化的進(jìn)程,并最終影響檔案信息社會化的實現(xiàn)。現(xiàn)筆者根據(jù)近來對此問題的研究和思考。提出一些管見,與檔案界同行探討。
一、數(shù)字化鑒定的目的館藏檔案數(shù)字化,是近年來隨著信息技術(shù)的飛速發(fā)展,檔案界為實現(xiàn)檔案數(shù)字化管理和建立數(shù)字檔案館而提出,主要在館藏檔案數(shù)量具有一定規(guī)模,其檔案利用具有較大發(fā)展空間,物質(zhì)基礎(chǔ)和技術(shù)條件又較好的省、市一級國家綜合檔案館,以及一些發(fā)達(dá)地區(qū)區(qū)、縣一級檔案館進(jìn)行。這是一部分國家綜合性檔案館順應(yīng)社會信息化的發(fā)展趨勢,在實行檔案資源信息化過程中采取的一項有力措施,其意義十分深遠(yuǎn),它不僅能使通過計算機終端查閱檔案全文成為現(xiàn)實,也將使檔案館在不久的將來通過現(xiàn)代計算機絡(luò)向不同層次的和利用者提供遠(yuǎn)程檔案信息查閱服務(wù)成為可能,由此根本性地改變傳統(tǒng)的檔案查閱方式,為檔案信息資源廣泛方便地為社會所用開辟一個十分廣闊的空間。由于數(shù)字化檔案從實體檔案經(jīng)過數(shù)字化處理到能夠以數(shù)字方式提供利用,特別是遠(yuǎn)程利用,其中包含較高的制作和運營成本,因此要求提供利用的數(shù)字化檔案具有相當(dāng)?shù)摹百|(zhì)量”,也就是說被提供的數(shù)字化檔案不能停留在原始和粗框狀態(tài)。為了解決提供利用的數(shù)字化檔案的“質(zhì)量”問題,檔案在進(jìn)行數(shù)字化之前需要進(jìn)行鑒定的問題很自然地被提上議事日程。與此同時,公開和通過絡(luò)遠(yuǎn)程提供利用的數(shù)字化檔案,要求其內(nèi)容必須是適合向社會公開的,因此在檔案進(jìn)行數(shù)字化前進(jìn)行劃控鑒定也是必然之題(已經(jīng)經(jīng)過開放鑒定的例外)。一般來說,國家綜合檔案館館藏檔案的基礎(chǔ)狀況,包括每個全宗內(nèi)檔案構(gòu)成的合理程度,每個案卷的組合質(zhì)量,參差不齊,有一部分檔案組卷質(zhì)量很高,十分精練簡潔,卷內(nèi)每份文件都具有實質(zhì)性內(nèi)容,很說明問題,如果從中剔除任何一份文件,都會感到整個案卷會產(chǎn)生缺陷,對于具有這樣質(zhì)量的檔案,除了是否適合向社會開放的因素需要考慮外,顯然對其進(jìn)行數(shù)字化是無需再進(jìn)行鑒定的,但實際上在館藏檔案中能夠達(dá)到這種標(biāo)準(zhǔn)的檔案很少,特別是上個世紀(jì)70年代以前形成的檔案,由于歷史的原因,這些檔案的基礎(chǔ)狀況多數(shù)很不理想,常常是“魚龍混雜”,有價值的文件和毫無價值的文件夾雜在一起,對于這樣的檔案進(jìn)行數(shù)字化,必須在事前進(jìn)行鑒定,通過鑒定,剔除那些無關(guān)緊要或毫無價值的文件,留下反映歷史過程本質(zhì)的材料,從而使數(shù)字化的檔案是“貨真價實”,真正具有參考和研究價值,能夠派用處的檔案,從數(shù)字化檔案主要著眼于提供“精品”檔案的要求出發(fā),檔案在數(shù)字化之前進(jìn)行的鑒定有別于傳統(tǒng)的檔案價值鑒定。也不是單純?yōu)榱私鉀Q開放而進(jìn)行的開放與否的劃控鑒定,它是一種綜合性鑒定,既包含對開放鑒定做拾遺補缺的工作,更承擔(dān)著“去粗取精”、存真留實的責(zé)任,其目的就是通過鑒定,提供組合精練、內(nèi)容充實、沒有“水分”的原始檔案進(jìn)行數(shù)字化,從而保證了對檔案進(jìn)行數(shù)字化處理的高投入能夠得到高效率的應(yīng)用。
二、數(shù)字化鑒定的原則
為了確保能夠?qū)⑷萘棵芗⒒A(chǔ)狀況良好、組合科學(xué)的館藏檔案進(jìn)行數(shù)字化,必須對館藏原始檔案進(jìn)行鑒定,在此基礎(chǔ)上篩選出可以和應(yīng)該進(jìn)行數(shù)字化的檔案,根據(jù)目前已經(jīng)開展的數(shù)字化鑒定的實踐,一般而言,在具體進(jìn)行檔案數(shù)字化鑒定時應(yīng)該遵循以下幾個原則:
1.精煉原則 數(shù)字化檔案從檔案的原始狀態(tài)到能夠遠(yuǎn)程提供查閱的數(shù)碼狀態(tài),期間要經(jīng)過數(shù)字化掃描、數(shù)據(jù)存儲整理和相應(yīng)檢索關(guān)系的建立等一系列工作,需要一定的人力物力投入和技術(shù)支撐,在此情況下,為了使這些工作更具有價值和體現(xiàn)效益,要求提供數(shù)字化的檔案必須有比較密集的容量,精煉原則即從這一目標(biāo)出發(fā),要求鑒定人員在進(jìn)行鑒定時貫徹精煉思想,剔除重復(fù)件和無價值的文件,擠掉案卷的水分,特別是對于那些原來臃腫龐雜的案卷,更要舍得下狠心,剔除那些無關(guān)緊要和可有可無的文件,使經(jīng)過鑒定后的檔案組合非常精煉,最集中地反映歷史活動的真貌。從擠掉案卷的水分來說,剔除某些正本文件的草稿、修改稿等是最為典型的例子。當(dāng)然如果從深層次的專題研究需要出發(fā),某些利用者會認(rèn)為一個文本的草稿、修改稿、打印稿和正式頒發(fā)稿雖然主體內(nèi)容相同,但在細(xì)節(jié)上存在差異,因而都具有重要的價值,因為它們從不同的側(cè)面記錄和反映了某份文件的最后形成過程。我們并不完全否認(rèn)這樣的看法,但是認(rèn)為在通常的檔案利用群體中,像這樣很專業(yè)的利用者畢竟是少數(shù),如果都按照這樣的要求來進(jìn)行數(shù)字化,則數(shù)字化檔案的數(shù)據(jù)庫容量將因此擴大幾倍,其制作和運營成本也相應(yīng)提高,而在大多數(shù)情況下,僅僅利用正本即能滿足利用者的需要,因為文件的正本反映了最基本最主要的歷史狀況。從進(jìn)行數(shù)字化投入產(chǎn)出的策略考慮,我們顯然不能為了個別利用者的特別需求而作幾倍的投入,何況原始實體檔案依然存在,如果確有需要,利用者還可以專門查閱原始實體檔案,以解決其特殊的問題。由此可見,精煉原則主要是從減少數(shù)字化成本出發(fā),同時也是從絕大多數(shù)利用者的利用需求出發(fā),并不包括滿足個別利用者的特殊需求,2.存史原則 提出和要求貫徹精煉原則,其目的是為了使經(jīng)過數(shù)字化的檔案消除臃腫,去除水分,構(gòu)成精煉,而并非為了單純地達(dá)到精煉而將一些有價值的文件也拋棄,為此提出存史原則。這一原則的含義,可以理解為剔除文件時應(yīng)以是否違背存史作衡量,也就是說,當(dāng)如果剔除某份文件,是在剔除某種重要的歷史記錄,從而使某一重要歷史情況或細(xì)節(jié)由此消失,那么對這種剔除必須作慎重考慮。我們在數(shù)字化鑒定的實踐中遇到過這樣的情況:在鑒定某一市級機關(guān)檔案時,有人將區(qū)級機關(guān)上報的區(qū)情甚至基層情況的文件認(rèn)為是“水分”,主張將其剔除,其理由一是此類文件在相應(yīng)的區(qū)級機關(guān)的檔案中會有保存,二是區(qū)情乃至基層情況不屬于市級機關(guān)檔案應(yīng)反映的重點。但是按照存史原則,上述文件恰恰十分真實地記錄和反映了當(dāng)時特定背景下基層所發(fā)生的一段生動的歷史,對于利用者直接了解這一歷史時期的相關(guān)歷史是很重要的材料,盡管此類文件在區(qū)級機關(guān)的檔案里很可能也保存著。存史原則要求在進(jìn)行數(shù)字化鑒定時不能一味地為精煉而精煉,還必須謹(jǐn)慎考慮不能將那些記錄和反映生動的歷史過程和歷史真實的文件作為“水分”擠掉,從某種意義上說,存史原則也是對精煉原則的制約,貫徹存史原則能夠防止因貫徹精煉原則的過頭而把那些確實反映歷史真實的文件也精煉掉。
3.利用優(yōu)先原則 這一原則在很大程度上適用于數(shù)
字化鑒定的組織實施工作,但其核心思想也適用于數(shù)字化鑒定的具體操作。所謂“利用優(yōu)先”,即將利用者的要求和想法放在首位,用通常的話來說,就是“急利用者所急,想利用者所想”,在進(jìn)行數(shù)字化鑒定時,也必須貫徹這一原則。數(shù)字化鑒定,從某種意義上說,是按照一定的原則和要求,對原始檔案進(jìn)行一番篩選,利用優(yōu)先原則要求在進(jìn)行這種篩選時必須從利用者出發(fā),充分考慮利用者的需要,也就是說,應(yīng)該設(shè)身處地地從利用者角度出發(fā)。來進(jìn)行這種篩選,保留對利用者切實有用的文件,剔除對利用者無用的文件,按照這樣的要求,由數(shù)字化鑒定進(jìn)行的篩選,其結(jié)果既減少了投入,降低了成本,同時絲毫不會損害利用者的利益,反而因為提供了濃縮的檔案而節(jié)省了利用者的查閱時間,當(dāng)然這里所說的利用者利益,是普通的和一般的利益,并不包括個別的特殊的要求。由于檔案實現(xiàn)數(shù)字化所需要的巨大投入,決定了其考慮能夠滿足的利用者的需求只能是普遍的和一般的。
以上三項原則,可以說是三位一體,密不可分,即在貫徹精煉原則時不可不兼顧存史原則和利用優(yōu)先原則,而在貫徹存史原則時也不能舍棄精煉原則,在考慮利用優(yōu)先原則時當(dāng)然也不能違背精煉原則。在數(shù)字化鑒定的實際操作中,只有對此三項原則作通盤考慮和綜合應(yīng)用,才能確保數(shù)字化鑒定具有相當(dāng)?shù)馁|(zhì)量,達(dá)到預(yù)期的效果。反之,則可能顧此失彼,或重精煉而忽視存史,或重存史重利用優(yōu)先而達(dá)不到精煉的結(jié)果。
三、數(shù)字化鑒定工作的策劃和組織
由于館藏檔案數(shù)字化鑒定是一項新的業(yè)務(wù),技術(shù)要求高,難度大,又缺乏實踐經(jīng)驗,除了上述鑒定原則的切實貫徹,其策劃和組織工作十分重要,在某種程度上,科學(xué)策劃和周全組織,是保證數(shù)字化鑒定能夠按照預(yù)定的目標(biāo)進(jìn)行并取得成效的關(guān)鍵。
1.數(shù)字化鑒定工作的策劃 數(shù)字化鑒定工作的策劃主要包括對首選擬進(jìn)行數(shù)字化檔案的考慮和確定、擬進(jìn)行數(shù)字化鑒定檔案基礎(chǔ)狀況的調(diào)查、鑒定重點的把握等方面。由于檔案數(shù)字化進(jìn)度按頁計算,一個綜合性檔案館在館藏檔案數(shù)字化方面要達(dá)到規(guī)模效應(yīng).哪怕是占館藏檔案的10%或20%,都需要經(jīng)歷一個復(fù)雜而漫長的過程,因此在實施館藏檔案數(shù)字化時必須在對館藏檔案進(jìn)行調(diào)查的基礎(chǔ)上制訂出數(shù)字化計劃,挑選出急需進(jìn)行數(shù)字化的全宗。
第五篇:浙江省檔案館數(shù)字化加工驗收辦法
浙江省檔案館數(shù)字化加工驗收辦法
一、總則
檔案掃描后形成影像數(shù)據(jù)及檔案條目、全文數(shù)據(jù)的質(zhì)量檢查,采用人工校對的方式,對數(shù)據(jù)質(zhì)量進(jìn)行檢查。核對圖像是否按照《紙質(zhì)檔案前處理工作流程單》、《縮微檔案前處理工作流程單》進(jìn)行掃描,掃描頁碼是否完整、是否有漏掃;圖像是否去污、糾偏;圖像與目錄的掛接是否準(zhǔn)確;條目數(shù)據(jù)是否符合著錄格式等,數(shù)據(jù)質(zhì)量達(dá)不到標(biāo)準(zhǔn)要求的,應(yīng)退回加工部門要求進(jìn)行修改或重錄。
二、條目數(shù)據(jù)
1、視檔案及其條目數(shù)量的具體情況,以抽檢的方式,以全宗內(nèi)的目錄為單元進(jìn)行檢查驗收。
2、在一個單元內(nèi)隨機抽查5%的數(shù)據(jù),對條目數(shù)量及其著錄項目內(nèi)容的準(zhǔn)確性對照檔案實體或前處理工作單,進(jìn)行逐條檢查。
3、核對的文件目錄主要有檔號、題名、責(zé)任者、時間、文號。
4、根據(jù)上述標(biāo)準(zhǔn)進(jìn)行嚴(yán)格檢查,其中,檔號(數(shù)據(jù)編號)、選擇掃描的頁碼、與電子目錄的張頁號是否一致的準(zhǔn)確率要求達(dá)到100%,如發(fā)現(xiàn)一條錯誤,全部數(shù)據(jù)退回重檢。其他數(shù)據(jù)項允許差錯率控制在5%以內(nèi)。
5、其他項目抽檢合格率達(dá)到95%以上(含95%)時,予以驗收通過。如合格率在95%以下,要求錄入方對此單元內(nèi)所有條目進(jìn)行逐條對照核對,同時停止檔案發(fā)放,我方不提供錯誤數(shù)據(jù)。合格率=抽檢合格文件數(shù)/抽檢文件總數(shù)×100%
6、對檢查情況認(rèn)真填寫《檔案數(shù)字化質(zhì)量檢驗工作單》。
三、圖像數(shù)據(jù)
1、視圖像數(shù)量的具體情況,以抽檢的方式,對該全宗內(nèi)的圖像進(jìn)行檢查驗收。
2、在一個單元內(nèi)視數(shù)量情況,隨機抽查5%的圖像數(shù)據(jù),對圖像數(shù)量及其圖像內(nèi)容的準(zhǔn)確性對照檔案(照片)實體或前處理工作單,進(jìn)行逐條檢查。
3、圖像應(yīng)按規(guī)定的分辨率進(jìn)行掃描,并以TIFF格式保存。圖像色彩應(yīng)符合規(guī)定要求。
4、對圖像偏斜度、去污、失真度、圖像方向等進(jìn)行檢查。圖像傾斜度小于3度;圖像方向端正(A3圖像應(yīng)旋轉(zhuǎn)后保存),以符合閱讀習(xí)慣。
5、圖像黑邊裁剪內(nèi)邊,居中保存。圖像拼接后,原分散圖像不保存。
6、文件夾的命名必須與條目檔號(數(shù)據(jù)編號)相一致,準(zhǔn)確率100%;掃描圖像完整性(具體參照第7條)要求100%正確。以上二項項目如發(fā)現(xiàn)一條錯誤,退回重檢,我方不提供錯誤數(shù)據(jù)。其他數(shù)據(jù)項允許差錯率控制在5%以內(nèi)。
7、圖像完整性:不準(zhǔn)缺頁、漏頁。由于操作不當(dāng),造成掃描的圖像無法清晰識別或文件不完整、有小字條遮蓋等,造成信息丟失,均視為廢頁,要求重掃。大幅面圖像掃描后的拼接處理,以不遺失檔案內(nèi)容為準(zhǔn)則,確保圖像的整體性,拼接后的畫幅應(yīng)基本無痕跡。
8、圖像排序要求:掃描圖像的排列順序與檔案原件排序要求一致,對于原件排序錯誤,掃描中作出正確的調(diào)整,應(yīng)在處理單上注明,否則作排序錯誤處理,退回調(diào)整。
9、其他項目抽檢合格率達(dá)到95%以上(含95%)時,予以驗收通過。如合格率在95%以下,要求錄入方對此單元內(nèi)所有圖像進(jìn)行逐條對照核對,同時停止圖片檔案發(fā)放。合格率=抽檢合格文件數(shù)/抽檢文件總數(shù)×100%。
四、全文數(shù)據(jù)
全文錄入以掃描或直接錄入為主。需要掃描后識別的全文,分辨率必須大于300dpi,掃描識別軟件必須是“清華紫光”、“尚書等先進(jìn)的文字識別軟件。全文數(shù)據(jù)庫的抽檢率為5%,合格率為95%。如識別后文字用于后臺檢索用,合格率為90%。文字識別后以TXT格式保存,并進(jìn)行粗校對。
五、檔案整理
檔案整理:掃描之前,應(yīng)在保護(hù)檔案不受損害的前提下,拆除裝訂物(資料及檔案內(nèi)的成冊材料不能拆),按浙江省檔案館所提供的《紙質(zhì)檔案前處理工作流程單》的要求區(qū)分 掃描件和非掃描件,并對折皺不平影響掃描質(zhì)量的原件先進(jìn)行相應(yīng)處理(壓平或熨平等);掃描完成后,拆除過裝訂物的檔案應(yīng)按原檔案保管單位重新裝訂,并保持每頁檔案原有的排列順序不變,案卷不掉頁、右邊和底邊整齊。所有的檔案卷內(nèi)目錄均進(jìn)行打印,并裝訂到案卷最前面。卷皮破損嚴(yán)重的,需要調(diào)換卷皮,并按原卷皮上內(nèi)容,抄寫在新卷皮上。舊卷皮需全部交還檔案館。
檔案驗收:檔案實體驗收必須逐卷清點,按檔案數(shù)量、文件狀況、卷內(nèi)文件頁數(shù)與順序、裝訂要求等進(jìn)行檢查,如發(fā)現(xiàn)檔案丟失、損壞、圈劃或涂改等將追究法律責(zé)任;順序錯誤、裝訂不符要求、掉頁、卷間文件顛倒等作為差錯,合格率達(dá)到95%以上(含95%)予以驗收通過。
六、光盤刻錄
光盤刻錄前,由信息科技處進(jìn)行數(shù)據(jù)的技術(shù)檢驗,并出具檢驗報告。光盤必須確保在無病毒的條件下進(jìn)行刻錄。刻錄前必須先對每盤光盤質(zhì)量進(jìn)行檢驗,光盤自檢數(shù)據(jù)超過90%以上,此光盤才能刻錄數(shù)據(jù);數(shù)據(jù)刻錄后必須封口,制作成只讀光盤,不允許以后添加文件;光盤刻錄后必須進(jìn)行數(shù)據(jù)校驗。光盤品牌應(yīng)為優(yōu)質(zhì)產(chǎn)品,且在省檔案館認(rèn)可之下才能刻錄。
七、光盤移交與接收
檢驗合格后的光盤,按甲方提供的光盤號編號,同一案 卷和同一份文件,不得跨越二片DVD片號。光盤封面與封底需使用浙江省檔案局提供的專用頁面,并在相應(yīng)的頁面注明光盤內(nèi)數(shù)據(jù)的信息。光盤交接時必須出具光盤流程單。
光盤移交檔案館后,接收人員必須對每盤光盤進(jìn)行嚴(yán)格檢查。檢查內(nèi)容包括:光盤病毒的檢查;對光盤內(nèi)的文件夾進(jìn)行抽查,確保文件夾能打開;光盤刻錄后必須封口,確定光盤不能再添加數(shù)據(jù);最后檢查光盤的外觀,不能有劃痕、磨損等現(xiàn)象。
八、檢驗人員職責(zé)
1、質(zhì)檢人員必須由省館在職干部或聘任人員擔(dān)任。
2、質(zhì)檢人員必須做到堅持原則、認(rèn)真負(fù)責(zé)、秉公辦事、耐心細(xì)致。
3、質(zhì)檢時要嚴(yán)格按照前處理工作單和質(zhì)量標(biāo)準(zhǔn)進(jìn)行檢查。認(rèn)真詳細(xì)地填寫質(zhì)檢記錄,并簽名負(fù)責(zé)。
4、驗收必須嚴(yán)格登記,驗收人員簽名確認(rèn)。所有驗收單都需歸檔,同時作為省館發(fā)放檔案、接收數(shù)據(jù)和經(jīng)費結(jié)算的憑證。
質(zhì)量檢查工作程序
一、目錄數(shù)據(jù)質(zhì)檢
1、目錄排序:根據(jù)檔號(數(shù)據(jù)編號)進(jìn)行排序,確定檔號100%正確。
2、核對頁數(shù):掃描頁數(shù)是否符合《紙質(zhì)檔前處理工作流程單》注明的頁數(shù)。
3、目錄補錄:對照檔案實體與《檔案前處理目錄補錄單》,核查題名、責(zé)任者、時間、文號、張頁號等的正確性。
4、核查是否根據(jù)《紙質(zhì)檔案前處理工作流程單》、《縮微檔案前處理工作流程單》進(jìn)行全文OCR識別。
二、圖像數(shù)據(jù)質(zhì)檢
1、數(shù)據(jù)編號排序:根據(jù)數(shù)據(jù)編號進(jìn)行排序,確定數(shù)據(jù)編號100%正確。
2、圖像的完整性:包括缺頁、漏頁、不完整等,確定圖像100%完整。
3、根據(jù)《檔案數(shù)字化質(zhì)量檢驗工作單》對圖像的檢驗項目,逐項填寫。
三、縮微
1、數(shù)據(jù)編號排序:根據(jù)數(shù)據(jù)編號進(jìn)行排序,確定檔號100%正確。
2、圖像的完整性:包括缺頁、漏頁、不完整等,確定 圖像100%完整。
3、對照《縮微檔案前處理工作流程單》的要求,核查縮微號的正確性。
4、掃描頁數(shù)是否與《縮微檔案前處理工作流程單》相符,不需要掃描的頁數(shù)是否刪除。
5、補拍內(nèi)容是否插入正文;OCR有無識別。
6、其它項目按《縮微膠片掃描質(zhì)檢單》逐條填寫。
四、紙質(zhì)檔案驗收
1、以案卷為單位進(jìn)行清點,案卷應(yīng)如數(shù)收回,不許缺卷。
2、檢查案卷裝訂整齊,案卷內(nèi)文件是否完整、準(zhǔn)確;核查文件是否漏頁、倒裝、破損、順序錯誤、脫頁等情況。
3、雙方簽字確認(rèn)。
附:《檔案數(shù)字化質(zhì)量檢驗工作單》
《目 錄 補 錄 檢 驗 單》
2006年5月25日