第一篇:檔案數字化方案制定與實施
檔案數字化方案制定與實施
館藏傳統載體檔案數字化的問題,許多地方檔案館進行了實踐,積累了一定的經驗,對全國檔案數字化建設起到了推動作用。但是,總結以前我國檔案數字化建設的不足和失誤,往往不是信息技術支持不夠,而是絕大多數都知道搞數字化,但檔案數字化目的是利用的主題不突出,忽略檔案開放鑒定與數字化檔案利用的邏輯關系,對先剔除無用檔案后開展數字化的思路不明確,沒很好研究檔案數字化的整體效果就大張旗鼓地做起來了。進而出現數字化目錄數據和全文數據不對應、找不著或不好用等問題不少,檔案數字化的量雖多,但能上網利用或者說能上互聯網利用的很少,數字化返工的現象比較突出,使有限的資金投入并沒有體現在數字化檔案的利用效益上,這一點已引起檔案系統管理和技術高層領導的重視,許多實踐工作者已開始進行有益的探索。
面對網絡時代公眾迫切需要遠程、公開、快捷的檔案信息,面對館藏浩瀚如海的案卷,面對當前我國檔案數字化需要解決的一系列問題,長春市檔案館與中國人民大學信息資源管理學院共同承擔了國家檔案局科技項目《檔案數字化方案研究》。該項目經過課題研究人員的共同努力,已取得初步研究成果。通過課題研究,對檔案數字化方案的研究提出了一些觀點和看法,大家交流和討論。
一、確定檔案數字化指導思想與原則
檔案數字化指導思想是:以需求為導向,以利用為目的,充分利用計算機軟硬件功能,最大限度發揮人力資源和數字化加工設備能力,保護館藏檔案原件完好,保證數字化檔案真實準確,更好地發揮檔案信息資源的作用。
檔案數字化原則是:遵循重要檔案數字化的價值性原則、常用檔案數字化的實用性原則、開放檔案數字化的開放性原則、褪跡檔案數字化的搶救性原則,解密檔案數字化的及時性原則,目錄數字化與全文數字化分步的時效性原則,檔案數字化加工與利用同步的一致性原則。
二、明確檔案數字化策略
(一)需求導向,急用先上策略
1.需求導向策略
社會需求對檔案利用的影響應該是檔案工作者特別關注的問題。我們用統計數字加以分析。
(1)隨著編史修志工作納入各地工作規劃,1986年全國?。▍^、市)綜合檔案館接待編史修志查檔卷數占利用總卷數的69%。隨著編史修志階段性高潮過去,2003年全國?。▍^、市)綜合檔案館接待編史修志查檔卷數占利用總卷數的28%。下降41個百分點。(此數據來自國家檔案局法規司保存的檔案統計年)(2)隨著社會保障制度的建立和國有企業改革的深入,長春市檔案館查閱工人調配檔案卷數占利用總卷數的百分比,由2002年的1%增加到2004年的占利用總卷數的68%。(此數據來自長春市檔案館利用統計數據庫)由此看出,國家、地方新政策的出臺和工作部署對檔案利用的影響程度。從宏觀上講,檔案利用已實現了兩個轉變,服務重點由政治領域轉變為經濟領域,服務對象由機關干部擴展到公眾百姓,特別是為百姓提供憑證案例急劇上升。用動態觀念研究當前與長遠社會對檔案的需求,并指導檔案數字化與利用服務工程實踐應該是檔案部門的必然選擇。
2.急用先上策略
地方檔案館館藏檔案數量眾多。但并不是所有檔案都在現實中利用,有相當大一部分多年不用。2004年全國?。▍^、市)綜合檔案館檔案平均利用率僅為1.6%。雖然檔案館眾多全宗中當地黨委、政府全宗利用率高是一般規律,但其他全宗利用情況往往和政策、時間的變化而變化,影響更大。所以,各級地方檔案館按照近期利用統計情況和發展趨勢確定數字化的先后順序是科學的選擇,利用優化理論進行檔案數字化篩選,快速反應,突擊完成急用檔案數字化任務,能夠達到更好地發揮檔案作用的目的,實現即時投入使用的預期。(此數據來自國家檔案局法規司保存的檔案統計年報)
(二)本級為主,分步實施策略
(1)本級為主策略
根據檔案館職能分工和檔案來源原則,各級地方檔案館永久檔案絕大多數是本級機關形成的,一般都占50%以上,這部分檔案自然是當地檔案館數字化的重點。同時,地方檔案館都保管著大量的上級檔案文件,館際之間上級檔案文件重復是必要的,這些紙質文件來源一般都是上級機關統一印制的。進入信息時代,地方檔案館都面臨著保管的上級檔案文件全文數字化問題,特別是上級檔案文件的開放鑒定審查問題,與其各地分頭審查上級檔案文件開放和進行數字化,不如國家檔案局著手進行檔案全文數字化和開放鑒定分工、協作,向館際共建、共享已有鑒定和數字化成果的方向發展。地方檔案館堅持本級為主的原則,根據需要和可能適時、適量地進行利用頻繁政策性上級檔案文件的全文數字化,以滿足當前工作的急需,盡量減少檔案館多層的重復勞動。
(2)分步實施策略
館藏檔案數字化不可能一步到位,而且檔案室進館范圍檔案陸續進館,進館范圍檔案實施檔案數字化館室共建、共贏、共享的策略非常重要。在具體實施過程中,文件級目錄數據庫建設是最基礎性的工作,是第一位需要建全的,但并一定是文件級目錄數據庫建成后再建其它數據庫。專題數據庫建設是根據現實需要而適時建立。全文數據庫建設是滿足信息檢索需要而必須加快建設的數據庫。
(三)剔除無用,避免浪費策略
1.剔除無用策略
地方檔案館館藏現行檔案主要來自于機關各個立檔單位,其檔案文件進館的決定權掌握在立檔單位文檔人員手里,加之國家檔案保管期限表幾經修改和許多條款至今還比較籠統,所以,不該歸檔的、不該進館的、文件重復的檔案進館頗多。特別是建國超過50年以后,半數左右長期保管的檔案逐年超過保管期的最上限,這些檔案實際上絕大多數已失去保存和利用的價值,但它們仍占據著檔案管理的各種資源。
2.避免浪費策略
面對數字化方法的選擇,剔除無用,避免浪費應該是一種長久策略,把大量失去保存價值的檔案先剔除,避免把無用檔案數字化,再造數字化垃圾。
三、優選檔案數字化技術與業務路線
檔案數字化建設周期長,信息技術又處在快速發展之中,各個檔案館數字化基礎和條件不同。從本館實際出發,優選檔案數字化技術與業務路線特別重要。
(一)計算機新技術與檔案數字化業務的有機結合
信息技術的發展給檔案數字化效率和質量的提高帶來深刻的影響,本著技術為需求服務的理念,無論是利用哪一種檔案管理系統,都要適應檔案數字化流程重組和再造需要,適時進行軟件升級,通過軟件升級固化技術與流程重組與創新,使檔案數字化的效果更好。同時,設計符合國家標準與適應自身需要的數據庫結構,使檔案數字化的過程優化,數字化檔案的利用快捷。
(二)檔案鑒定與數字化同步
鑒定與數字化同步的目的是加快數字化檔案信息的利用。在計算機網絡環境下同步進行檔案鑒定與數字化工作是發展趨勢。這種檔案鑒定是以剔除無用檔案為前提,以鑒定檔案開放為主,按需求篩選全文數字化檔案,為適時提供數字化檔案信息服務打基礎的過程。
(三)檔案數字化與上網利用同步
數字化檔案分開放與不開放兩種。在計算機網絡環境中,在確定檔案開放與不開放的同時,開放檔案即上互聯網。開放與不開放檔案數據在局域網中即時使用。
檔案數字化及管理流程重組不可能一次到位,它是一個管理思想不斷地變化的過程,適時把新技術和新理念納入進去是非常重要的。
四、細化檔案數字化操作方法
實踐證明,在計算機網絡環境下,檔案數字化和利用服務工程以建立流水作業線,提高工作效率和效益為最佳方式。
(一)優化配置各種資源
檔案數字化建設需要投入,特別是建設初期軟硬件配置投入較大,建成后也要保持一定的運行成本。地方檔案館在具備一定檔案數字化條件的基礎上,要按照成本效益最大化理論,根據不同的情況,進行檔案專業人員和數字化技工人員、計算機和掃描設備的合理搭配,優化檔案數字化各種資源配置,提高檔案數字化建設的投入產出比,構建檔案數字化投入小產出大的新模式。
1.計算機網絡環境下檔案數字化與利用服務工程流水線資源配置案例
(二)首先建立文件級目錄數據庫
滿足一般檢索和管理的需要,建好檔案文件級目錄數據庫。目前,絕大多數綜合檔案館,由于沒有實現全部檔案的文件級目錄機檢,查找檔案不快、不準、不全的問題普遍存在。另外,檔案的統計單位主要是卷和延長米,而檔案的最小單位是文件的件數,以件為單位的底數不清是普遍存在的問題。所以,把文件級目錄數據庫建設作為一項基礎性工作,在提高檔案的查全率、查準率的同時,利用計算機實現檔案以件數為基本單位的管理是非常必要的。
1.高度重視文件級目錄數據錄入的前期處理。檔案館的案卷來自各個立檔單位,案卷是由文檔人員在檔案局業務人員指導下形成的。但是,由于文檔人員變動頻繁、檔案業務指導面多線長,案卷質量難以適應計算機精確管理的需要,加之個別文件形成時的先天不足,給文件級目錄數據庫建設帶來許多麻煩。實踐證明,進行文件級目錄錄入的前期處理,拋開原有的文件目錄,按卷內實有文件一一錄入,把題名不反映主題、目錄與實體不符等一系列問題一并處理是非常必要的。
2.科學合理地設計數據庫結構。文件級目錄數據庫結構包含三方面功能為最佳。一是符合國家有關標準及實際情況,文件題名、責任者等滿足文件檢索需要的字段。二是存毀、開放、掃描等數字化加工階段利用的字段。三是數據錄入、校對、鑒定、審查等標明責任的字段。
3.數據質量是數據庫的生命。建立在計算機環境下,以上網公開利用為根本目的文件級目錄數據庫,與紙質文件目錄有本質的區別。紙質文件目錄有問題只有檔案館內部少數人知道,利用者并不清楚。但是,文件級目錄數據庫進入網絡,特別是向社會公開的部分,對數據庫的質量要求是相當高的,數據質量也是當前制約許多數據上網利用的瓶頸之一。
(三)適時建立專題數據庫
滿足特殊檢索需要,適時建立檔案專題數據庫。館藏檔案僅靠文件級目錄數據庫是不可能解決全部檢索問題的。隨著客觀需要的變化,對某一專題檔案有集中利用的需求是經常發生的,突擊建立專題數據庫,滿足社會需求,是檔案館與時俱進的突破口,也是充分發揮檔案作用的最佳時機。主要把握三個方面:一是根據館藏檔案內容確定專題數據庫的總體布局。二是按需求分期建立專題數據庫。三是根據文件內容和檢索需要分別設立不同的專題數據庫結構。
(四)優選建立全文數據庫
滿足信息檢索的需要,建立檔案全文數據庫。按照國家檔案局提出的重點的、利用頻繁的檔案首先實現全文數字化的要求,按照“二八”定律,即以20%的努力達到80%的效果,通過多年檔案利用統計數據分析,優先全文數字化檔案的全宗、年代。在網絡中、在文件級目錄的基礎上同步進行檔案存毀、開放、數字化鑒定與篩選,進而形成與文件級目錄一一對應的全文數據庫,并確保數字化檔案的真實、準確。
(五)檔案數據庫的管理
為了檔案數字化與利用同步和數據安全管理的需要,檔案數據庫分在建數據庫和成果數據庫兩大類。
1.在建數據庫的設立。在建數據庫是為了數字化加工所設立的動態庫,是數據不斷變化的數據庫。例如,設立文件級目錄數據錄入庫,它是每個錄入人員都分配給操作權限的動態庫,屬于在建數據庫。而完成的文件級目錄數據庫則是成果庫。但是,在鑒定及全文數字化加工過程中它又成為全文數字化加工在建數據庫。
2.成果數據庫的使用。成果數據庫只分配使用權限,只有特殊需要時經批準才分配數據改變的操作權限。
3.數據的管理與監督
建立技術負責人、超級管理員、數據管理員連鎖責任制,實行審批者沒有數據操作權,超級管理員只允許分配權限不允許使用數據操作權,數據管理員只有需要時經批準使用數據操作權,用后即刻收回。給予單位領導和相關中層干部全部數據的查看權,每天24小時可以時時對數據質量進行監督,形成數據管理監督新機制。
(六)數字化檔案利用服務工程
數字化檔案利用服務工程是以搞活數字化檔案利用的目的,以局域網、政務網、互聯網為平臺,通過建立數據安全管理制度、網絡安全運行制度和具有法律責任的網管、數據管理員、數字化加工人員、提供利用人員連鎖責任制,環環相扣,從措施上保證數字化檔案的準確。通過防火墻、CA認證、數字水印、電子簽章、權限控制等計算機新技術,從技術上保證數據的安全,利用網絡實現檔案的法律效力,實現遠程為利用者提供快捷、準確數字化檔案的目標。
1.在局域網上應用
在局域網內,檔案在建和成果數據庫所有接待人員都有檢索權限,對只進行目錄數字化的檔案實行現用現掃描全文的方法使之達到已全文數字化的檔案一樣效果,利用網絡技術實現數字化檔案利用替代檔案原件利用、計算機打印件替代復印機復印件、電子簽章替代手工蓋章、接待人員和利用者不接觸檔案原件的目標。從而起到了運用數字檔案高效利用、保護原件的作用。并積累了利用者憑加蓋電子簽章的數字檔案打印件辦理社會保險的成功案例,其數字化檔案的法律效力得到認可,為檔案館參與電子政務開辟了新途徑。
2.在互聯網上應用
利用檔案網站,通過CA證書等安全手段,不但實現了領導遠程數據上傳的審批,主要是開展開放檔案遠程查詢、下載、打印。特別是把CA證書發給立檔單位或使用單位檔案室,為CA用戶遠程提供檔案證明和數字化檔案法律效力的體現,減少異地現場查詢的不便,使檔案館參與電子政務成為現實。
五、加強檔案數字化工作的行政管理
檔案數字化涉及檔案館內部許多部門,加強組織管理工作顯得十分重要,“三分技術七分管理”同樣適合檔案數字化與利用服務工程。各個檔案館涉及檔案數字化加工和利用的內部組織機構設置不盡相同,但應按照效率優先的原則,在計算機環境下,把數據錄入、鑒定、數字化加工、整理、數字化檔案利用形成一個流水線,打破內部行政分工界限是發展趨勢。無論是采取那種組織形式,優化人員組合重新分工在所難免,各個檔案館在組織實施方面有所不同是必然的。
1.加強計劃管理
檔案數字化建設是一項復雜的系統工程, 針對實際的調研和論證,運用科學方法預測,制定科學配置各種資源進行檔案數字化的總體規劃和年度專項計劃,通過計劃謀求管理系統的外部環境、內部條件、決策目標三者在動態上的平衡,實現管理決策所制定的各項目標。
2.強化組織實施
實施是一個復雜的活動過程,檔案數字化建設又是一項全新的工作,技術含量高,涉及到許多因素,在實施過程中會出現各種各樣的矛盾和困難,會遇到來自各方面的干擾,實施特別強調解決問題的及時性。通過創新行政管理與技術管理相互作用的新機制,實施有效的組織、指揮、協調、激勵工作,保證檔案數字化的計劃目標的順利實現。
3.增強管理的技術含量
檔案數字化的建設過程貴在控制,重在管理。利用計算機進行檔案數字化,任何一個邏輯錯誤,都會給數據的管理和使用帶來麻煩或隱患。在互聯網上公開不真實、不準確的檔案,將在世界范圍內產生不良影響。特別是在網絡環境下的流水作業,上一道工序一定要為下一道工序負責,各道工序工作量的對等與匹配同樣重要,這必然要求行政、技術、質量管理的網絡化。實踐證明,建立數字化進度數據庫、數字化質量反饋庫、檔案利用登記數據庫,給局館領導和相關人員分配使用權限,通過技術手段將全面質量管理思想引入檔案數字化建設,實現全程管理、適時控制,達到強化數字化檔案質量保證體系的目的。檔案數字化與利用服務工程是一項長期的任務,需要從理論上解決的問題很多,需要在實踐中探索的問題也不少,我們將繼續深化研究與實踐。
第二篇:檔案數字化方案制定與實施
關于檔案數字化的實踐與思考
當前,我國信息化發展戰略的實施,電子政務的推進,為我國檔案事業發展提供了難得的機遇。加強檔案信息化建設是檔案事業適應時代和社會發展的必然選擇,是加速檔案管理現代化的客觀要求,是提高檔案服務水平的必由之路,勢在必行。對此,作為管理和擁有大量產權產籍信息資源的房產檔案部門,為更好地適應形勢發展的要求,我們著眼未來,運用數字化、信息化技術,對檔案數字化進行了有益的實踐與探索。
一、檔案數字化的意義
1、檔案數字化的含義
檔案數字化是指利用計算機技術、掃描技術、數字成像技術、數據庫技術、多媒體技術、存儲技術等高新技術把各種載體的檔案資源轉化為數字化的檔案信息,以數字化的形式存儲、網絡化的形式互相聯結,利用計算機系統進行管理,形成一個有序結構的檔案信息庫,及時提供利用,實現資源共享,是檔案信息化建設的重要內容。目前,大多數檔案館保存的檔案信息形態主要以紙質、縮微膠片和底片等載體形式存在,只適應于傳統的管理與傳播方式,即實施手工管理和以點到點的傳播,即便是經過編研等初步加工,編輯印發檔案資料,實現以點到面的傳播,其覆蓋面也還是太小,很難達到社會化程度。檔案信息資源的經濟價值和社會價值也難以充分實現,更難適應當代“數字化生存”的形勢。檔案原件數字化,對檔案信息的現代化管理、使用和傳播等都具有很重要的作用。
2、檔案數字化的主要內容
①檔案目錄信息的數字化,建立檔案目錄數據庫。
②載體檔案的數字化,如紙質檔案、照片檔案及錄音錄像檔案等的數字化,建立檔案影像數據庫或多媒體數據庫。
3、檔案數字化的主要作用
①檔案數字化是檔案信息化建設重要內容。檔案信息化建設的核心是資源建設。資源建設包括兩大方面任務:一是現有館藏檔案的目錄數據庫建設和館藏重要紙質檔案和照片、錄音、錄像檔案的數字化;二是現行電子文件歸檔與電子檔案管理。
②檔案數字化能有效地保護檔案原件。⑴、代替原件使用,保護檔案原件。⑵、數字化副本異地保存,輸出磁盤、磁帶供永久保存。這樣可使這些檔案資料在出現天災人禍的情況下不致于遭到毀滅性的破壞。⑶、恢復檔案材料模糊褪變的字跡及對污損殘缺照片檔案的修復。
③檔案數字化能改善檔案的利用方式。⑴不再受“孤本”的限制,一份文件可以同時提供給所有需要它的人共享。⑵數字影像文件可以通過計算機局域網或者廣域網進行異地傳輸,使異地調閱利用成為可能。擴大了檔案的利用空間,讓更多的人們來了解檔案,利用檔案。⑶“時間”不再受限制,利用者可以隨時使用自己需要的文件。檔案數字化以后,將已開放的檔案上網,這樣所有利用者就可以在任何時間上網利用檔案信息資源。④檔案數字化是傳統檔案館走向數字檔案館的必經之路。數字檔案館無疑是21世紀各級各類檔案館的發展方向。盡管當前它的具體組成結構、組織管理模式還處于探索之中,可其“館藏”的數字化特征是肯定的,傳統檔案的數字化將是其“館藏”的重要組成部分。
二、檔案數字化的實踐
1、檔案數字化工作回顧
為了加快實現檔案的現代化管理,方便檢索和提供利用,我館多年來花大力氣致力于檔案信息庫建設和檔案的數字化工作。1993年,我館購置微機,獨立開發人事檔案管理系統,開始檔案數字化的工作,使得全局職工基本情況在電腦中一覽無遺,工資情況也能被系統所顯示。1998年開發文書檔案管理軟件,利用電腦管理文書檔案目錄。經過這些年的努力工作,我們將館藏所有文書檔案、人事檔案全部錄入電腦,并實現了電腦查詢,極大方便了檔案管理。2002年,我館與市房地產產權處合并,而產權處在1995年,開發出產權產籍管理軟件,房產交易辦證實現電腦化辦公,并在實踐中不斷完善程序,將絕大部分產權產籍檔案錄入電腦,為全市房產發證加快了辦事流程,減少了出現錯誤的幾率。
2、實施檔案數字化工程的必要性
首先,大力推進國民經濟和社會信息化,以信息化帶動工業化,實現社會生產力的跨越式發展,是黨中央抓住信息化這一機遇,在黨的十五屆五中全會作出的戰略決策。為了適應國家信息化建設和檔案事業發展要求,2002年11月25日,國家檔案局制定下發了《全國檔案信息化建設實施綱要》,指出了“十五”期間檔案信息化建設的指導思想、目標與主要任務。
其次,隨著城市建設的快速發展,老百姓購房辦證數量的激增,為保障盡可能縮短老百姓辦理權證時間,不出現發證錯誤和重復發證,傳統管理根本不能滿足要求。
最后,2002年10月隨著市房地產檔案館與市產權監督管理處的合并,檔案管理工作出現了新的局面。湘潭市產權監督管理處開始建設湘潭市首個GIS系統——湘潭市房地產GIS系統,該系統最基礎的工作也是最重要的工作是檔案數字化工作(或稱檔案數據導入工作),只有保證檔案數字化才能保障房地產GIS系統的基礎的牢靠。
3、檔案數字化工程的定位
產權產籍檔案數字化工程是湘潭市房產局房地產GIS系統的子項目,旨在將海量產權產籍檔案信息化、數字化,實現房地產GIS系統底層數據的全數字化,并通過建立后的系統實現“以圖管房”,減少辦證錯誤,提高辦證時效,并通過GIS系統數據統計,向各職能管理部門和政府宏觀調控部門提供數字化的檔案信息及較為精確的統計報告,更好地為城市建設和房地產市場管理服務。
4、檔案數字化工程需求分析 需處理量:A、產權檔案:館藏產權檔案共計35萬多卷。B、房產抵押、擔保、司法查封檔案:房產抵押檔案12900余卷,擔保檔案2050余卷,司法查封檔案1500余卷。C、正常業務:2003年9月1日之后的所有正常業務檔案。
處理措施:劃分時間線2003年9月1日,區分處理方式。時間線之前的檔案將其檔案實體整理與裝訂,各類檔案詳細錄入相關頁面數據,檔案原件通過數字照相技術掃描;時間線之后的檔案,按照新開發的正常辦證流程來實現數字化。
5、檔案數字化工程的內容
將所有各類檔案進行規范整理,然后,分成檔案鑒定、檔案掃描、檔案導入三個大的環節,11個小環節分類錄入服務器數據庫。不僅僅將檔案原件掃描生成圖片存儲,并將檔案原件上記載的55項相關重要業務數據真實、準確的錄入數據庫。
6、檔案數字化工程實施情況
需求分析與設備考察階段:調查分析館藏情況,包括檔案的類型、載體形態與狀態、館藏數量等基本情況。根據館藏情況制訂檔案數字化的科學規劃,確定項目需求,根據需求考察當前各種高速掃描系統的集成解決方案。在設備考察階段我們特別注意這么幾個問題:A、檔案數字化設備配置計劃的成套性。B、檔案數字化設備的配套性,也就是文檔掃描儀和數字照相機優缺點對比,通過不斷的實踐,我們覺得數字照相機更加適應我們的工作。C、檔案數字化項目硬件與軟件的集成性。D、檔案數字化方案與我館需求的適應性??傊?,考慮到檔案信息數字化要經過一個較長的過程,因此我們從實際需要和長遠打算出發,力求確保電腦、照相機、操作人員等設施人員數量的成龍配套,使其具有較強的支撐能力和擴展能力。
系統實驗階段:2002年底,項目開始立項。組織業務、技術骨干遠赴深圳、上海、黑龍江佳木斯市等地實踐考察,2003年6月,正式成立房地產GIS系統領導小組、數據導入小組,調集相關業務、技術精英加入團隊,正式開始實驗階段的工作,新購進了12臺電腦微機,4臺佳能數碼相機,4臺EPSON激光打印機,一臺工作站服務器,設備安裝調試完畢。通過前期和軟件公司合作,共同開發我們所需要的軟件。探索檔案數字化工作在快速系統下,檔案前期整理、檔案掃描、質量檢查、掃描文件管理、后期整理等全過程的協調配合問題,并探討在高速系統下如何解決某些技術問題。經過近一年的測試,我們對整體系統流程和配套軟件、數據庫的性能有更進一步的了解,在項目的運作模式和系統管理等方面積累了一定的經驗,同時,也鍛煉了一支技術過硬的隊伍,為系統的正式運行打下了基礎。
項目實施階段:本項目是一個長期、流程化運作的系統,從建立開始就必須確保能長期高速、穩定運行。在系統的開發與研究方面有一個時間周期,現把工作計劃分為以下幾個階段:
①、系統總體方案框架設計:
2002年12月—2003年6月,完成系統總體框架,生成詳細可行性分析報告,及相關配套業務標準、各類管理制度。②、系統建立:
2003年6月—2003年10月,系統建立,包括:硬件配置及軟件的開發。③、系統試運行:
2003年10月—2004年2月。④、系統正式運行:
2004年2月起,系統正式運行,同學校簽訂合作框架協議,調集員工和學生共100多人,經過一段時間的業務及技能培訓,參與系統的正式運行,在運行中不斷完善升級。
三、對檔案數字化的思考
1、提高認識,統籌規劃
首先必須在思想上充分認識檔案信息資源的重要意義,在當今信息公開程度越來越高的形勢下,檔案的文化性質和社會性質逐步強化,利用的范圍和對象將逐步擴大。在這個信息時代,只有當檔案信息資源在社會主義現代化建設中發揮重要作用時,檔案和檔案工作的意義和價值才能充分地全面地展現出來。
其次,作好統籌規劃。將大量的檔案數字化,是一個龐大的系統工程。首先要做好館藏情況的調查,包括檔案的類型、載體形態與狀態、館藏數量、檔案信息利用等基本情況。根據館藏情況制訂檔案數字化的科學規劃,包括服務器、電腦、掃描設備等硬件的購置計劃和數字化處理規劃。檔案數字化實施處理規劃應貫徹“突出重點,分步進行”的原則,對館藏重點和利用率高的檔案先行數字化,早日滿足大多數利用者的需求。
最后,檔案數字化是一項費時較長的工程,在大規模、流程化的數字化過程中,所有檔案原件都需從檔案庫房分批大量取出,一定要保障檔案原件的完整,不允許出現損毀和遺失的現象。
2、加強基礎工作,認真做好檔案數字化
①、檔案數字化必須有所選擇。針對館藏“浩瀚”的檔案資源,不加選擇地全部數字化是不可能的、也是不必要的。我們應該根據一定的原則確定哪些館藏檔案原件應該數字化、哪些檔案原件中哪些頁不需要數字化。
②、做好數字化時掃描參數的優化設置。掃描系統掃描參數的選擇和確定對掃描數字影像質量有著較大影響,其中掃描分辨率直接關系到掃描文件的清晰度和還原效果。我們在選擇分辨率時應根據實際需要綜合考慮,包括掃描文件的可閱讀性、存儲空間、輸出打印質量等。
③、做好檔案數字化的全程控制。在檔案數字化過程中,要注重全面的質量檢查,加強數據的質量控制。質量檢查應包括以下幾方面內容:A、數字化前的檔案整理檢查。要進行數字化的檔案原件必須完整、排序正確,對折損嚴重影響掃描質量的原件應預先修整。B、數字化中的人員業務培訓。數字化工作是需要人來完成的,人員業務培訓不過關,直接導致返工,間接導致成本的增加,時間段的延長。C、數字化后的數據質量、圖像質量檢查。錄入后的檔案信息要做到非常高的正確率,掃描后的文件圖像應保持檔案的原貌,字跡清楚不失真,無錯掃、漏掃,對文件圖像質量有問題的應重新掃描。
3、開展檔案數字化問題的研究,及時解決數字化進程中的疑難問題。
檔案數字化是檔案工作中的一項新內容,不可避免地會遇到一些新情況、新問題。比如,數字化檔案信息壓縮及存儲的關鍵技術問題;業務形態于現有技術手段相抵觸;數字化檔案信息安全、保密技術問題;數字化檔案信息的訪問形式與安全控制問題;數字化檔案信息知識產權問題;數字化檔案信息的法律地位問題。針對這些新情況、新問題,應在抓檔案原件數字化工作的同時,組織力量開展檔案數字化問題的研究,及時解決工作中的一些業務問題和相關技術性問題,同時澄清和統一思想認識,確保檔案數字化工作的順利開展。另外,必須加強檔案數字化和數字化檔案信息管理人才的培養。只懂得計算機技術或只懂得紙質等載體檔案管理知識的人無法勝任此項工作,所以應加強這方面技術人員的培養。
第16屆國際檔案大會剛剛閉幕,此次會議的主題是:“檔案、管理與發展:描述未來社會”。我們應不斷學習最先進的檔案管理模式,不斷走出去看看,開拓眼界,才能跟上時代發展的主旋律。
國土房管檔案館檔案影像管理系統一、需求分析
----國土房管檔案影像管理系統,其核心是完成紙面檔案的影像化管理工作,將傳統的紙面文檔管理轉變為對影像文檔的管理,將傳統的對紙面文檔的數據索引方式轉變為面對影像文檔進行索引的方式,從而為業務的開展提供足夠的、快速的信息保障,進而為提高工作效率打下堅實基礎。
----系統要求:分別成立專職的掃描工作點、索引工作點、查詢工作點。掃描工作點主要進行集中的掃描工作,開展索引前紙面文件的預處理;索引工作點主要完成索引數據的錄入,數據入庫、生成相關業務報表、建立影像文檔庫等工作;查詢工作點可以是本單位內局域網上的任意多個工作站。
----以下對已掌握的需求要點分別進行分析,以及提出解決建議:
1、檔案科目分類
需求:檔案業務單式種類較多、分類查詢方式也較多樣 系統要求:軟件在分類、錄入上應當實現簡便、快捷。
2、檔案規格、尺寸
需求:雖然檔案的尺寸、規格基本相同,但考慮到可能要涉及到的附件紙張規格有不同規格和紙張質量(薄厚),這對掃描儀應當有著較高的要求。系統要求:采用能夠實現多種規格尺寸的檔案、檔案可以實現同時掃描的設備,不必對規格、尺寸做任何限制和要求。
3、檔案處理手續
在處理電子文檔過程中,所有的檔案都要按照類別、順序號排列,但是如有缺漏要立即發驗,保證文檔的完整。原始檔案和影印件要準確無誤的保存起來。
系統要求:系統工作流程定義時,避免流程的逆轉,要求圖像掃描和處理時要準確無誤,不能存在糾偏變形、遺失檔案和要素等問題。
4、檔案、檔案要素
需求:檔案的數量和格式不具有絕對固定性,不定期的會增加一些檔案,檔案的格式也存在變更的可能性。
系統要求:軟件可根據檔案數量、種類和要素的變化,可以自定義檔案和要素。
5、檔案紙張
需求:檔案的紙張的質量差別雖然不是很大,但要保證原始檔案的完整性;另外,有的手寫體和印刷體字跡不很清晰。
系統要求:不能撕壞紙張;必須能夠對字跡進行增強;掃描是能夠自動識別紙張的薄厚,對于一部分年久的紙面文檔,應采用平板掃描的方式進行處理。
6、檔案的信息處理:
系統要求:歷史檔案處理,需要采用兩臺高端的掃描儀、2臺中端自動進紙掃描儀,5臺平板掃描,多臺數碼照相機,掃描時需人手做前期整理工作,以及后期的檔案歸檔工作。完成所有的歷史檔案的處理需要準備不低于1.3T的存貯空間。
7、掃描方式
需求:檔案的掃描不進行分散掃描,分散掃描會造成各口工作人員的工作效率的極大下降,并且掃描后的文檔較為混亂,不利于后續的索引工作。
系統要求:在減少硬件投入的情況下,有利于提高工作效率,減少掃描的工作環節和更有效地進行質量控制,掃描之前應對被掃描的檔案進行歸類整理,以方便掃描,掃描過后由QA進行質量檢查。
8、正確索引
需求:要求寫入數據庫的索引數據要確保正確。
系統要求:為了確保索引相關信息被正確入庫,可靈活采用一次錄入,二次較對,或操作人員兩次錄入的工作方式,系統自動校對。
9、影像文檔及數據安全
需求:檔案管理部門所涉及的檔案,對安全性及其保密性有很高的要求。系統要求:可對影像化的檔案資料進行加密。
10、影像文檔的查詢
需求:按一定的權限要求進行系統設置,完成查詢的需求。
系統要求:采用安裝客戶端的方式,按一定的權限要求進行系統設置,完成查詢的需求。
11、備份歸檔
需求:國土房管檔案影像管理系統要求提供可靠的數據存儲與備份。
系統要求:按現有的數據量以及計劃中的投資,可以采取大容量存儲設備磁盤陣列和磁帶機作近線備份的方式保存數據。
12、查詢響應速度
需求:系統查詢速度需要考慮多用戶、多數據時系統要能達到較佳的響應速度。
系統要求:影響系統查詢速度的因素主要有三個:網絡帶寬、影像文件大小及并發用戶的數量。所以影像文件的調閱速度基本上由周邊網絡設備設決定。
二、解決方案
1、目標
----國土房管檔案影像管理系統擔負著檔案的管理的任務,是一個專職處理檔案的職能部門,通過為國土房管檔案影像管理系統建立檔案影像管理系統,引入新一代的文件管理技術,為國土房管檔案影像管理系統建立原始檔案的影像檔案庫,以達到加強原始檔案的管理、提高管理效率、降低管理成本、實現資料的快速查詢及共享的目的。
2、概述
----信息行業作為知識經濟時代的核心產業之一,近年來一直以驚人的速度在不斷發展,而以紙面文件作為媒介的各種信息資料也呈爆炸性增長。如何有效管理這些信息資料,不斷提高信息的使用效率,已經成為一個重要課題。
3、現狀
----國土房管檔案影像管理系統的在日常業務中,會產生大量檔案,檔案多以紙面文檔的方式產生,以傳統的數據處理方式進行處理,紙面檔案每天都在大量地產生,再加上歷史遺留文檔,數量是非常驚人的,其中所涉及的信息數量也非常龐大。對于這些檔案及信息,如何進行分類、保存和歸檔,錄入、高效的查詢,一直是一件非常棘手的事情。在傳統模式下,總是被以下幾個難題所困擾:
● 檢索、查詢和日常管理麻煩,工作效率不高; ● 紙面文檔不好保存,很容易被損壞或弄污; ● 管理效率低下,管理成本居高不下; ● 檔案調閱及信息利用效率較低;
● 工作低效率、高成本;
----從以上的介紹,不難看僅僅用手工進行紙面檔案的管理有很大局限性,在信息技術飛速發展的今天,也越來越不合時宜了。如何利用最新科技,完成紙面檔案的電子化管理工作已經成為當務之急。
4、影像技術簡介
電子影像是指各類文檔的電子照片。
----影像技術是指將各種文檔制作成電子照片,使這些文檔的采集、分發、使用、管理、存儲完全電子化的相關技術,而傳統的電子化技術是把文檔上的信息制作成電子數據,把文檔的流轉和處理轉化為數據的流轉和處理。
----影像系統是指對經影像化處理的文檔完成數據錄入、查詢、調閱、批改、存儲等功能的一整套解決方案,通過方案的實施能有效的解決傳統手工紙面文檔管理所無法解決的難題,具體有以下幾方面:
● 原始文檔電子影像化備份; ● 可靠安全的數據管理;
● 文檔“影像原件”的高效查詢;
● 在減少工作難度的同時,進一步推進管理工作的規范化。
----文檔影像化作為一種先進的信息管理手段,一經采用,必將大大提高紙面文檔及數據的管理效率,降低成本,改進服務,提高信息利用率。影像技術應用的可以分不同階段開展 ● 初級階段:影像化存檔: 完成文檔影像化工作及影像文件查詢 不涉及工作流技術
不涉及業務過程
● 深化階段:影像化業務處理: 工作流技術與影像技術結合 融入業務處理過程 從后臺走向前臺
三、詳細的技術方案設計
1、工作流程設計
注:當有以下情況發生時,工作流程按以下的規定進行:
A. 掃描QA時發現漏掃、誤掃、掃描質量太差:重新掃描。B. 索引時發現漏掃、誤掃、掃描質量太差:重新掃描。
C. 自動校對時發現有誤:取有誤的輸入數據對照文件重新修改,計入日志,生成相應報表。
接收檔案
對所接收的紙質文件,根據一定的規則按類別、按份數完成文檔的第一次整理工作。確立批次
以加入標識紙的方式,對每一份檔案進行分隔;以一定的份數為一批,系統將自動生成批次號(注:也可以采用條碼自動識別的方式進行分頁及生成流水號,但采用條碼方式需要加大軟、硬件的投入。)
2、掃描 中高速掃描
系統采用PANASONIC 高速掃描儀KV-SS905CCN 2臺、中速掃描儀KV-S7065CCN 2臺,以每個批次為單位,放入掃描儀的自動進紙進行掃描。掃描時,自動生成檔案的分類、分頁。
3、影像處理
掃描質檢
檢查掃描的電子影像文件是否有漏掃、誤掃和掃描質量欠佳等,以保證掃描輸出高質量的電子影像文件。
進行掃描質檢時可以采取掃描完后,在掃描工作站上進行掃描的電子影像文件進行質檢。掃描補漏
對于有質量問題的影像文件建議全批重掃以減少操作復雜性,個別情況下可以用平板掃描儀、數碼照相機對那些漏掃、誤掃和掃描質量欠佳的文件進行追加掃描。
4、原始檔案裝訂入庫
在對掃描后的電子影像文件檢查無誤,將原始檔案采用常用的檔案管理方式裝訂及入庫。
5、索引
在索引時可采用一人兩次錄入,系統自動較對,對系統較對不一致的數據,進行校驗及錄入。
6、數據歸檔 接收數據及相應的報表,數據分別供業務數據庫使用及影像文檔庫使用。
7、歸檔備份
本系統采用一臺服務器、一個專用磁盤陣列對索引文件、影像文件進行備份;在進行索引文件備份可以采用定時備份或定容量備份,還可以采用不定時備份,這樣影像文件服務器遭到災難性破壞,可以直接將所備份的索引文件恢復。
8、檢索、查詢、管理影像文件
在對影像文件進行查詢時,基于本系統的在局域網里的查詢,采用安裝工作站軟件的方式,生成查詢日志。5系統結構及配置
四、系統結構
系統結構如下圖所示:
系統功能
我們設計的解決方案,由以下幾個子系統功能組成: 高速掃描
由高速掃描軟件提供高速掃描圖像資料的功能,把客戶的原始資料轉換為電子影像資料。由高速掃描員使用。把保存的數據送到質量檢驗工序。質量檢驗及數據錄入
影像質量檢驗與部分索引錄入是把影像質量有問題和數據不正確的影像資料找出來,由質檢員使用。索引的資料將會分別放在影像庫中及數據庫之中。系統管理
本系統提供的維護和生產情況查詢功能,由系統管理員使用。
安全管理
本系統分系統管理員、高速掃描員、質檢員和查詢客戶。其中系統管理員負責整個系統的管理,擁有系統的所有權限。高速掃描員、質檢員有相對應的工序使用權。而查詢客戶只擁有影像資料的查詢權。
生產日志查詢
可統計和查詢在各工序間的未處理資料情況; 可統計和查詢資料保存到影像數據庫的情況。出錯處理
如果在使用過程中發現索引信息有誤,系統管理員可以刪除錯誤紀錄,調出相應存放地中的資料重新掃描并建立索引。
影像查詢
本系統提供資料影像查詢功能,使業務人員可以通過EZDOC影像管理系統隨時查找需要的影像數據,查詢相應的影像文件;影像文件在查看時可以有放大、縮小、旋轉、打印的功能;記錄查詢日志。校驗功能
系統可以與其它系統的有機聯接,可以自動與業務系統提供之數據進行對比。數據備份
數據備份分為兩個部分:影像文件索引信息數據庫備份、影像文件備份。對于影像文件索引信息數據庫的備份,電子檔案管理系統不再另外提供備份功能,而是直接使用數據庫管理系統的備份、恢復功能,保證數據庫的完整性、有效性、可恢復性。
有關影像文件的備份:電子檔案影像索引之后,首先存儲于影像文件服務器,然后,系統自動完成備分機的備份任務。5.3.2系統特點
無業務流程的逆轉
國土房管檔案影像管理系統要求:“準確”、“迅速”、“安全”、“方便”。自然,在業務流程中盡可能避免業務流程逆轉,也就是說:在影像掃描的過程中盡可能避免檔案重新掃描、檔案漏掃等問題。流程的逆轉會增加數據錯誤的可能,流程逆轉的環節越多錯誤可能性越大。用戶可以自定義檔案分類
檔案種類繁雜,而且檔案種類、檔案要素并不固定,而且可能發生變化,如果系統將檔案類別做成固定方式,則無法適合業務的發展。于是,我們在系統中為用戶提供了一個開放式接口,可以讓客戶按照自己的方式增加、修改一些檔案分類和檔案要素?!挥镁幊?,全部通過鼠標即可完成。
用戶可選擇當前掃描、輸入的文檔類型
雖然,每天處理的檔案的種類和數量較大,但并不是每種檔案都有——通常數量大的主要分布在大業務上,有些檔案通常幾天出現一次。如果每天都要建立所有的分類,這將消耗不必要的存儲空間。因此,我們提供了對當前要掃描檔案類別的選擇功能,客戶可以根據當前業務情況進行選擇。
用戶可以自己確定檔案的要素
據上所述,我們的檔案類別差異很大,而且不定期在發生著變化,那么,檔案的數據要素也在發生著變化,為了讓客戶更好的適應這種變化,我們提供一個開放式檔案要素設定。可以根據具體的檔案設置、更改某些要素。多種安全保護模式
軟件登錄是采用密碼方式。
數據庫系統及影像文件也做了加密工作,防止他人修改影像數據和數據庫數據。
質量控制
在掃描過程中若出現漏掃、誤掃或影像質量不好的問題,通過有效的工作日志的管理,解決以上問題。
檔案數字化方案研究
課題組
《檔案數字化方案研究》項目對檔案數字化優化策略與原則、技術路線與支持、流程重組與再造、操作方法與步驟進行了全面的研究,達到了檔案數字化全過程優化和管理系統整體優化的目的,形成了完整的檔案數字化方案和成功的實踐案例。國家檔案局組織的專家鑒定委員會結論是:“該項目基于長春市檔案館以檔案利用為導向、漸進性的檔案數字化實踐,提出了檔案數字化工作的指導思想、優化原則和優化策略,符合國情,符合現代管理理念,對全國各檔案館的相關工作具有較大的參考價值;注重檔案數字化工作與檔案數據庫建設、檔案信息網絡開發的有機銜接,提出了系統優化的技術路線,規劃設計了檔案鑒定與數字化同步、檔案數字化與上網利用同步、多種檔案數據庫建設同步的流程,并成功地付諸實踐,實現了檔案數字化與上網利用的低成本、高效率、高效益。同時,運用CA認證、數字水印、電子簽章等技術,為網上檔案信息資源安全、準確利用提供了技術保證,也為檔案管理部門提供了很好的實踐模式”。該項目獲國家檔案局2006年優秀科技成果二等獎的同時,長春市檔案館被國務院信息化工作辦公室和國家檔案局確定為傳統載體檔案數字化試點單位。一.檔案數字化的指導思想
以優化理論為指導,以用戶需求為導向,以利用檔案為目的,充分應用計算機軟硬件功能,最大限度地發揮人力資源和數字化加工設備能力,兼顧保護檔案原件的要求,保證數字化檔案的真實可靠,更好地發揮檔案信息資源的作用。
二、檔案數字化的優化原則
實用性原則:針對館藏檔案具備重復利用和緊急利用兩大特點,急用、常用檔案優先數字化是檔案數字化的首選。開放性原則:互聯網給檔案信息資源共享提供了超越時空的條件,國家民主政治建設和政府信息公開催促檔案解密和開放,開放檔案及時數字化是實現其社會共享的前提。價值性原則:重要檔案優先數字化具有檔案利用和檔案保護雙重意義,是網絡時代更好實現檔案價值的客觀需要。搶救性原則:計算機存儲給檔案搶救開辟了了新的途徑,檔案數字化是保護瀕危檔案原件最經濟和便捷的方法。
時效性原則:檔案數字化加工與數字化檔案利用同步實現,是充分利用計算機網絡技術,更好、更快地實現檔案數字化效益的最佳途徑。
三、檔案數字化的優化策略
需求導向策略:社會需求是制定和調整檔案數字化工作策略的“風向標”。匯集多年檔案利用情況統計,把利用頻繁檔案的進行綜合分析,科學地圈定優先檔案數字化的范圍。并建立快速反應機制,執行常用檔案繼續做與急用檔案突擊做的計劃,達到數字化檔案利用即時見效的目的。
本級為主策略:地方檔案館保存的本級永久檔案是數字化的重點。進入信息時代,館際間重復的上級檔案文件,與其分頭進行數字化及開放鑒定,不如發揮中國特色檔案管理體制的優勢,由上級檔案行政管理部門組織,向館際共建、共享數字化、開放鑒定成果的方向發展,盡量減少檔案館多層的重復勞動。
分步實施策略:館藏檔案數字化不可能一步到位,而且隨著時間的推移,檔案室進館范圍的檔案將陸續移交到檔案館,這些檔案采取館室共建、共贏、共享的數字化策略非常有意義。剔除無用策略:館藏現行檔案是否進館往往由立卷人員決定,加之保管期限表比較籠統,館藏不該歸檔、不該進館、重復檔案頗多。特別是建國超過50年以后,市以下檔案館長期保管的檔案逐年超過保管期的上限。因此,開展檔案價值鑒定,剔除無用,以免再造數字化垃圾,避免資源浪費應是長久的策略。
四、技術路線的優化選擇 檔案鑒定與數字化同步:從利用上講,解決制約檔案信息資源共享的主要瓶頸---檔案開放鑒定問題是當務之急;從成本上講,檔案價值鑒定是避免失效檔案數字化的最佳方法。只有這樣,才能控制檔案數字化投入與產出比例失調、數量很大共享很少的問題。
多種檔案數據庫建設同步:一是首先建立文件級目錄數據庫。滿足一次檢索需要,建好文件級目錄數據庫。目前,絕大多數檔案館,因沒實現全部檔案的文件級目錄機檢,查檔不快、不準、不全的問題不可避免。所以,把文件級目錄數據庫建設作為基礎性工作,是提高檔案查全率、查準率必經之路。二是適時建立專題數據庫。隨著社會發展,對某一專題檔案集中需求時有發生,突擊建立專題數據庫,滿足社會需求是發揮檔案作用的最佳時機。三是優選建設全文數據庫。滿足檔案信息資源開發利用需要,優選建設全文數據庫。按照國家檔案局提出的利用頻繁檔案首先數字化的要求,遵循“二八”定律(即以20%的努力達到80%的效果),同步開展檔案全文數據庫建設。檔案數字化與上網利用同步:檔案數字化的根本目的是充分發揮其作用。通過計算機網絡技術,實現檔案數字化與局域網上利用同步,開放檔案數字化與互聯網上利用同步。五.重組和再造的優化流程 為發揮計算機網絡的優勢,重組和再造優化流程的實質,就是對檔案數字化整個工作流程進行系統分析,不但要打破原有業務規程,還要改變行政管理分工,進行全方位的變革。檔案數字化的任何一個細節都會對整體產生影響,輕者降低效率,重者決定成敗。長春市檔案館高度重視每一個細節,再造和優化了上百個流程和內部標準,保證優化技術路線的順利執行。六.檔案數字化示范案例----長春模式
從2004年開始,長春市檔案館以科研課題為先導,以項目管理為手段,以效益實現為檢驗標準,組建并成功運行檔案數字化工作組織架構、資源配置、數字化加工、上網利用“一站式”流水作業線,探索檔案數字化和網上利用服務工程優化模式,終于闖出一條獨特的檔案數字化之路。
(一)實施三個工程,建立一個團隊
長春市檔案館把信息化帶動作為首位戰略,視為一把手工程、班子工程、全員工程突出抓,并創新管理機制,打破行政分工,在計算機網絡環境下,建立了行政領導、指導專家(技術業務總負責)、專業人員、外聘技工20人的長期流程團隊,并與現有計算機和掃描設備進行合理搭配。該團隊由局(館)黨組直接領導,館技術部門提供支持,管理部門提供檔案,專家提供指導,創立了高效的組織體系,搭建了投入小產出大機制框架。
(二)集中四個環節,堅持流水作業
文件級目錄數據錄入是檔案數字化的基礎,檔案鑒定是檔案信息資源共享的前提,全文數字化是提升檔案服務水平的途徑,整理是檔案文件實體管理主要環節,把上述四個環節集中,是提高工作效率和質量的最佳選擇。長春市檔案館四集中流水線上,目錄數據錄入崗位安排業務和技工7名、檔案鑒定崗位安排5人、檔案數字化加工4人、檔案實體整理4人,在網絡環境下實行集中辦公和流水作業。
(三)數字化成本降低,數字化速度加快
由于采用高效的組織體系和優化的技術路線,已有20萬件檔案走下流水線。
低成本主要體現在:20萬件檔案緩銷剔出占24.7%,留存檔案占75.3%;留存的75.3%檔案,全文數字化占25.6%,現用現掃占49.7%,比全部掃描節省費用40%以上。同時,三年時間建成數據庫50個,文件級數據庫120萬條(包括20萬件全文);專題數據庫120萬條;照片數據庫2000張;資料數據庫5000條,案卷級目錄數據庫23萬條;現行文件和政府公開信息1萬余件(條)。局域網運行檔案目錄數據260萬余條,20萬件全文;互聯網運行檔案目錄數據120萬條,8萬件全文。完成這樣規模的數據庫建設,全部人工費只有58.4萬元(包括流程團隊檔案干部的工資),經濟成本很低,時間成本很少。
高效率主要體現在:價值鑒定、開放鑒定、數字化篩選、原件掃描、實體整理同步完成,比各項分步做效率高數倍,同時有現用現掃的方法配套,投入少量設備,相當于將20萬件(200萬頁)檔案全部掃描的效果。
(四)利用方式變革,社會效益顯著
為充分發揮網絡優勢,長春市檔案館采取了直接與間接相結合的方法提供利用。
1、直接提供利用:對數字化檔案全文,在局域網內,接待人員利用網絡檢索后直接打印,為用戶提供數字化檔案打印件。在互聯網上提供數字化檔案全文下載、打印服務。并通過CA認證、電子簽名等安全技術,對特定的用戶直接提供加蓋電子簽章的數字化檔案打印件,已有案例。
2.間接提供利用:對目錄數字化檔案,在局域網內,接待人員機檢到檔案后通知檔案庫管人員,檔案庫管人員調出原件全文掃描后,通過網絡打印機直接傳輸打印件,由接待人員提供給用戶。
目前,長春市檔案館基本實現了三個替代:網絡檢索替代手工目錄檢索,查看數字化檔案替代查看紙質檔案,網絡打印替代手工復印。
高效益體現在:檔案全文數字化占館藏檔案的10%,提供數字化檔案占利用率的70%。為上萬人提供了檔案證明,公眾成為檔案數字化的最大受益者。檔案數字化成果得到社會公眾,上級檔案和信息化部門,當地黨委、政府,國內外同行的普遍贊譽,數以百計的留言、錦旗、感謝信、獎勵證書、媒體報道就是最好的證明。
檔案數字化解決方案
檔案數字化是指采用掃描儀或數碼相機等數碼設備對紙質檔案進行數字加工,將其轉化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數字圖像或數字文本的處理過程。公司裝備多種掃描設備:高速掃描儀、零邊距掃描儀、寬幅掃描儀、書刊掃描儀,可處理各類紙質文檔。可根據不同文檔的材質、幅面大小及內容,提供不同的電子化掃描及索引(著錄)解決方案,并可根據客戶需求量身制定掃描加工方案。
經驗豐富的實施生產隊伍
自2002年開展數字化掃描加工業務以來,掌握了較全面的專業知識及積累了豐富的工作經驗。
成熟的管理機制、有效的管理控制手段。
嚴謹的質量控制手段,可實現掃描加工過程中各個環節的質量控制和自動化的量化記錄,可確保掃描加工的影像、索引的正確性。
嚴格的客戶財產保全制度及控制手段??纱_保客戶文檔資料、數據在掃描加工服務中的安全性、保密性。
先進、靈活的掃描加工生產系統
公司自主研發的掃描加工生產軟件系統,基于工作流的任務機制,實現流水線式的生產模式,可根據客戶的需求靈活的配置、調整,以適應不同客戶、不同類型文檔的加工任務。包括:文件、檔案、文獻、資料、報紙、書刊、雜志、合釘本、匯編 掃描模式:黑白二值、灰度、彩色 掃描分辨率:150DPI~2400 DPI 保存格式:TIFF、JPG、CEB、PDF等。
掃描加工生產軟件系統針對文件、檔案管理工作的特點,通過集合圖像處理、OCR等多項自動化智能技術,實現處理掃描圖像自動糾偏、除黑邊、去污等處理,實現掃描文件自動命名與裝訂,生成多頁TIF文件,通過OCR識別技術實現電子文件元數據半自動獲取,在大幅度提高掃描加工的工作效率的同時,可以完成電子文件元數據的獲取工作,并在保證掃描圖像文件質量前提下,以最低的容量存儲文件。主要功能介紹
①自動掃描與目錄圖象屬性加工設置;
②自動傾斜校正/去黑邊/去白頁/加粗/A3切割為A4; ③前置處理設置:去斑、亮度/對比度、顏色通道設置; ④自動文件命名;
⑤自動裝訂(將多個單頁TIF文件合并為1個多頁TIF文件),支持固定頁分割、白頁分割、標志按鈕分割;
⑥自動JPG輸出質量設置;
⑦自動掃描頁計數(見主界面掃描計數器),目錄中文件與頁數自動統計。
根據各檔案館(室)在處理歷史檔案問題的經驗,結合我公司圖像處理技術上的優勢,特提出了檔案數字化制作流程及相應的技術參考。
1、檔案分類整理
檔案分類整理是指將案卷按掃描要求進行分解整理,包括原件的拆卷、起釘、粘貼頁撕開。并按掃描后的電子文件組織形成進行分類,以便掃描時的批次處理。
2、檔案交接
分類整理后的檔案按時間先后或其他分類項順序提出,并按實際卷(頁)數填寫詳細的檔案交接清單,并由雙方管理人員簽字。
3、標引著錄
標引著錄為了方便查閱與管理,打印制作檔案目錄及檔案封面,對文字錄入的準確性要求較高,但著錄的文本域并不是完全統一的在某一頁面上,一些文本域要在多個文件中選擇,所以錄入時需要相關檔案管理人員進行指導,制作相應的《文字錄入工作說明書》,確保文本域錄入的準確率。
4、檔案的掃描
原件的掃描與存儲格式完全按照國家檔案管理的統一標準要求掃描。掃描圖像使用先進的圖像掃描處理軟件,掃描人員可根據原稿質量,對系統進行定義,如傾斜校正、去污等批處理功能。在由系統自動處理功能的同時,掃描人員根據原件的實際情況做相應的調整,如超大頁面的處理、紙張顏色深淺及薄厚的處理、掃描時可根據不同原件的情況,調整圖像的分辨率、明暗度以及掃描方式和掃描速度,確保在掃描圖像質量清晰的情況下,使原件完好無損。圖像的分辨率正常情況下為150dpi,如遇字間距和行間距過密、原件本身是復印件等字跡不清楚的情況,可適當增加掃描的分辨率,但要保證圖像清晰的同時,又不影響遠程查詢和瀏覽的速度。
5、圖像處理
檔案數字化制作模塊中的圖像處理采用自動化處理和人工處理相結合的方式,確保圖像質量的完美。通過對圖像進行校對,確保圖像順序正確,在校對時,發現不合格圖像及時返回前一工序進行改正。
1)污漬、黑白、偏斜處理 2)全文字面的掃描密度 3)粘帖頁與表格 4)插頁
5)照片頁的處理
6)存儲格式與面頁空間 分辨率:100-300dpi 圖像格式:TIF、JPG、PDF、CEB 儲存空間:A4,黑白二值,40-50KB/頁
6、質量檢驗
對掃描處理完成后的圖像頁進行檢驗,對檔案拆分、掃描、修正、去污、插圖、照片的處理以及文本和圖像頁的匹配等質量進行全面檢驗。對文本域錄入與文本錄入域的標引、文件的頁號及頁數進行對比,對掃描前圖像頁的標引與掃描后的圖像頁的編號與頁數進行對比,發現不合格的登記清單并退回上一流程重新處理。
7、掛接
文本域錄入和掃描處理檢驗后的圖像成品,由系統自動進行文字圖像與系統的匹配掛接。掛接到檔案數據庫系統中后,進行再次的成品驗收。
8、案卷整理
檔案整理工作嚴格按照國家檔案局規定的相關標準和本單位實際情況進行有序的整理,安排專人負責案卷合并與整理。
9、入庫交接
裝訂還原后的檔案按時間先后或其他分類項順序入庫,并按實際卷(頁)數填寫詳細的檔案交接清單,并由雙方管理人員簽字。
檔案資料是歷史的見證、社會的財富,無論在國內還是國外都對其價值與重要性給予了高度的重視。但是,由于傳統的檔案保存方式一直采用紙張保存和目錄式管理,不僅占用了大量庫房空間,管理成本高,保管時易損壞,如紙張易黃、易粘、易脆,而且查閱、利用非常不便;雖然目前有部分單位使用計算機管理,但其多數是基于目錄級的管理,文檔資料本身仍以紙張形式存在,其管理、查詢與利用仍需要在庫房中進行,因此并沒有解決傳統純粹紙張化文檔資料管理所固有的成本高、效率低、原件容易損毀等問題。
如何安全、有效地管理日益龐大的檔案信息并能滿足快速查詢的需求?建立一套完整的、自動化的、擴展性強的文檔信息管理系統已勢在必行。
一、目前現狀
1.傳統的檔案數據庫中分類信息復雜,需靠手工查詢紙張原件,響應速度慢。
2.由于檔案量巨大,當需要查詢檔案時,需花費幾個小時甚至一天的時間在檔案室查找。耗時、耗力。
3.由于檔案需長期保存,為提高存儲環境,避免可能造成文檔紙張受潮、蟲蝕以及火災等災害,每年大量投
入文檔的保管經費已在所難免,且因無備份而又為每年不得不有的文檔損失擔憂。
4.由于檔案需反復查閱,不可避免的存在原件受損或遺失,給文檔的保管與利用帶來管理上的困擾。
5.在已認知的低檔平板掃描儀錄入的方式下,大量文檔的電子化進程是不可想象和解決的,且大量電子化文
檔如何管理、查閱、應用有待全面解決。
二、解決方案
高速文檔掃描儀:富士通掃描儀 E-DOCscan 文檔自動掃描軟件
MaxAttach NAS 4000存儲器
服務器:自選
數據庫:SQL或Oracle 大型數據庫軟件
軟件:數字化檔案管理軟件
操作系統: 服務器端 Windows2000Server+IIS5.0 以上
客戶端 Windows9X+IE5.0 以上
其它設備:打印機、條碼打印機等
檔案數字化方案制定與實施 長春市檔案局 梁 偉 李學廣
館藏傳統載體檔案數字化的問題,許多地方檔案館進行了實踐,積累了一定的經驗,對全國檔案數字化建設起到了推動作用。但是,總結以前我國檔案數字化建設的不足和失誤,往往不是信息技術支持不夠,而是絕大多數都知道搞數字化,但檔案數字化目的是利用的主題不突出,忽略檔案開放鑒定與數字化檔案利用的邏輯關系,對先剔除無用檔案后開展數字化的思路不明確,沒很好研究檔案數字化的整體效果就大張旗鼓地做起來了。進而出現數字化目錄數據和全文數據不對應、找不著或不好用等問題不少,檔案數字化的量雖多,但能上網利用或者說能上互聯網利用的很少,數字化返工的現象比較突出,使有限的資金投入并沒有體現在數字化檔案的利用效益上,這一點已引起檔案系統管理和技術高層領導的重視,許多實踐工作者已開始進行有益的探索。
面對網絡時代公眾迫切需要遠程、公開、快捷的檔案信息,面對館藏浩瀚如海的案卷,面對當前我國檔案數字化需要解決的一系列問題,長春市檔案館與中國人民大學信息資源管理學院共同承擔了國家檔案局科技項目《檔案數字化方案研究》。該項目經過課題研究人員的共同努力,已取得初步研究成果。通過課題研究,對檔案數字化方案的研究提出了一些觀點和看法,大家交流和討論。
一、確定檔案數字化指導思想與原則
檔案數字化指導思想是:以需求為導向,以利用為目的,充分利用計算機軟硬件功能,最大限度發揮人力資源和數字化加工設備能力,保護館藏檔案原件完好,保證數字化檔案真實準確,更好地發揮檔案信息資源的作用。
檔案數字化原則是:遵循重要檔案數字化的價值性原則、常用檔案數字化的實用性原則、開放檔案數字化的開放性原則、褪跡檔案數字化的搶救性原則,解密檔案數字化的及時性原則,目錄數字化與全文數字化分步的時效性原則,檔案數字化加工與利用同步的一致性原則。
二、明確檔案數字化策略
(一)需求導向,急用先上策略
1.需求導向策略
社會需求對檔案利用的影響應該是檔案工作者特別關注的問題。我們用統計數字加以分析。
(1)隨著編史修志工作納入各地工作規劃,1986年全國?。▍^、市)綜合檔案館接待編史修志查檔卷數占利用總卷數的69%。隨著編史修志階段性高潮過去,2003年全國?。▍^、市)綜合檔案館接待編史修志查檔卷數占利用總卷數的28%。下降41個百分點。(此數據來自國家檔案局法規司保存的檔案統計年)(2)隨著社會保障制度的建立和國有企業改革的深入,長春市檔案館查閱工人調配檔案卷數占利用總卷數的百分比,由2002年的1%增加到2004年的占利用總卷數的68%。(此數據來自長春市檔案館利用統計數據庫)由此看出,國家、地方新政策的出臺和工作部署對檔案利用的影響程度。從宏觀上講,檔案利用已實現了兩個轉變,服務重點由政治領域轉變為經濟領域,服務對象由機關干部擴展到公眾百姓,特別是為百姓提供憑證案例急劇上升。用動態觀念研究當前與長遠社會對檔案的需求,并指導檔案數字化與利用服務工程實踐應該是檔案部門的必然選擇。
2.急用先上策略
地方檔案館館藏檔案數量眾多。但并不是所有檔案都在現實中利用,有相當大一部分多年不用。2004年全國?。▍^、市)綜合檔案館檔案平均利用率僅為1.6%。雖然檔案館眾多全宗中當地黨委、政府全宗利用率高是一般規律,但其他全宗利用情況往往和政策、時間的變化而變化,影響更大。所以,各級地方檔案館按照近期利用統計情況和發展趨勢確定數字化的先后順序是科學的選擇,利用優化理論進行檔案數字化篩選,快速反應,突擊完成急用檔案數字化任務,能夠達到更好地發揮檔案作用的目的,實現即時投入使用的預期。(此數據來自國家檔案局法規司保存的檔案統計年報)(二)本級為主,分步實施策略
(1)本級為主策略
根據檔案館職能分工和檔案來源原則,各級地方檔案館永久檔案絕大多數是本級機關形成的,一般都占50%以上,這部分檔案自然是當地檔案館數字化的重點。同時,地方檔案館都保管著大量的上級檔案文件,館際之間上級檔案文件重復是必要的,這些紙質文件來源一般都是上級機關統一印制的。進入信息時代,地方檔案館都面臨著保管的上級檔案文件全文數字化問題,特別是上級檔案文件的開放鑒定審查問題,與其各地分頭審查上級檔案文件開放和進行數字化,不如國家檔案局著手進行檔案全文數字化和開放鑒定分工、協作,向館際共建、共享已有鑒定和數字化成果的方向發展。地方檔案館堅持本級為主的原則,根據需要和可能適時、適量地進行利用頻繁政策性上級檔案文件的全文數字化,以滿足當前工作的急需,盡量減少檔案館多層的重復勞動。
(2)分步實施策略
館藏檔案數字化不可能一步到位,而且檔案室進館范圍檔案陸續進館,進館范圍檔案實施檔案數字化館室共建、共贏、共享的策略非常重要。在具體實施過程中,文件級目錄數據庫建設是最基礎性的工作,是第一位需要建全的,但并一定是文件級目錄數據庫建成后再建其它數據庫。專題數據庫建設是根據現實需要而適時建立。全文數據庫建設是滿足信息檢索需要而必須加快建設的數據庫。
(三)剔除無用,避免浪費策略
1.剔除無用策略
地方檔案館館藏現行檔案主要來自于機關各個立檔單位,其檔案文件進館的決定權掌握在立檔單位文檔人員手里,加之國家檔案保管期限表幾經修改和許多條款至今還比較籠統,所以,不該歸檔的、不該進館的、文件重復的檔案進館頗多。特別是建國超過50年以后,半數左右長期保管的檔案逐年超過保管期的最上限,這些檔案實際上絕大多數已失去保存和利用的價值,但它們仍占據著檔案管理的各種資源。
2.避免浪費策略
面對數字化方法的選擇,剔除無用,避免浪費應該是一種長久策略,把大量失去保存價值的檔案先剔除,避免把無用檔案數字化,再造數字化垃圾。
三、優選檔案數字化技術與業務路線
檔案數字化建設周期長,信息技術又處在快速發展之中,各個檔案館數字化基礎和條件不同。從本館實際出發,優選檔案數字化技術與業務路線特別重要。
(一)計算機新技術與檔案數字化業務的有機結合
信息技術的發展給檔案數字化效率和質量的提高帶來深刻的影響,本著技術為需求服務的理念,無論是利用哪一種檔案管理系統,都要適應檔案數字化流程重組和再造需要,適時進行軟件升級,通過軟件升級固化技術與流程重組與創新,使檔案數字化的效果更好。同時,設計符合國家標準與適應自身需要的數據庫結構,使檔案數字化的過程優化,數字化檔案的利用快捷。
(二)檔案鑒定與數字化同步
鑒定與數字化同步的目的是加快數字化檔案信息的利用。在計算機網絡環境下同步進行檔案鑒定與數字化工作是發展趨勢。這種檔案鑒定是以剔除無用檔案為前提,以鑒定檔案開放為主,按需求篩選全文數字化檔案,為適時提供數字化檔案信息服務打基礎的過程。
(三)檔案數字化與上網利用同步
數字化檔案分開放與不開放兩種。在計算機網絡環境中,在確定檔案開放與不開放的同時,開放檔案即上互聯網。開放與不開放檔案數據在局域網中即時使用。
案字及理程組可
檔數化管流重不能
一次到位,它一個管理思想不斷地變化的過程,適時把新技術和新理念納入進去是非常重要的。
四、細化檔案數字化操作方法
實踐證明,在計算機網絡環境下,檔案數字化和利用服務工程以建立流水作業線,提高工作效率和效益為最佳方式。
(一)優化配置各種資源
檔案數字化建設需要投入,特別是建設初期軟硬件配置投入較大,建成后也要保持一定的運行成本。地方檔案館在具備一定檔案數字化條件的基礎上,要按照成本效益最大化理論,根據不同的情況,進行檔案專業人員和數字化技工人員、計算機和掃描設備的合理搭配,優化檔案數字化各種資源配置,提高檔案數字化建設的投入產出比,構建檔案數字化投入小產
是出大的新模式。
1.計算機網絡環境下檔案數字化與利用服務工程流水線資源配置案例
(二)首先建立文件級目錄數據庫
滿足一般檢索和管理的需要,建好檔案文件級目錄數據庫。目前,絕大多數綜合檔案館,由于沒有實現全部檔案的文件級目錄機檢,查找檔案不快、不準、不全的問題普遍存在。另外,檔案的統計單位主要是卷和延長米,而檔案的最小單位是文件的件數,以件為單位的底數不清是普遍存在的問題。所以,把文件級目錄數據庫建設作為一項基礎性工作,在提高檔案的查全率、查準率的同時,利用計算機實現檔案以件數為基本單位的管理是非常必要的。
1.高度重視文件級目錄數據錄入的前期處理。檔案館的案卷來自各個立檔單位,案卷是由文檔人員在檔案局業務人員指導下形成的。但是,由于文檔人員變動頻繁、檔案業務指導面多線長,案卷質量難以適應計算機精確管理的需要,加之個別文件形成時的先天不足,給文件級目錄數據庫建設帶來許多麻煩。實踐證明,進行文件級目錄錄入的前期處理,拋開原有的文件目錄,按卷內實有文件一一錄入,把題名不反映主題、目錄與實體不符等一系列問題一并處理是非常必要的。
2.科學合理地設計數據庫結構。文件級目錄數據庫結構包含三方面功能為最佳。一是符合國家有關標準及實際情況,文件題名、責任者等滿足文件檢索需要的字段。二是存毀、開放、掃描等數字化加工階段利用的字段。三是數據錄入、校對、鑒定、審查等標明責任的字段。
3.數據質量是數據庫的生命。建立在計算機環境下,以上網公開利用為根本目的文件級目錄數據庫,與紙質文件目錄有本質的區別。紙質文件目錄有問題只有檔案館內部少數人知道,利用者并不清楚。但是,文件級目錄數據庫進入網絡,特別是向社會公開的部分,對數據庫的質量要求是相當高的,數據質量也是當前制約許多數據上網利用的瓶頸之一。
(三)適時建立專題數據庫
滿足特殊檢索需要,適時建立檔案專題數據庫。館藏檔案僅靠文件級目錄數據庫是不可能解決全部檢索問題的。隨著客觀需要的變化,對某一專題檔案有集中利用的需求是經常發生的,突擊建立專題數據庫,滿足社會需求,是檔案館與時俱進的突破口,也是充分發揮檔案作用的最佳時機。主要把握三個方面:一是根據館藏檔案內容確定專題數據庫的總體布局。二是按需求分期建立專題數據庫。三是根據文件內容和檢索需要分別設立不同的專題數據庫結構。
(四)優選建立全文數據庫
滿足信息檢索的需要,建立檔案全文數據庫。按照國家檔案局提出的重點的、利用頻繁的檔案首先實現全文數字化的要求,按照“二八”定律,即以20%的努力達到80%的效果,通過多年檔案利用統計數據分析,優先全文數字化檔案的全宗、年代。在網絡中、在文件級目錄的基礎上同步進行檔案存毀、開放、數字化鑒定與篩選,進而形成與文件級目錄一一對應的全文數據庫,并確保數字化檔案的真實、準確。
(五)檔案數據庫的管理
為了檔案數字化與利用同步和數據安全管理的需要,檔案數據庫分在建數據庫和成果數據庫兩大類。
1.在建數據庫的設立。在建數據庫是為了數字化加工所設立的動態庫,是數據不斷變化的數據庫。例如,設立文件級目錄數據錄入庫,它是每個錄入人員都分配給操作權限的動態庫,屬于在建數據庫。而完成的文件級目錄數據庫則是成果庫。但是,在鑒定及全文數字化加工過程中它又成為全文數字化加工在建數據庫。
2.成果數據庫的使用。成果數據庫只分配使用權限,只有特殊需要時經批準才分配數據改變的操作權限。
3.數據的管理與監督
建立技術負責人、超級管理員、數據管理員連鎖責任制,實行審批者沒有數據操作權,超級管理員只允許分配權限不允許使用數據操作權,數據管理員只有需要時經批準使用數據操作權,用后即刻收回。給予單位領導和相關中層干部全部數據的查看權,每天24小時可以時時對數據質量進行監督,形成數據管理監督新機制。
(六)數字化檔案利用服務工程
數字化檔案利用服務工程是以搞活數字化檔案利用的目的,以局域網、政務網、互聯網為平臺,通過建立數據安全管理制度、網絡安全運行制度和具有法律責任的網管、數據管理員、數字化加工人員、提供利用人員連鎖責任制,環環相扣,從措施上保證數字化檔案的準確。通過防火墻、CA認證、數字水印、電子簽章、權限控制等計算機新技術,從技術上保證數據的安全,利用網絡實現檔案的法律效力,實現遠程為利用者提供快捷、準確數字化檔案的目標。
1.在局域網上應用
在局域網內,檔案在建和成果數據庫所有接待人員都有檢索權限,對只進行目錄數字化的檔案實行現用現掃描全文的方法使之達到已全文數字化的檔案一樣效果,利用網絡技術實現數字化檔案利用替代檔案原件利用、計算機打印件替代復印機復印件、電子簽章替代手工蓋章、接待人員和利用者不接觸檔案原件的目標。從而起到了運用數字檔案高效利用、保護原件的作用。并積累了利用者憑加蓋電子簽章的數字檔案打印件辦理社會保險的成功案例,其數字化檔案的法律效力得到認可,為檔案館參與電子政務開辟了新途徑。
2.在互聯網上應用
利用檔案網站,通過CA證書等安全手段,不但實現了領導遠程數據上傳的審批,主要是開展開放檔案遠程查詢、下載、打印。特別是把CA證書發給立檔單位或使用單位檔案室,為CA用戶遠程提供檔案證明和數字化檔案法律效力的體現,減少異地現場查詢的不便,使檔案館參與電子政務成為現實。
五、加強檔案數字化工作的行政管理
檔案數字化涉及檔案館內部許多部門,加強組織管理工作顯得十分重要,“三分技術七分管理”同樣適合檔案數字化與利用服務工程。各個檔案館涉及檔案數字化加工和利用的內部組織機構設置不盡相同,但應按照效率優先的原則,在計算機環境下,把數據錄入、鑒定、數字化加工、整理、數字化檔案利用形成一個流水線,打破內部行政分工界限是發展趨勢。無論是采取那種組織形式,優化人員組合重新分工在所難免,各個檔案館在組織實施方面有所不同是必然的。
1.加強計劃管理
檔案數字化建設是一項復雜的系統工程, 針對實際的調研和論證,運用科學方法預測,制定科學配置各種資源進行檔案數字化的總體規劃和專項計劃,通過計劃謀求管理系統的外部環境、內部條件、決策目標三者在動態上的平衡,實現管理決策所制定的各項目標。
2.強化組織實施
實施是一個復雜的活動過程,檔案數字化建設又是一項全新的工作,技術含量高,涉及到許多因素,在實施過程中會出現各種各樣的矛盾和困難,會遇到來自各方面的干擾,實施特別強調解決問題的及時性。通過創新行政管理與技術管理相互作用的新機制,實施有效的組織、指揮、協調、激勵工作,保證檔案數字化的計劃目標的順利實現。
3.增強管理的技術含量
檔案數字化的建設過程貴在控制,重在管理。利用計算機進行檔案數字化,任何一個邏輯錯誤,都會給數據的管理和使用帶來麻煩或隱患。在互聯網上公開不真實、不準確的檔案,將在世界范圍內產生不良影響。特別是在網絡環境下的流水作業,上一道工序一定要為下一道工序負責,各道工序工作量的對等與匹配同樣重要,這必然要求行政、技術、質量管理的網絡化。實踐證明,建立數字化進度數據庫、數字化質量反饋庫、檔案利用登記數據庫,給局館領導和相關人員分配使用權限,通過技術手段將全面質量管理思想引入檔案數字化建設,實現全程管理、適時控制,達到強化數字化檔案質量保證體系的目的。檔案數字化與利用服務工程是一項長期的任務,需要從理論上解決的問題很多,需要在實踐中探索的問題也不少,我們將繼續深化研究與實踐。
檔案數字化加工服務
提供紙質檔案數字化加工服務
所謂數字化(digitization)是指用計算機技術將模擬信號轉換為數字信號的處理過程。紙質檔案數字化就是采用掃描儀或數碼相機等數碼設備對紙質檔案進行數字化加工,將其轉化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數字圖像或數字文本的處理過程。紙質檔案數字化的基本原則是使檔案信息資源能準確、方便、快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會或行業對檔案利用的需求。
1、檔案數字化加工的基本原則
1)確定數字化對象應當對所要進行數字化的對象按照一定的原則和方法進行確認,只有符合一定要求的紙質檔案文獻才能進行數字化加工。2)符合國家法律法規紙質檔案的數字化,必須符合國家檔案開放規定或本行業相關規定。3)價值性原則屬于歸檔范圍且應永久或長期保存的、社會利用價值高的檔案可列入數字化加工的范圍。
2、數字化加工流程 紙質檔案數字化加工的基本環節主要包括:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數據掛接、數據驗收、數據備份、成果管理等。
3、數字化建設的目標
數字化建設的目標是使檔案館(室)現有的檔案文件資料全部實現數字化處理,建立健全檔案目錄數據庫、現行文件全文數據庫和多媒體數據庫(照片、音頻、視頻等),通過數據接口和政務辦公系統連通,用先進的數字化檔案管理系統提供安全、高效的管理和利用,實現真正的資源共享。
4、數字化的意義
1)提高工作效率,降低檔案利用成本
數字化加工項目完成后,社會公眾(開放檔案)和單位的各級領導、各部門或下屬單位都能通過數字化檔案管理系統即時查詢利用所需要的電子文檔數據原文(件)信息,避免了傳統檔案利用方法對檔案資料實體的多次輾轉所造成的大量時間浪費和重復勞動現象,從而提高工作效率,降低檔案信息利用的成本。2)最大限度保管和保護庫存檔案實體安全
由于傳統的檔案保存方式一直采用紙張保存和目錄管理,不僅占用了大量的庫存空間,而且利用仍需到庫房,管理成本高,檔案易受損,如紙張發黃、發粘、發脆等。因此目錄級檔案管理并不能從根本上解決檔案原件易損壞等問題。實現檔案數字化管理可以通過權限控制直接在網上查閱打印,減少了對庫存檔案的調閱次數和復印次數,降低了庫存檔案的老化速度,解決了檔案反復借閱利用和檔案保管的矛盾,從而可以最大限度地對庫存檔案進行有效的保管和保護,確保檔案實體安全。3)陽光政務 提升形象
庫存檔案實現數字化、電子化管理,既是各級檔案管理部門貫徹科學發展觀,實施國家檔案事業“十一五”規劃的大事,又是促進檔案管理信息化、現代化的具體舉措;既是實際工作的需要,也是亮點工程。是一項利國利民具有重要意義的事情。數字化項目完成后,不僅檔案管理和利用手段實現了現代化,檔案利用效率大大提高,檔案發揮的作用顯著,還可以大大提升單位形象,符合政府和企事業單位各項工作科學化、規范化、網絡化、信息化的整體發展要求。
廣州依貝盛軟件科技有限公司紙質檔案數字化加工中心,擁有先進的掃描加工設備和專業的掃描隊伍,面向全國用戶單位提供專業文檔影像解決方案和快速高效的加工服務。依靠在檔案資源數字化建設方面的獨特優勢,以及在文檔數字化掃描方面積累的豐富的經驗,對于文檔資料的整理、掃描和提供利用等掃描加工的各個環節,均能夠提供給用戶優質與專業的方案和服務。
加工中心將遵照國家相關的數字化加工標準,按照用戶的需求,提供對紙質文件資料的數據錄入、掃描、條目掛接、壓縮、光盤刻錄、生成查詢與瀏覽系統等業務。
5、服務范圍
廣州依貝盛科技檔案數字化工程事業部嚴格遵守數字化行業標準和保密規定,開展政府公文檔案、國土檔案、城建房地產檔案、醫藥衛生檔案、銀行金融檔案、企事人事檔案、聲像檔案等整理、掃描和數字化加工,涵蓋紙質檔案、照片檔案、縮微膠片、多媒體聲像檔案等形式,為各級各類政府機關、檔案館、城建、學校、醫院、法院、金融、保險、物流等單位提供高品質的檔案數字化服務。
6、檔案數字化工程示意圖
淺論房地產權屬檔案的數字化管理——德陽市房地產管理處
淺論房地產權屬檔案的數字化管理
德陽市房地產管理處
房地產權屬檔案是城市房地產行政管理部門在房地產權屬登記、調查、測繪、權屬轉移、變更等房地產權屬管理工作中直接形成的有保存價值的文字、圖表、聲像等不同形式的歷史記錄,是城市房地產權屬登記管理工作的真實記錄和重要依據,是城市建設檔案的組成部分。
隨著科學技術的發展,以計算機技術為核心的現代信息處理技術正在深入到房地產檔案管理之中,檔案管理以手工管理為主的傳統手段正在發生變化,逐漸向采用現代先進技術手段過渡。通過網絡為支撐的計算機技術,極大地促進了房地產檔案管理模式的重大改變,實現了房地產檔案信息收集、整理、查詢、利用管理的現代化。檔案數字化,其手段就是對檔案實現全文存儲,它在檔案信息管理系統中采用目錄進行管理,把全文信息、圖像信息及其例覽功能集成于目錄數據中進行管理,以目錄數據為檢索人口,從而實現檔案圖文信息的全文檢索,具有查詢速度快、保存期限長、內容全面完整,檔案利用不受時間、地點限制的優點
數字化房地產權屬檔案的建立是對登記發證所產生的產權產籍信息庫的重要完善,登記發證所產生的信息只是數字化權屬檔案庫的檢索條目,即電子目錄,通過該檢索條目,可以不接觸檔案而查閱各種原始資料,全面了解房屋的產權狀況。
一、建立數字化權屬檔案的條件已成熟
目前,國內幾乎所有城市的房管部門都已采用計算機系統進行登記發證,并采用局域網、數據庫技術對登記信息進行管理,但真正全面實現了權屬檔案數字化的地方并不多,其原因除實現權屬檔案數字化還沒有一套完整的標準和規范外,很重要的一點在于受當時技術條件的限制,例如沒有成熟的大容量存儲技術、高速掃描技術、模糊識別技術等。隨著科學技術的日益發展和計算機應用的普及,實現房地產檔案管理現代化的條件已逐步成熟。換成以磁盤、光盤或磁帶為載體的檔案,首先要進行數字化處理,掃描和數字照相是最常用的技術。高速掃描技術能夠實現每分鐘上千頁的雙面掃描,是以前每分鐘只能掃描幾頁的單面掃描技術無法比擬的。數碼相機雖也可以實現檔案快速成像,但對操作人員的技術要求較高,且不易實現程序控制。因此,高速掃描儀的出現,為檔案數字化提供了最現實的手段。
圖像處理技術,要保證數字化檔案圖像清晰、又不能占用過多的存儲空間,以提高在網絡應用中的傳輸效率,必須對掃描圖像進行分析,在不影響效果的前提下自動采用更高效的存儲、壓縮格式,還要實現對圖像的自動識別分類,提高建庫效率;對要求全文存儲。全文檢索的檔案資料,在掃描建庫時,還需用到漢字識別技術。
數字化檔案必須有大容量、高效率的存儲介質,以前,由于技術的限制,硬盤存儲容量小、成本高,因而普遍采用容量大、成本低的光盤庫作為介質。近年來,硬盤技術飛速發展,容量、可靠性均大幅提高,而成本卻下降了許多。目前,專用存儲克服了光盤庫檢索速度慢、機械故障高的缺點。
另外,通過十多年的信息化建設,各地房管部門都培養了一批信息技術方面的專業人才,工作人員的計算機使用技能也大幅提高,各級領導也對本單位信息化建設前所未有地重視,把它作為提高管理服務水平和效率的重要手段,投入了大量人力、物力進行建設。
二、房地產數字化權屬檔案的內容
房地產權屬檔案數字化是指將傳統的以紙張、錄音帶、錄像帶為存儲介質的各種原始檔案資料,通過掃描(數碼攝像)、壓縮、轉化等手段轉換成圖片文件、聲音文件和錄像文件,再運用分級存儲管理技術將圖片、聲音、錄像等文件和索引字段存儲于磁盤、光盤、磁帶等大容量的存儲介質上,并可通過各種方便的查詢手段迅速地檢索出所需要的檔案資料,可以發布到局域網、廣域網、企業內部網、國際互聯網,最終實現“數字化檔案館”。
數字化房地產權屬檔案管理應包括以下內容:
1、目錄管理
目錄管理是指房地產權屬檔案管理機構對歸檔的房地產權屬文件材料進行分類編目,劃分密級,編制檢索工具的工作。由于采用計算機進行登記發證,各地房地產權屬檔案的目錄管理已基本實現了從簿式目錄、卡片式目錄向電子目錄的轉變,產權登記中的房屋所有權人、丘(地)號、房屋坐落(街道名稱、幢號、房號)、房屋平面圖號,他項權登記中的權利人,公、檢、法查封登記中的被執行人、查封凍結標的地址,合同備案登記的合同號、買受人、房屋坐落等條目均可自動生成電子目錄,作為查詢檢索條件,只要定義好電子目錄與圖象庫的數據庫記錄的連接條件,即可根據要求檢索到要求的資料。數字化檔案對目錄管理有特殊的要求:
首先,要提供強大的系統編目功能,工作人員可以根據應用需要生成檔案目錄表,查詢某一件(宗)產權登記的資料,或查詢某一種類型檔案資料,通過編目,可以簡單快速查閱。其次,要便于系統權限的設置,在數字化檔案系統中,電子目錄是檢索查閱檔案資料的唯一人口,根據服務對象的類型,電子目錄應能判斷是否允許用戶進入。另外,還要便于檔案統計,檔案統計是對所有檔案的不同類別的詳細情況做出報表。所有這些都有利于檔案管理人員對檔案管理做出及時有效的決策。
2、檔案數字化
檔案數字化過程即指房地產權屬檔案的收集、整理和歸檔。根據《城市房地產權屬檔案管理辦法》,屬于建檔范圍內的文件材料主要有三類:第一類是房地產權利人、房地產權屬登記確權、房地產權屬轉移及變更、設定他項權利等有關的證明和文件;第二類是房屋及其所占用的土地使用權權屬界定位置圖:房地產分幅平面圖、分丘平面圖、分層分戶平面圖等;第三類是房地產產權登記工作中形成的各種文件材料,包括房產登記申請書、收件收據存根。權屬變更登記表、房地產狀況登記表、房地產勘測調查表、墻界表、房屋面積計算表、房地產登記審批表、房屋滅籍申請表。房地產稅費收據存根等。這些文件材料頁面大小、紙張厚薄、紙質均木一致,掃描建檔中應有人工輔助過程,輔助工作融合到實物檔案的人工整理歸檔的過程中;對于超大頁面,可以采用工程掃描儀掃描,或低成本的數字照相方式;分幅平面圖、分丘平面圖、分層分戶平面圖已實現計算機制圖的,可以直接轉換為位圖格式存儲。如直接存儲矢量圖,查閱時還需要安裝專門的工具軟件,不利于檔案的方便利用,并且歸檔后的資料已不能修改,保留矢量圖已無必要。檔案掃描過程與目錄管理實現無縫連接,省去為文件取名、建立對應關系等多余步驟,提高建檔效率。提高建檔效率在檔案數量龐大的房地產權屬檔案管理部門具有特別重大的意義,即使每頁的掃描建檔時間只節約幾秒,最終對整個工作進度的影響可能是幾個月,甚至上年。掃描圖像的存儲有兩種方式:文件方式和數據庫方式,文件方式雖然簡單易于實現,但在檢索效率和安全性方面都得不到保障,只適合于速度、安全性要求不高的小型檔案庫。即使采用數據庫方式,當檔案數量大時,如幾十萬卷檔案的記錄數就有幾百萬,方案設計時應注意選擇高性能、大容量的存儲系統。
3、檔案管理網絡化
網絡化(包括局域網和互聯網)應用是房地產權屬檔案的利用的主要形式,只有實現檔案管理網絡化,才能真正體現檔案數字化的各種優勢,及時為房地產權屬登記、房地產交易、房地產糾紛仲裁、物業管理、房屋拆遷、住房制度改革、城市規劃、城市建設等各項工作提供服務。實現檔案管理網絡化解決了以前利用檔案的種種不便,可以使檔案利用不受時間和空間的限制,多人同時查詢檔案,不發生沖突。這些功能的實現,讓使用單位提高工作效率,提高檔案信息的共享程度,優化社會資源的配置。
三、數字化房地產權屬檔案管理的原則
數字化檔案作為檔案的一種基本形式既有檔案的基本特征,具有普通檔案不具備的特點,如信息的非人工識別性、對系統設備的依賴性、信息與載體的可分離性、信息的易改性等,因此,數字化檔案的管理有其特殊原則。
l、全程管理是數字化權屬檔案管理的基礎
全程管理是指必須建立一個完整的管理體系,對數字化房地產權屬檔案從產生到永久保存或銷毀的整個生命周期進行全程管理,這是基于信息技術而建立的數字化檔案管理理念,包括檔案管理的規則、方法、質量要求,以及檔案從收集、整理、歸檔、利用各階段活動統籌兼顧,以實現整個系統(軟、硬件及信息)資源的最大共享和最大效益。
2、真實性、完整性是數字化權屬檔案的根本
真實性是指數字化檔案的內容、結構在經過建立、利用后保持不變,與原始狀態一樣,完整性要求記錄房地產權屬登記活動的檔案內容要件齊全,內容。結構及背景信息沒有缺損。真實性、完整性既是一種觀念,又是這種觀念通過技術手段在管理中的體現,需要分別制定真實性、完整性的標準。
3、可讀性是數字化權屬檔案存在的意義
可讀性指檔案經過存儲、傳統、壓縮。加密等處理后仍然能夠以可識讀、可理解的方式輸出,并保持真實性。如不能保證檔案的準確檢索查閱利用,數字化檔案也就失去了存在的價值。保障檔案的可讀性措施應貫穿于全部管理工作的始終,要統一數字檔案的存儲格式、軟件環境,準確保存加密文件的加密、解密方式。
4、安全性是實施數字化權屬檔案的保障
安全性指的是系統硬件和軟件免受自然災害和人為破壞的能力,也指防止房地產權屬檔案的散失、泄密。安全性保障應從制度著眼,技術手段著手,健全安全保密制度,合理設置用戶權限,堅持定期數據備份。
四、對房產管理部門建立數字化權屬檔案的建議
權屬檔案的數字化管理是房地產管理現代化的重要組成,當前正處于起步階段,針對有關實際情況提出幾點建議:
l、房地產權屬檔案的數字化應當建立統一標準。國家檔案局已就電子文件檔案制定了標準,為全國性電子文件管理提供了普通規范。房地產權屬檔案的特性決定了其管理的獨特性,當前已經建立了權屬數字化檔案的地方由于各種原因,沒有統一的規范和標準,有的在建設過程中還走了不少彎路,使用效果也不甚理想,因此,當務之急是建立一套適合于房地產管理的數字化檔案標準,規范和指導各地的權屬檔案現代化工作。
2、房地產權屬檔案數字化管理是一項系統工程,它不可能一蹴而就,必須在總體規劃的指導下,分階段有步驟地實施。數字化過程必須充分考慮到房地產檔案管理部門歷史上形成的數量龐大的存量檔案,以及每年數量急增的新增檔案,分別規劃設計合理的建檔流程。對存量檔案,可以考慮將利用率高、當前有效的權屬登記資料先行建檔,以保證數字化檔案庫能在較短的時間內產生利用價值;新增檔案的數字化過程最關鍵的是不能影響日常正常的登記發證工作,建檔工作可安排在發證后,實物歸檔前進行。
3、培養一批既懂房地產業務,又精通數字化檔案管理的人才。數字化檔案管理是一項跨學科、實踐性較強的工作,這種復合性人才是當前檔案管理中迫切需要的,培養這種人才應當引起重視。
第三篇:檔案數字化方案研究
檔案數字化方案研究
課題組
《檔案數字化方案研究》項目對檔案數字化優化策略與原則、技術路線與支持、流程重組與再造、操作方法與步驟進行了全面的研究,達到了檔案數字化全過程優化和管理系統整體優化的目的,形成了完整的檔案數字化方案和成功的實踐案例。國家檔案局組織的專家鑒定委員會結論是:“該項目基于長春市檔案館以檔案利用為導向、漸進性的檔案數字化實踐,提出了檔案數字化工作的指導思想、優化原則和優化策略,符合國情,符合現代管理理念,對全國各檔案館的相關工作具有較大的參考價值;注重檔案數字化工作與檔案數據庫建設、檔案信息網絡開發的有機銜接,提出了系統優化的技術路線,規劃設計了檔案鑒定與數字化同步、檔案數字化與上網利用同步、多種檔案數據庫建設同步的流程,并成功地付諸實踐,實現了檔案數字化與上網利用的低成本、高效率、高效益。同時,運用CA認證、數字水印、電子簽章等技術,為網上檔案信息資源安全、準確利用提供了技術保證,也為檔案管理部門提供了很好的實踐模式”。該項目獲國家檔案局2006年優秀科技成果二等獎的同時,長春市檔案館被國務院信息化工作辦公室和國家檔案局確定為傳統載體檔案數字化試點單位。
一.檔案數字化的指導思想
以優化理論為指導,以用戶需求為導向,以利用檔案為目的,充分應用計算機軟硬件功能,最大限度地發揮人力資源和數字化加工設備能力,兼顧保護檔案原件的要求,保證數字化檔案的真實可靠,更好地發揮檔案信息資源的作用。
二、檔案數字化的優化原則
實用性原則:針對館藏檔案具備重復利用和緊急利用兩大特點,急用、常用檔案優先數字化是檔案數字化的首選。
開放性原則:互聯網給檔案信息資源共享提供了超越時空的條件,國家民主政治建設和政府信息公開催促檔案解密和開放,開放檔案及時數字化是實現其社會共享的前提。
價值性原則:重要檔案優先數字化具有檔案利用和檔案保護雙重意義,是網絡時代更好實現檔案價值的客觀需要。
搶救性原則:計算機存儲給檔案搶救開辟了了新的途徑,檔案數字化是保護瀕危檔案原件最經濟和便捷的方法。
時效性原則:檔案數字化加工與數字化檔案利用同步實現,是充分利用計算機網絡技術,更好、更快地實現檔案數字化效益的最佳途徑。
三、檔案數字化的優化策略
需求導向策略:社會需求是制定和調整檔案數字化工作策略的“風向標”。匯集多年檔案利用情況統計,把利用頻繁檔案的進行綜合分析,科學地圈定優先檔案數字化的范圍。并建立快速反應機制,執行常用檔案繼續做與急用檔案突擊做的計劃,達到數字化檔案利用即時見效的目的。
本級為主策略:地方檔案館保存的本級永久檔案是數字化的重點。進入信息時代,館際間重復的上級檔案文件,與其分頭進行數字化及開放鑒定,不如發揮中國特色檔案管理體制的優勢,由上級檔案行政管理部門組織,向館際共建、共享數字化、開放鑒定成果的方向發展,盡量減少檔案館多層的重復勞動。
分步實施策略:館藏檔案數字化不可能一步到位,而且隨著時間的推移,檔案室進館范圍的檔案將陸續移交到檔案館,這些檔案采取館室共建、共贏、共享的數字化策略非常有意義。
剔除無用策略:館藏現行檔案是否進館往往由立卷人員決定,加之保管期限表比較籠統,館藏不該歸檔、不該進館、重復檔案頗多。特別是建國超過50年以后,市以下檔案館長期保管的檔案逐年超過保管期的上限。因此,開展檔案價值鑒定,剔除無用,以免再造數字化垃圾,避免資源浪費應是長久的策略。
四、技術路線的優化選擇
檔案鑒定與數字化同步:從利用上講,解決制約檔案信息資源共享的主要瓶頸---檔案開放鑒定問題是當務之急;從成本上講,檔案價值鑒定是避免失效檔案數字化的最佳方法。只有這樣,才能控制檔案數字化投入與產出比例失調、數量很大共享很少的問題。
多種檔案數據庫建設同步:一是首先建立文件級目錄數據庫。滿足一次檢索需要,建好文件級目錄數據庫。目前,絕大多數檔案館,因沒實現全部檔案的文件級目錄機檢,查檔不快、不準、不全的問題不可避免。所以,把文件級目錄數據庫建設作為基礎性工作,是提高檔案查全率、查準率必經之路。二是適時建立專題數據庫。隨著社會發展,對某一專題檔案集中需求時有發生,突擊建立專題數據庫,滿足社會需求是發揮檔案作用的最佳時機。三是優選建設全文數據庫。滿足檔案信息資源開發利用需要,優選建設全文數據庫。按照國家檔案局提出的利用頻繁檔案首先數字化的要求,遵循“二八”定律(即以20%的努力達到80%的效果),同步開展檔案全文數據庫建設。
檔案數字化與上網利用同步:檔案數字化的根本目的是充分發揮其作用。通過計算機網絡技術,實現檔案數字化與局域網上利用同步,開放檔案數字化與互聯網上利用同步。
五.重組和再造的優化流程
為發揮計算機網絡的優勢,重組和再造優化流程的實質,就是對檔案數字化整個工作流程進行系統分析,不但要打破原有業務規程,還要改變行政管理分工,進行全方位的變革。檔案數字化的任何一個細節都會對整體產生影響,輕者降低效率,重者決定成敗。長春市檔案館高度重視每一個細節,再造和優化了上百個流程和內部標準,保證優化技術路線的順利執行。
六.檔案數字化示范案例----長春模式
從2004年開始,長春市檔案館以科研課題為先導,以項目管理為手段,以效益實現為檢驗標準,組建并成功運行檔案數字化工作組織架構、資源配置、數字化加工、上網利用“一站式”流水作業線,探索檔案數字化和網上利用服務工程優化模式,終于闖出一條獨特的檔案數字化之路。
(一)實施三個工程,建立一個團隊
長春市檔案館把信息化帶動作為首位戰略,視為一把手工程、班子工程、全員工程突出抓,并創新管理機制,打破行政分工,在計算機網絡環境下,建立了行政領導、指導專家(技術業務總負責)、專業人員、外聘技工20人的長期流程團隊,并與現有計算機和掃描設備進行合理搭配。該團隊由局(館)黨組直接領導,館技術部門提供支持,管理部門提供檔案,專家提供指導,創立了高效的組織體系,搭建了投入小產出大機制框架。
(二)集中四個環節,堅持流水作業
文件級目錄數據錄入是檔案數字化的基礎,檔案鑒定是檔案信息資源共享的前提,全文數字化是提升檔案服務水平的途徑,整理是檔案文件實體管理主要環節,把上述四個環節集中,是提高工作效率和質量的最佳選擇。長春市檔案館四集中流水線上,目錄數據錄入崗位安排業務和技工7名、檔案鑒定崗位安排5人、檔案數字化加工4人、檔案實體整理4人,在網絡環境下實行集中辦公和流水作業。
(三)數字化成本降低,數字化速度加快
由于采用高效的組織體系和優化的技術路線,已有20萬件檔案走下流水線。低成本主要體現在:20萬件檔案緩銷剔出占24.7%,留存檔案占75.3%;留存的75.3%檔案,全文數字化占25.6%,現用現掃占49.7%,比全部掃描節省費用40%以上。同時,三年時間建成數據庫50個,文件級數據庫120萬條(包括20萬件全文);專題數據庫120萬條;照片數據庫2000張;資料數據庫5000條,案卷級目錄數據庫23萬條;現行文件和政府公開信息1萬余件(條)。局域網運行檔案目錄數據260萬余條,20萬件全文;互聯網運行檔案目錄數據120萬條,8萬件全文。完成這樣規模的數據庫建設,全部人工費只有58.4萬元(包括流程團隊檔案干部的工資),經濟成本很低,時間成本很少。
高效率主要體現在:價值鑒定、開放鑒定、數字化篩選、原件掃描、實體整理同步完成,比各項分步做效率高數倍,同時有現用現掃的方法配套,投入少量設備,相當于將20萬件(200萬頁)檔案全部掃描的效果。
(四)利用方式變革,社會效益顯著
為充分發揮網絡優勢,長春市檔案館采取了直接與間接相結合的方法提供利用。
1、直接提供利用:對數字化檔案全文,在局域網內,接待人員利用網絡檢索后直接打印,為用戶提供數字化檔案打印件。在互聯網上提供數字化檔案全文下載、打印服務。并通過CA認證、電子簽名等安全技術,對特定的用戶直接提供加蓋電子簽章的數字化檔案打印件,已有案例。
2.間接提供利用:對目錄數字化檔案,在局域網內,接待人員機檢到檔案后通知檔案庫管人員,檔案庫管人員調出原件全文掃描后,通過網絡打印機直接傳輸打印件,由接待人員提供給用戶。
目前,長春市檔案館基本實現了三個替代:網絡檢索替代手工目錄檢索,查看數字化檔案替代查看紙質檔案,網絡打印替代手工復印。
高效益體現在:檔案全文數字化占館藏檔案的10%,提供數字化檔案占利用率的70%。為上萬人提供了檔案證明,公眾成為檔案數字化的最大受益者。檔案數字化成果得到社會公眾,上級檔案和信息化部門,當地黨委、政府,國內外同行的普遍贊譽,數以百計的留言、錦旗、感謝信、獎勵證書、媒體報道就是最好的證明
第四篇:檔案數字化建設方案
檔案數字化建設方案
檔案工作的數字化建設是順應潮流,適應時代發展的新舉措、新要求,檔案做為原生的信息資源,其重要性正日益凸顯出來,逐步掌握信息技術為檔案工作服務,為社會主義經濟建設服務,為社會主義精神建設服務。
檔案數字化是數字檔案建設最基礎的工作,傳統載體的檔案經高科技技術加工成數字檔案形式,通過局域網、政務網、互聯網進行計算檢索、閱讀電子檔案,為迎接檔案信息服務新環境的挑戰、提高管理水平、提高效率、增強檔案部門的服務水平、為檔案內部管理及面向客戶服務提供高效率的全面服務。
完整的檔案數字化建設流程包括案卷交接、檔案整理、目錄著錄、檔案掃描、圖像處理、OCR文字識別、數字校對、數字質檢、數據掛接、整理還原、案卷入庫等環節。
業務流程
紙質檔案數字化標準:DA/T31-2005《紙質檔案數字化技術規范》 DA/T18-1999《檔案著錄規則》 1.制訂批次計劃
為在數字化處理過程中對紙質檔案進行有效管理以及對數字化處理進行有效控制,需對館藏檔案的數字化處理分批次進行。2.檔案出庫交接
根據檔案數字化加工批次計劃進行出庫,對出庫的檔案進行完整性檢查。
對通過完整性檢查的檔案,進行數量確認,并詳細登記《資料出庫單》。
確保資料的交接過程中的數量正確性,完整性; 3.目錄著作
按照文件數據庫目錄結構與目錄著錄要求以及《檔案著錄規則》(DA/T18)等標準,規范需要目錄補錄的檔案目錄內容,包括確定檔案目錄的著錄項、字段長度和內容要求等,規范案卷題名、文件名、責任者、起止頁號和頁數等。4.檔案整理
對出庫待加工的檔案進行掃描前處理,使之成為能夠進行掃描的形態。拆除裝訂
影響掃描工作進行的檔案,應拆除裝訂物。資料及檔案內的成冊資料嚴禁拆除。區分掃描件和非掃描件
區分同一案卷(卷、件)中的掃描件和非掃描件。頁面修整
對破損嚴重、無法直接進行掃描的檔案,先期進行技術修復,折皺不平影響掃描質量的原件進行相應技術處理(壓平和燙平等)后再進行掃描。確保較薄紙張(如信紙、便箋紙)、破損紙張、底灰較深(如草漿紙、油印紙)、字跡較淺(如鉛筆字跡)等紙張的狀況較較差的檔案掃描圖像清晰。檔案整理登記
詳細記錄檔案整理后每份文件的起止頁號和頁數等情況。裝訂
掃描完成后,檔案按原檔案保管單位要求進行重新裝訂,保持每頁檔案原有的排列順序不變、案卷不掉頁、右邊和底邊整齊。5.檔案掃描
黑白掃描采用(300dpi)TIFF格式,彩色掃描采用(300dpi)JPG格式。
照片以原色彩為準(600dpi)TIFF格式掃描。保證掃描圖像效果原原件吻合。
大幅面檔案采用大幅面工程掃描儀或小幅面掃描后進行圖像拼接處理。
需要進行OCR文字識別的檔案,掃描分辨率≥300dpi。對資料等成冊材料不宜拆卷的,采用不拆卷掃描儀掃描。核對每件文件的掃描頁碼、頁數與實際的文件頁碼、頁數是否一致。
圖片命名時一定要正確,不能出現圖片顛倒、錯亂等現象。掃描時保證檔案原件不被損壞。6.圖像處理 糾偏
偏斜的圖像進行糾偏處理,傾斜不超過3度,方向不正確的圖像進行旋轉還原,以符合閱讀習慣。去污
圖像頁面中影響圖像質量的雜質如黑點、黑線、黑框、黑邊等進行去污處理。圖像拼接
大幅面檔案進行分區掃描形成的多幅圖像進行拼接處理,合并為一個完整圖像,以保證檔案數字化圖像的完整性。栽邊處理
去除多余的白邊,縮小圖像文件的容量,節省存儲空間。深淺度調整
圖像深淺度不一致時進行修復,保證圖像的深淺度一致。7.OCR識別
運用先進的OCR識別軟件,對掃描的圖像進行文字識別
8.圖像存儲
采用TIFF、JPG格式存儲,存儲時選擇的壓縮率在保證掃描的圖像清晰可讀的確前提下,盡量減小存儲容易為準則。
供網絡查詢的掃描圖像,存儲為PDF文件格式,進行過文字識別的,形成文件文字層。
紙質檔案目錄數字庫中的每一份文件,都有一個與之相應的唯一檔號,以該檔號為這份文件掃描后的圖像文件名。多頁文件可采用該檔號建立相應文件夾,按頁碼順序對圖像文件命名。9.數據質檢
關鍵項檢驗和整理數據質量抽檢。
抽檢工作由專為進行操作,操作結果進行記錄。數據采用全檢方式,合格率要求達到95%以后確保質量。10.數據掛接
運用批量掛接與單張掛接的方式,將目錄庫與圖像庫一一對應起來,并生成索引文件。
匯總掛接
檔案數字化轉換過程中形成的目錄數據庫與圖像數據庫,通過質檢環節確認“合格”后,通過網絡加載到數據服務器終端匯總,實現批量、快速掛接。
數據關聯
以紙質檔案目錄數據庫為依據,將每一份紙質檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件,通過每一份圖像文件的文件名與檔案目錄數據庫中該份文件的檔號的一致性和唯一性,建立起一一對應的關聯關系,實現檔案目錄數據庫和圖像文件的批量掛接。11.數據自檢
建立嚴格的質量檢測體系,對加工的數據進行自檢,自檢必須達到《檔案館紙質檔案數字化驗收標準》的,才能遞交進行驗收。12.數據驗收 目錄數據庫、圖像文件及數據掛接的總體質量。
數據校對員進校對過程不接觸任務紙質檔案,根據掃描的圖像結果來進行校對。
首批數據采用全檢方式
以后批次采用抽檢的方式檢查已完成數字化轉換的所有數據,包括目錄數據庫、圖像文件、數據掛接的總體質量。根據《紙質檔案數字化加工驗收標準》進行檢查。
檔案實體驗收必須逐卷清點,按檔案數量、文件狀況、卷內文件頁數與順序、裝訂要求等進行檢查。13.數據備份
經驗收合格的完整數據及時進行備份。
同一份文件,不跨二片DVD片號
光盤表面標示光盤片編號并注明光盤目錄索引信息
光盤片刻錄完成后,與影像系統檔案進行比對一次,確保檔案資料無遺漏及正確性。14.成果管理
加強對紙質檔案數字化的成果管理,確保安全、完整和長期可用。15.檔案入庫
重新整理后的檔案按照順序返還,對檔案的完整性進行檢查。拆除過裝訂物的檔案按原檔案保管單位重新裝訂,保持每頁檔案原有的排列順序不變。
第五篇:不動產檔案數字化方案3
1、項目背景
在市級政府各部門中,國土資源局(原土地管理局)是設立較晚的一個部門,然而國土資源部門目前承擔的管理職能,使其產生了大量的各類檔案需要管理。傳統縣級國土資源檔案管理采取手工方式,檔案的接收、整理、鑒定、保管、利用、編研等工作都主要以手工為主,這中間包括建立全引目錄本、索引卡等。這種方式工作效率較低,國土資源檔案得不到充分利用。部分國土資源部門的檔案管理信息化采用了一般的條目管理方式的方案,這種方式對于純粹的檔案管理來說促進了檔案管理的現代化,但對于國土資源部門來說,大量的檔案是通過辦事流程產生的,與以檔案館檔案管理模式開發的檔案管理系統在模式上存在顯著的不同。數據格式多樣,給土地歸檔工作帶來了不便,急需把各個部門各個系統的相關數據進行同一歸檔管理。所以建立優質、高效、具有國土資源特點的檔案管理信息化系統,建設國土資源局數字檔案室,不僅從根本上解決傳統手工作業方式所帶來的諸多問題,而且能更好的促進我縣國土資源局信息化建設的快速發展,保障土地檔案信息的有效管理利用,還為今后逐步建立國土電子政務系統打下良好的基礎。通過我公司現場調研統計,這部分檔案包括房管檔案約14萬卷,國有土地檔案8萬卷。由于多方面的原因,國土資源局對于這些檔案一直處于手工管理方式,這部分檔案的查閱利用目前只能采用手工方式查閱,嚴重影響檔案的查閱速度和利用效率;基于上述情況,國土資源局急需對這部分檔案進行規范化整理,在管理方式上,迫切需要由傳統的檔案管理模式向現代化的檔案管理模式轉變,采用電子化管理手段將這些檔案全部數字化保存并用于檔案的查閱,同時也為國土資源局的不動產數據整合提供良好的基礎。
2、建設目標
項目總體目標是:將國土資源局的紙質檔案進行規范化整理,然后進行檔案屬性錄入,完成所有檔案的數字化(內容包括:掃描、圖片處理、數據掛接等工序),建立完整的機讀目錄數據庫和全文數據庫,實現檔案的檢索和全文文件瀏覽,為國土資源局的辦公自動化及公眾提供高效服務,為不動產數據整合提供良好的數據基礎。
3、不動產數字檔案數字工作流程
根據事業單位的規模、人員以及所承擔的業務,其不動產數字檔案數字化主要應包括以下幾個方面的內容:
通過集成高速掃描儀、大幅面圖紙掃描儀、平板掃描儀等采集設備采集紙制文檔資料。經過流水線數字化處理,實現紙制文檔到數字化電子文檔的轉換。
包括國土和房產檔案出入庫登記、數據雙機錄入、文件掃描、影像處理、一次質檢、二次審核,實現文檔數字化流水線作業。完成檔案數字化加工所涉及的全部工作流程。
同時具有流水線定制、任務分配、工作量統計、工資統計等功能。能滿足大批量國土和房產歷史檔案的集中掃描工作。
不動產檔案數字化作業流程圖
4、數字檔案館理論、標準及操作規程建設
標準化、規范化是數字檔案館建設的重要前提和基礎。數字檔案館有關理論、標準、規程,參照《不動產登記數據整合建庫技術規范》(試行)的標準開展,不足部分相應添加,主要包括以下內容:
? 電子檔案管理技術標準 ? 電子文件歸檔與管理規范 ? 文書檔案目錄數據庫交換標準 ? 檔案文件開放控制辦法 ? 檔案資料數字化標準 ? 光盤載體檔案封面標注格式 ? 紙質檔案數字化操作規程 ? 照片檔案數字化操作規程 ? 縮微檔案數字化操作規程 ? 館藏檔案資料數字化范圍
? 數字化加工項目質量保證體系 ? 數字化加工安全保密措施
5、不動產數字檔案數字化數據處理
5.1、數據庫選擇
目錄數據是數字檔案系統館主要的、需要反復查詢的數據,選擇何種數據庫系統管理目錄數據,是我們首先應提出的主要問題。本著節約、實用、通用的原則,建議選用SQLSERVER2000(50用戶以上)數據庫管理系統。其數據庫產品具有穩定性好、安全性強、查詢速度快、投入較低的特點,非常適合作為檔案行業的主數據庫系統。
5.2、服務器選擇
服務器是數字檔案館的關鍵設備,是各個平臺建設的基礎,關系到數據安全、檢索利用速度等多個環節,要求連續不停機運行。按照數字檔案系統規劃,至少應購置2臺較高性能的企業級服務器,一臺用于館內局域網絡系統,支撐檔案信息管理服務; 一個用于支撐數字化加工系統的數據服務,保證流水線作業的穩定運行。
5.3、全文數據信息存儲服務器選擇
數字檔案系統所有數據主要包括以二維數據表方式存儲的目錄數據、各種檔案全文數據(圖像、文本等)和多媒體數據。全文數據是數字檔案館的基礎數據,數據量龐大,要求存儲性能安全、可靠,具有擴展功能。我們建議采用光盤鏡像服務器解決,該服務器采用NAS結構,直接連接在網絡交換機上,且可以擴展以滿足系統今后海量信息存儲的需要,多媒體數據則全部以MPEG2文件方式一式兩套保存在光盤上。
對于需要進行永久數據備份的用戶。則采用Plasmon UDO光盤庫進行永久性數據備份。
5.4、掃描設備選擇
掃描儀主要負責文檔采集端的文件掃描工作。適合性能的掃描設備是保證整個數字化常量的關鍵一環。其主要性能包括最大掃描幅面(A4/A3)、掃描速度(保證日常量)、可靠性(滿足長時間運行需要)、進紙能力、售前、售后支持等。這些性能的選擇主要根據用戶的檔案紙質情況、資金預算情況、項目數字化進度等因素進行綜合考慮。
6、人員培訓和試運行
對相關人員(管理人員、檔案技術服務人員、設備維護人員)進行相應崗位的責任制度人員、加工中心制度培訓、檔案數字化標準培訓、檔案數字化加工崗位操作細則培訓、掃描儀使用培訓、掃描設備維護培訓、檔案數字化加工軟件使用培訓。
調用少量檔案進行流水化作業實際操作培訓,針對操作中常見錯誤錯誤培訓,并實際操作,結合在操作中遇到的問題進行現場培訓。
7、項目穩定運行
采用流水線作業,調用每天需要完成的檔案進行檔案數字化作業,并結合實際操作,完善操作細則,并安排足量的人員進行項目的穩定運行。運行中需要不斷監控數字化作業質量、人員積極性、設備穩定性。保證作業的順利運行。
8、項目驗收
根據檔案技術標準進行數據驗收,可根據項目進度進行階段性驗收,在驗收中總結改進操作規范。直至完成整個項目的驗收。
9、項目總結
對完成的項目進行項目總結,統計數據、分析常量、效率、質量,并總結經驗、改進流程和推廣。