第一篇:電力行業IT運維管理經驗談
電力行業IT運維管理經驗談
在智能電網建設的大環境下,企業信息化將滲透到電網業務價值鏈的各個環節,管理信息化與自動化的結合將更加緊密,技術引領與業務驅動并重,信息化與業務創新將深度融合。電力業務與信息化全面融合信息化一定要和業務密切結合,這是信息化成功與否最根本的前題。包括電力行業在內的很多行業,其信息化成功的關鍵就是把先進的IT技術和IT理念引進來,逐步改善生產流程和生產過程,形成良性循環。
目前,為提高集團的整體競爭能力,大多電力公司在業務和管理上都實行了集團化的整合與變革。在這種大集團為主體的格局下,很多現有的電力信息化網絡也在經歷從縱向分割向整合方向發展的過程,因此,對于電力企業而言,在新一輪信息化建設過程中,更需要考慮如何將信息化與業務緊密結合起來。
實際上,信息系統在監控電網運行情況、采集實時電量、進行電網潮流分析,發揮了不可替代的作用,主要業務和管理工作要全部融入信息化建設的內容之中,如財務系統、電力生產管理系統、電力營銷、CRM,ERP、電子商務等。任何業務部門的信息子系統的開發建設均納入公司統一規劃和統一的平臺之內,實現關鍵軟件、關鍵數據的集中化管理。統一的平臺規劃是一個國際化的大型企業的通行信息化模式,是現代企業高效的必備的信息系統模型。
集成式IT運維管理勢在必行
隨著電力信息化建設的不斷深入,信息化人員要考慮的已不能是面向某方面應用(如財務管理、物資管理、人力資源管理或生產管理)的信息系統建設,而是要站在更高層面上思考信息化如何為企業的集約化管理服務、如何為提高客戶用電滿意度服務、如何為實現資產優化運行服務,因此,建立統一的信息化管理平臺勢在必行。
“SG186工程”是實行集中化管理的一個標志,“1”就是在信息化建設方面要做到統一平臺、統一標準、統一規劃、統一實施,即建立一個一體化企業級信息集成平臺。
具體到IT運維管理方面,就是企業需要一個統一的IT綜合管理平臺,實現統一、集中、全面、分層次的IT運維管理,解決以下三個方面的問題:
一,從電力公司內部管理和領導決策的角度看,各系統大多基于各地市或者是各縣,對省局來說,不方便總部集中管理以及實現對下屬單位的考核。
二,由于電力行業信息化建設較早,各種生產系統、營銷系統、計費系統等應用眾多。眾多的硬件設備、應用系統也有不同的管理工具,但這些系統之間沒有進行資源共享,各種IT系統分散而孤立,造成信息孤島,需要整合在一個綜合管理平臺之上。
三,對于核心的業務系統,如營銷管理系統等,要通過一定的技術手段,使公司領導能夠實時掌握相關業務的精確數據,為決策提供強大的信息支持,充分發揮現有系統的價值,使決策層能夠更好地管理整個公司的運營。
因此,電力企業在考慮引進智能IT運維管理產品時,不妨從上文的三個方面考察市場上的產品與廠商。電力行業是信息化建設較早的行業,始于90年代初期。智能電網的建設可以說是掀起了新一輪的信息化浪潮。但這一輪的信息化已不同于90年代的IT基礎設施建設,而是側重于IT管理,通過集中的IT管理發揮IT系統的最大效率,以信息化促進業務發展。
第二篇:運維管理定義
運維管理(IT Operations Management)幫助企業建立快速響應并適應企業業務環境及業務發展的IT運維模式,實現基于ITIL的流程框架、運維自動化。
核心思想隨著國內企業業務信息化的深入, IT運維部門所負責的IT設備及軟件的運行維護工作變得越來越復雜,技術難度也越來越高。傳統的IT工具和流程集中在技術上,而不是業務目標上。業務服務管理(Business Service Management)使IT能輕松滿足業務的需求,轉變企業的環境,使業務部門和IT部門領導者能夠擁有統一的語言,通過統一的界面面對挑戰,理解新變化所帶來的影響。
BSM主要強調從業務的視角來看待企業的IT運維,從而最大化發揮IT對企業業務的推動作用,這就IT運維的核心思想。
著眼點IT系統的業務服務管理主要著眼點
一、確立以業務價值為核心,業務驅動管理的管理思想面向業務要首先在IT管理的戰略層面上建立“業務驅動”的IT治理和管理思想,使得業務部門的目標和IT運維的目標一致,都是為了企業整體戰略目標的實現,把對業務的支撐能力和管理實效,作為評價IT系統效用和IT部門工作的首要指標。只有這樣,才能在全企業范圍內建立“技術服務于業務發展”的意識和文化,是真正實現IT與業務融合,共同為企業的戰略目標服務。
二、建立關鍵業務服務模型今天的業務部門對應用程序的依賴性比過去更強了。應用程序軟件可以實現關鍵業務流程的自動化 —自動化既包括付款、資金轉賬、下訂單和訂單履行。由于應用程序故障或性能問題可能導致嚴重的業務影響,因此業務部門迫切需要 IT 部門在發生問題時提供更高的應用程序服務級別和更快的問題解決方案。所以,必須結合企業戰略和目前業務運營情況,辨識企業業務服務,特別是關鍵業務應用。為這些核心業務系統服務,建立和企業未來發展愿景、目前IT架構、管理模式等相適應的業務服務模型,能夠清晰地描述業務與IT之間的關聯關系和IT服務的關鍵目標。
三、管理信息共享目前,出于對IT資源專業化、精細化管理的要求,企業部署了諸多的監控管理工具,如網絡監控、系統監控、數據庫監控工具等。一般來說,這些監控工具往往來自于不同的廠商,彼此之間缺乏信息共享的手段。而一個具體的業務是由網絡、主機、應用本身所組成,管理信息無法共享,這就造成了當一個故障出現時,無法通過系統直接自動分析并定位故障點,加大了IT故障的分析難度,降低了解決問題的效率。業務服務管理可以有效整合企業已經構建的眾多IT監控系統,將分散的IT管理信息集中到一個單點的管理平臺中,從而可以快速進行故障定位。
四、根源問題定位隨著企業業務的快速發展,IT環境越來越復雜,IT組件越來越多,同時各組件之間的關聯關系也更加紛亂和復雜。業務服務管理能夠提供有效的根源問題定位能力,它著眼于企業的核心業務系統,通過集中與業務相關的IT信息,根據業務邏輯和IT組件之間的關聯關系進行建模,企業可以在業務模型中的任何一點進行快速的根源問題分析和定位,大大提高了解決問題的速度和準確度。
五、故障影響范圍評估當我們發現IT故障時,我們不僅應該關注故障本身,更應該考慮該故障對業務系統的影響。通過建立業務服務影響拓撲,可以快速的了解企業的關鍵性業務及業務故障時的影響范圍,通過了解企業具體的業務環境,優先處理關鍵故障點。
第三篇:項目運維管理
龍崗區項目運維管理
1、設備應用
1、負責對所有設備的應用操作,每季度提交每個設備的配置和存儲應用情況報告、網絡拓撲報告、IP分配報告,并負責對龍崗區城管局的相關工作人員進行培訓;
2、對新應用的設備需求,駐場工作人員應及時提交設備配置現狀及設備規劃報告,以便該應用能及時實施;
3、掌握設備的運行情況,就保修期、存儲空間等及時進行提醒;
4、建立相關系統軟件各種故障的恢復流程及應急措施;
2、環節與設備
1、定期對機房供配電、空調、溫濕度控制等設施進行檢查記錄
2、做好機房人員的出入、服務器的開機或關機等工作進行記錄;
3、根據維護合同附件資產清單,建立服務器及網絡設備的檔案,形成不易破壞的醒目標識,并定期更新相關內容;
4、對資產清單所列的各種設備、線路等,做好檢查維護工作,發現故障,及時報告,并安排服務聯系或維修,對維修情況提交書面報告;
5、形成每日巡視制度,對機房中相關設備的告警顯示、空調、UPS等實際狀態進行記錄。
3、監控和安全
1、通過IT資源監控系統,對通信線路、主機、網絡設備和應用軟件的運行狀況、網絡流量、用戶行為等進行監測和報警,形成記錄、妥善保存并按重要性級別,定期書面報告;
2、針對網絡運行日志、網絡監控記錄的日常維護和報警信息分析和處理工作,提出優化建議及方案;
3、定期對網絡系統進行漏洞掃描,對發現的網絡系統安全漏洞進行及時的修補
4、定期檢查違反規定上網或其他違反網絡安全策略的行為,書面報告;
5、指派專人進行核心服務器的工作壓力監控,針對業務的增長定期生成主服務器的工作壓力報表,并且預估業務增長對服務器壓力的影響提出合理化建議;
6、指派專人進行核心數據庫的工作壓力監控,定期生成報告,并就改進提出合理化建議。
4、操作系統安全
1、根據甲方業務需求和系統安全分析結果,確定系統的訪問控制策略;
2、定期進行漏洞掃描,對發現的系統安全漏洞及時進行修補;
3、及時安裝系統的最新補丁程序,在安裝前,首先報告同意,且在測試環境中測試通過,并對重要文件進行備份后,方可實施系統補丁程序的安裝;
4、所有對系統進行的維護,均需詳細記錄操作日志,包括重要的日常操作、運行維護記錄、參數的設置和修改等內容,嚴禁進行未經授權的操作;
5、備份與恢復
1、根據印制中心實際應用情況、根據生產相關數據的連接關系、根據應用的業務特點和軟硬件資源,制定詳細的系統數據備份計劃,確定合理的系統備份策略。定期備份重要業務信息、系統數據及軟件系統等;
2、應根據數據的重要性和數據對系統運行的影響,執行數據的備份,每月提交數據備份報告,必要時實施數據恢復;
3、按照控制數據備份和恢復過程的程序,對備份過程進行記錄,所有文件和記錄應妥善保存;
4、定期進行備份介質的維護、更新、替換、輪轉,保證備份介質可靠有效,針對重要備份介質進行雙機房異地輪轉;
第四篇:IT運維管理
IT運維管理
目錄
定義
IT運維管理包含內容
運維員三大法則
在網絡的基礎設施建設完成之后,整個網絡處于運行狀態,IT部門采用相關的管理方法,對運行環境(包括物理網絡,軟硬件環境等)、業務系統等進行維護管理,我們把這種IT管理的工作簡稱為IT運維管理。
IT運維管理包含內容
IT運維是IT管理的核心和重點部分,也是內容最多、最繁雜的部分,主要用于IT部門內部日常運營管理,涉及的對象分成兩大部分,即IT業務系統和運維人員。其管理內容又可細分為七個子系統:
第一、設備管理:對網絡設備、服務器設備、操作系統運行狀況進行監控,對各種應用支持軟件如數據庫、中間件、群件以及各種通用或特定服務的監控管理,如郵件系統、DNS、Web等的監控與管理;
第二、數據/存儲/容災管理:對系統和業務數據進行統一存儲、備份和恢復;第三、業務管理:包含對企業自身核心業務系統運行情況的監控與管理,對于業務的管理,主要關注該業務系統的CSF(關鍵成功因素Critical Success Factors)和KPI(關鍵績效指標Key Performance Indicators);
第四、目錄/內容管理:該部分主要對于企業需要統一發布或因人定制的內容管理和對公共信息的管理;
第五、資源資產管理:管理企業中各IT系統的資源資產情況,這些資源資產可以是物理存在的,也可以是邏輯存在的,并能夠與企業的財務部門進行數據交互;
第六、信息安全管理:該部分包含了許多方面的內容,目前信息安全管理主要依據的國際標準是ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36個控制目標和127中控制方式,如企業安全組織方式、資產分類與控制、人員安全、物理與環境安全、通信與運營安全、訪問控制、業務連續性管理等;
第七、日常工作管理:該部分主要用于規范和明確運維人員的崗位職責和工作安排、提供績效考核量化依據、提供解決經驗與知識的積累與共享手段IT運行維護管理的每一個子系統中都包含著十分豐富的內容,實現完善的IT運維管理是企業提高經營水平和服務水平的關鍵。
運維員三大法則
【此法則適用GPL協議,歡迎各位自由發揮】第一法則,運維員不得危害服務器的安全運行,偷窺篡改服務上的數據,或袖手旁觀服務器受到入侵;第二法則,運維員必須保護自己,除非違背第一法則;第三法則,運維員必須服從運維經理的命令,除非違背第一和第二法則。
第五篇:運維管理要求
運維管理基本要求
1.資源管理
數據中心資源管理所涵蓋的范圍很廣,包括環境管理、網絡管理、設備管理、軟件管理、存儲介質管理、防病毒管理、應用管理、日常操作管理、用戶密碼管理和員工管理等。
1)環境管理
數據中心環境安全管理的重點在于如何根據不同區域的特點使用不同的安全管控和出入原則。對重點的區域可以選用先進的安全設備,使用嚴格的進出管理控制制度進行管理。
2)網絡管理
網絡作為數據中心重要的資源,應制定相關流程予以控制。建議網絡管理流程包括如下管理內容:
(1)網絡拓撲結構:應明確網絡的拓撲結構,創建網絡拓撲結構圖,并在網絡結構變化時及時更新拓撲圖。網絡拓撲結構的變化應有記錄并得到適當的審批,應有專門的人員負責網絡拓撲結構的調整。
(2)網絡的訪問管理:應將網絡劃分為不同作用的網段,例如辦公網、生產網、管理網,公共網絡。規定有權訪問各類網絡的設備和人員,明確網絡接入的申請、審批流程和終止接入的流程,做到網絡接入、終止接入過程受控,有專門的人員負責網絡接入和終止接入的管理工作。
(3)網絡系統日常維護流程:應有專門的工作指引用于指導網絡設備的日常維護,日志的備份、配置信息的備份。
3)設備管理
數據中心的設備管理主要包括對設備的固定資產管理,設備維護管理等。數據中心在起草相關流程文件時應關注以下幾點:
(1)編制設備清單:明確設備的所有者、管理維護人員或部門、開始使用的日期、設備的重要等級等信息。此類信息最好懸掛或張貼于設備上或設備周邊的醒目位置以便于管理。
(2)制訂設備的維護計劃:規定具體設備的維護日期、維護人等信息,并由專人負責按照維護計劃進行維護或聯系、督促服務商執行維護。
(3)將設備按重要等級進行分類:設備按照等級分類,并按不同的設備重要等級制定不同的管理策略,最大限度的確保重要設備的運行。
4)軟件管理
數據中心軟件管理通常需要關注以下三項內容:
(1)計算機系統安裝軟件的管理:對于數據中心的辦公用計算機、監控用計算機和生產用計算機來說,其安裝的軟件應該受到嚴格的控制,避免員工隨意安裝軟件。從軟件管理角度,數據中心應建立可安裝軟件的認證工作,通過對軟件使用的分析建立一張可安裝軟件的清單,對于清單范圍外的軟件不允許安裝。對于監控、生產用的計算機及可連入生產網的計算機,其安裝的軟件需經過認證,并對所安裝的軟件進行記錄,定期檢查是否存在使用其他軟件的情況。
(2)軟件維護及補丁管理:隨著各種利用安全漏洞的病毒和惡意程序的增多,軟件維護和補丁的更新工作也顯得極其重要。對于軟件補丁的安裝管理應做好以下幾項管控工作:補丁的測試、補丁的發放和安裝、版本控制,建議補丁的管理由專人負責。
(3)數據中心軟件許可證的管理:隨著知識產權意識的提高,是否使用有合法許可授權的軟件已經成為越來越多數據中心和客戶關注的問題。軟件許可證的管理要作為數據中心的一項重要工作。其重點在于管理數據中心所擁有的合法軟件許可證,確保在許可證許可范圍內使用軟件,確保軟件的安裝有記錄可查。
5)存儲介質管理
數據中心經常面臨大量的介質管理工作,介質管理工作的成功與否直接影響數據中心的信息安全。一個良好的介質管理工作應包括以下幾方面的內容:
(1)空白介質與有數據介質保存方式的規定:兩種介質分開保存并有明顯標示以示區別,同時應明確介質的保存地點,做到介質統一保存。
(2)應制定統一的介質編號、標示原則:對介質作統一的編號標示,便于介質管理。
(3)有條件時建立介質管理員制度:確保介質的專人管理,可減少介質管理的混亂。
(4)有數據介質的領用查閱應得到控制:介質領用、報廢應有適當的審批過程。應規定清除報廢介質內殘余數據和銷毀處理報廢介質的流程,避免信息泄露。
6)防病毒管理
隨著計算機病毒的日益泛濫,防止數據中心的生產設備、辦公設備受到病毒侵害已經成為數據中心管理中不可缺少的工作內容。防病毒管理流程主要包括以下幾個方面:
(1)防病毒軟件的管理:這里主要包括軟件的安裝、軟件的設置、病毒庫更新,軟件版本控制、定期查殺病毒等。
(2)病毒資訊:安排專人隨時了解病毒最新信息,可能爆發的病毒類型、染毒后現象及對信息系統的影響,查殺方法等,并將這些信息通過定期通告和隨時通報兩種方式提醒數據中心相關人員查防。
7)應用管理
廣義的應用管理包括了數據庫、中間件和應用系統本身在內的所有管理。它是絕大多數IT服務的“靈魂”。對于數據中心而言,挑戰在于要同時管理大量復雜并且相互關聯的應用。
8)日常操作管理
數據中心的日常操作管理主要包括數據中心內部生產系統、辦公系統、動力設備、環境保護、監測系統的數據處理、操作、維護的管理,以及數據中心信息處理設施、基礎設施設備的軟硬件運行情況巡檢等監控工作的管理。
數據中心應該為每一臺設備編制相應的操作工作指引。不建議以服務商或設備制造商提供的使用說明書或技術資料直接作為工作指引使用。工作指引編制應該滿足數據中心實際使用的需要,用于指導操作人員在實際環境下操作設備的各項功能。
建議制定相關的巡檢工作指引,規范數據中心的日常巡檢工作。工作指引應規定巡檢的周期、巡檢項目、判定設備正常的標準、出現異常后的記錄和匯報方式以及事件管理的接口。對巡檢設備及內容做成檢查表,巡檢記錄以表格形式呈現。
9)用戶密碼管理
用戶密碼是數據中心運行的重要信息。用戶密碼的妥善管理可以減少數據中心運行的風險,提高數據中心運行的效率,確保信息的安全。
10)員工管理
員工作為數據中心重要的資源需要進行有效管理。數據中心的員工管理流程應包括:
(1)員工招聘、任用流程。明確員工招聘任用的流程,明確簽訂勞動合同和保密合同的過程。
(2)員工培訓流程。數據中心屬于技術密集型組織。由于IT領域新技術、新產品層出不窮,所以確保員工獲得相關的技術和能力培訓顯得至關重要。應規定員工接受培訓的流程,員工培訓主要包括上崗培訓和日常培訓。
(3)員工離職及崗位調整流程。員工離職或崗位調整后,應完成各種工作交接,并應收回各類技術資料、系統權限、網絡權限、出入證件、門禁系統權限。2.服務支持管理
1)事件管理
事件管理主要管控引起或可能引起服務中斷或服務質量下降的不符合IT服務標準操作的活動。這里的事件不僅包括軟硬件故障,也包括服務請求。當處理多個事件時應根據事件的影響、緊急程度、解決事件的難易決定事件的優先級。如在協議時間內無法解決事件還應考慮事件的升級流程。
2)問題管理
問題管理流程是通過調查和分析IT基礎架構的薄弱環節,查明事件產生的潛在原因,并制定解決事件的方案和防止事件再發生的方案。與事件管理強調處理速度不同,問題管理是強調查處事件的根源,從而制定恰當的解決方案,防止類似事件再次發生。
3)變更管理
變更管理是在最短的中斷時間內完成基礎架構或服務的任何一方面變更的流程。通常情況執行了一個問題管理流程、事件管理流程、服務水平管理流程后,需要通過變更管理實施事件管理流程或問題管理流程所產生的事件處理方案或問題解決措施。
變更管理在施行中應注意通過合理的計劃和周密的準備把中斷業務或服務的時間減少到最小。
3.業務連續性管理和可用性管理
在當今以服務為導向和以客戶為中心的業務環境下,維持數據中心的持續運維對數據中心具有重大意義。尤其在發生災難的情況下如何確保數據中心的持續運作是數據中心管理人員必須關注的問題。
業務連續性管理就是負責數據中心預防災難、增強IT基礎架構在災難發生后的恢復能力的管理流程。它著重確保數據中心在諸如地震、洪水、火災、失竊、恐怖襲擊、網絡攻擊、大范圍停電等災難后盡快恢復運作,減少因數據中心停止運行而帶來的損失。4.服務的資源信息管理
1)信息資產管理
信息資產管理是數據中心實行信息安全管理的重要基礎,通過該工作可以讓數據中心管理者清楚地知道自己的管理對象,以及這些管理對象的重要程度。這里提到的信息資產指的是數據中心內部與信息安全相關的實體與非實體資產。信息資產通常包括:硬件、軟件、數據、文檔、人員、商譽、服務商等。在考慮信息資產管理流程的建設時,需要關注以下幾項內容,包括:識別信息資產、信息資產的分級管理、信息資產清單等。
2)配置管理
配置管理的目標在于,確保只有經過授權的組件才能在IT環境中得到應用,并對所有變更調整實施記錄和跟蹤。在配置管理中最基本的信息單元是配置項,所有的軟硬件和各種文檔,如服務器、環境、設備、網絡設備、臺式電腦、移動設備、硬盤、內存、CPU都可以是配置項。配置管理的流程主要包括配置管理規劃與構建、維護配置數據模型與CMDB構建過程、配置項數據的維護、配置數據的審計等。