第一篇:基于ITIL的IT運維管理系統概述
基于ITIL的IT運維管理系統概述
基于ITIL的流程框架的IT運維管理系統,能夠快速適應企業業務流程及業務發展變化需求的IT運維管理最佳實踐,能夠幫助企業從人員、技術和流程三個方面提高IT運維管理能力,本文就來為大家介紹基于ITIL的IT運維管理系統。
基于ITIL的IT運維管理系統可以逐步建立并完善、達到以下目標:
標準化——通過ITIL的流程框架,構建最佳實踐經驗的IT運維管理流程。
流程化——把大部分的IT運維管理工作流程化,確保這些工作都可重復,確保這些工作都能有質量完成。
自動化——替企業有效無誤地完成一些日常工作,比如備份,殺毒等。
基于ITIL的IT運維管理系統為用戶解決了哪些問題:
運行維護管理—重要性
事前管理——通過監控系統,及時發現故障隱患,主動的告訴用戶需要關注的資源,以達到防患于未然,事前管理的目的。
迅即的故障報警—全天候自動檢測與及時報警,通過多種告警方式實現網絡的“全天候無人值守”,大大降低管理人員的工作負擔。例:通過短消息告警和遠程客戶端管理的結合,用戶可以在任何地方輕松的管理自己的網絡,解決問題。
ITIL的標榜—IT服務最佳實踐
提供靈活的、流程化的IT服務管理,幫助企業完成流程定義、流程執行、流程監控以及流程的優化。將日常操作全部流程化,并通過自動化工具對流程執行情況進行及時追蹤。
業務流程化、流程自動化、服務規范化
通過流程管理來簡化IT部門繁瑣的業務,把維護人員從救火隊員中解救出來,規范運營管理。本文敘述的IT運維管理系統以ITIL的流程框架,締造一個流程化,自動化和規范化的IT運維管理系統。
以CMDB為運維核心,自動發現資源配置項
CMDB有兩部分重要內容,一是CI,二是CI之間的關系,這兩部分構成了CMDB比較核心的內容,在CMDB初始化方面,很多產品只是提供了手工輸入的方式對CI 的初始化,用戶需要面對大量的需要手工輸入的信息,造成系統使用前的高門檻,而摩卡軟件在這里提供了兩種方式快速進行CMDB的初始化,第一種是自動發現CI,第二種是從Mocha BSM系統中導入,大大簡化了用戶管理員的工作,快速搭建ITIL最佳實踐平臺。
多種渠道新建故障處理請求 為了提交企業各部門所遇到的IT故障處理請求,用戶可以通過自助服務臺、電話通知服務臺、監控系統自動觸發等方式發起故障處理請求。通過自助服務臺用戶可快速新建故障處理請求,并隨時追蹤該故障請求的狀態,如該故障請求是否已經在處理當中,或者已經轉為變更流程,需要繼續通過變更管理才能解決故障等。
知識庫與 FAQ 的緊密結合,IT運維管理經驗的積累,IT運維管理經驗的積累轉入到知識庫中
符合ITIL框架,規范IT部門管理
用戶實施ITIL的一個重要目的就是要規范IT 部門的管理,讓日常運維更加規范化、流程化、自動化,在產品中是通過自動化和流程化來體現管理的規范化的。
客戶化的IT運維管理流程,滿足不同業務需求
流程必須客戶化,產品如何做到呢?兩個層面,第一個層面就是可以方便的在用戶所需要的范圍內進行不同版本流程的切換,第二個層面就是用戶可以方便的通過可視化工具對流程進行定制,不需要二次開發的代碼,只需要簡單的鼠標拖動即可完成流程自定義。
可定制的KPI報表,度量流程執行績效
系統中提供了很多和報表,來度量各個流程執行的績效,報表是用來做統計用的,一般用來做各類別數量的統計或者是變化趨勢的統計,KPI 是經過計算的,衡量各個模塊執行績效的,在首頁上點擊后下面列出的黃色邊框的是報表,而綠色邊框的是KPI。
基于ITIL的IT運維管理系統的相關描述就為大家介紹完了,希望為欲了解此方面信息的讀者提供了參考信息。
第二篇:系統運維工程師工作職責概述
系統運維工程師工作職責概述
1、參與軟件工程系統的設計、開發、測試等過程;
2、協助工程管理人保證項目的質量、保證各業務系統正常運營;
3、解決工程中的關鍵問題和技術難題;
4、還要編寫各種各樣的軟件說明書,如:需求說明書,概要說明書等;
系統運維工程師工作職責21、收集、分析各部門對OAHR系統的需求,結合OAHR系統功能整合解決方案;
2、承擔系統實施和日常運維、監控、數據整理、修正工作,使系統能夠按照需求有效的實施和運行;
3、OAHR表單流程配置;
4、OAHR系統與其他系統的集成方案梳理;
5、上級交辦的其他工作。
系統運維工程師工作職責3
1.負責本公司產品的實施安裝,售后維護,客戶技術支持,對客戶售后技術滿意度負責;
___日常維護,包括:日常系統維護,系統告警處理,系統巡檢及巡檢報告、協助完成客戶要求的工作內容;
3.技術支撐,包括:系統
升級、系統升級方案(區域技術經理協助)、簡單故障處理,故障報告編寫(區域技術經理協助);
4.工程實施,包括:工程實施方案編寫(區域技術經理協助)、工程到貨簽收、現場協助工程隊進行設備上架加電、系統安全加固(區域技術經理、技術支持專家協助)、第三方接口調測等;
5.協助區域技術經理、區域售前進行技術交流,含拜訪式技術交流、正式技術交流等工作;
6.酌情協助商務部經理進行投標,含標書制作、報價單制作、投標分析等工作。
系統運維工程師工作職責41、負責OA系統的實施與維護;
2、負責各類數據庫系統的運維及數據備份,保障相關業務系統的正常運作;
3、對自開發系統的需求收集分析,實施培訓,后期運維等工作;
4、對系統優化的內容進行匯總,優化后進行系統培訓,以及發布優化后的操作文檔;
5、執行上級領導交代的任務。
系統運維工程師工作職責5
1.負責公司業務服務器日常巡檢維護,問題發現與跟蹤;
2.負責各種操作系統、數據庫、中間件應用系統安裝、部署、維護和調優工作;
3.負責系統發布、升級和維護,線上故障迅速響應和解決,協助各種線上問題深入排查定位,保障系統安全穩定不間斷運行;
4.負責協助研發搭建線上線下測試、生產系統環境,安裝部署基礎組件、網絡服務和中間件應用;
5.負責公司網絡設備(包括無線ap、無線控制器、流控、交換機和防火墻)的日常維護和管理,協助公司其他人員辦公、網絡進行支持;
6.負責K8S集群維護;
系統運維工程師工作職責6
1.有基本的硬件網絡、數據庫、操作系統基礎知識;
2.熟悉Linux、Windows操作系統的安裝部署及優化;
3.熟練掌握Linux基礎命令及運維相關的命令工具,能熟練配置用戶及權限;
4.熟練掌握shell腳本語言,能熟練進行腳本/工具開發;
5.熟練掌握MySQL、Nginx、Tomcat、rabbitmq等第三方中間件的安裝部署使用;
6.熟練掌握Zabbix監控系統的功能、安裝及使用;
7.熟悉運維自動化ansible、puppet等運維自動化解決方案;
8.對網絡安全防護有一定了解;
系統運維工程師工作職責7
項目現場系統、公司軟件產品、數據庫的部署安裝與運維;
根據現場環境和項目需求對數據庫和軟件進行配置調試;
參與數據調研與ETL相關事宜;
負責與客戶溝通項目需求,并整理需求反饋回公司;
撰寫項目相關文檔和技術文檔;
負責對客戶進行相關技術的培訓與講解;
第三篇:運維管理系統建設
ITIL提升中國電信運維管理系統建設
ZDNet CIO頻道 更新時間:2008-01-25 作者: 來源:CSDN 本文關鍵詞: 中國電信 ITIL 運維管理
運維管理是電信運營商主要的生產和管理活動之一。運維管理系統建設和運營的好壞直接影響到電信運營的整體成本、管理水平和服務水平。因此,近兩年來,各大電信運營商紛紛對現有的運維系統進行改造。
中國在電信領域的增長速度超過了其GDP增長的速度。正是電信快速的增長,推動了運維系統的發展。如何更有效地利用現有的資源,提高運營維護的工作效率,提高整體服務質量是目前各大運營商面臨的普遍問題。毫無疑問,中國電信在運營維護方面,也面臨相同的問題。建設新一代中國電信運維管理系統,成為解決目前運維管理問題的唯一方案。
根據我們長期在電信領域的實踐,下面的幾點經驗,值得我們在中國電信運維系統的建設中更加關注。
一、采用ITIL作為運維系統的方法論
IT基礎架構庫(ITIL-ITInfrastructureLibrary),被譽為IT服務管理的圣經,其中包含了總結國際大公司在IT服務管理中的經驗并得到證明的IT服務計劃和運營的最佳實踐框架。
ITIL已經為《財富》500強的一些企業所采用,并取得了預期的效果。加特納(Gartner)和國際數據集團(IDC)等世界權威研究機構的調查研究表明,企業通過在IT部門實施最佳服務管理實踐,將因重復呼叫、不當的變更等引起的延誤時間減少了79%,每年每個終端用戶平均節約800美元的成本,同時每項新服務推出的時間也縮短一半。
要成為國際一流的企業,就要吸取國際一流企業的成功管理經驗,借鑒其管理手段。因此,中國電信在運維管理系統的建設,也應確立ITIL在系統建設過程中的方法論地位,吸取ITIL中的成功經驗。
作為眾多國際大型企業成功實踐的積累,ITIL使我們找到了解決運維流程規范的方式和方法。可是,如何更好地運用ITIL這一經典的方法論呢?我們認為應該注意兩點:
1)ITIL是從實踐中得來的精髓,不是僵化的教條,應該結合實際情況去運用ITIL,建立更加適合中國電信的流程規范,而不是照抄照搬。
2)由于ITIL理論博大精深,不可能在短期內在企業中全面實施。應該根據實際情況,選取實施重點,逐步實施,逐步完善。
在中國電信運維系統建設中,應該深入理解ITIL的核心理念,結合電信運維的現狀,解決核心和關鍵問題,逐步實現對運維的科學管理。
二、ITIL理論與實際情況相結合,注重工作流程細節的設計和優化,是系統建設的關鍵
理順工作流程、提高服務效率是新運維系統建設的主要內容之一。
在工作流程的制定過程中,容易陷入以下兩個極端。
1.盲目照搬流程。作為方法論的ITIL,本身含有大量的成功實踐框架。但是,正如前面所說的,ITIL是從實踐中得來的精髓,不是僵化的教條,盲目照搬,只能使得工作流程不切合實際,并流于形式,對系統的貫徹和執行產生不好的影響。
2.完全遵照現有流程,實現其電子化。雖然這樣更符合目前的工作習慣,可能容易為運維人員所接受,但是,仍然解決不了目前運維所存在的一些問題。例如,我們在項目實施中曾遇到“工單在部門之間的重派”的問題。在當前手工作業的工作模式中,各單位將不屬于本單位處理范圍的工單,或部門需要其他部門配合的工單,均提交給故障處理的負責人,由該負責人向其他單位進行轉派和重派。這種處理方式,主要便于手工作業條件下負責人及時了解項目處理狀況。在建立運維系統后,負責人可以通過運維系統隨時了解到故障的處理狀況,每次重派和轉派之前,對負責人的回復變成了一種無效的工作,大大降低了事件的處理效率。如果僅僅將目前的手工作業電子化,那么故障處理的效率仍然沒有得到有效的提高。
因此,將ITIL理論與實際情況相結合,注重工作流程細節的設計和優化,是系統建設的關鍵。
三、樹立主動服務觀念
在現行的運維工作中,我們經常遇到這樣的情況:一方面是運維部門疲于應付各種突發事件,加班加點處理各種重復事件,工作繁重,身心疲憊;一方面是客戶代表不斷抱怨和投訴“技術人員服務水平太低”。二者不可調和的矛盾,是新運維系統要解決的重要問題。
傳統的運維方式給人的印象是:故障發生前,維護人員似乎無所事事;故障發生后,則是手忙腳亂。這就是被動服務給人們留下的印象,運維人員是在被動地等待故障的發生。在新的運維系統中,我們必須改變原有的運維方式,變被動服務為主動服務。
在主動服務模式下,運維人員主動地監控系統的變化,對日常工作及故障處理完成后主動進行問題分析,對系統的變更風險進行評估。在新系統中,可以通過種種技術措施,使得運維工作從被動服務轉移到主動服務,如:增加變更管理流程以防范變更風險。
在日常運維工作中,變更工作是在所難免的。例如,新的系統安全漏洞被公布,為了保證系統安全,就需要安全系統補丁,而這種變更給系統帶來的風險則是難以估計的。例如在安裝補丁后,有時會產生大量莫名其妙的問題。這么一個簡單的例子已經可以說明,如果沒有很好的風險防范手段,系統變更將給我們的日常運維工作帶來大量的問題,后果往往是難以想象的。在新系統中,我們可增加變更管理流程。在變更管理流程中,變更方案需提交變更經理,由變更經理組織由專家組成的變更顧問委員會(CAB)對變更進行風險評估,在評估通過后才能夠進入變更的實施過程。變更管理是防范變更風險的最好辦法。
當然,主動服務是一種理念,在這種理念下,我們可以定義更多的流程,如問題管理流程,對系統中存在的隱患問題進行挖掘,防患于未然。總之,我們應該樹立這樣一個理念,在各流程的定義中進行運用,主動地提早發現系統存在的風險和隱患,減少突發事件的發生。
四、從平臺到業務的全面管理
網絡管理是運維系統的組成部分。對系統的監控也是運維的主要業務之一。以往網管系統實現了對平臺的監控,可是在實際運維工作中,平臺往往只有少數的幾個系統管理員負責,大多數業務人員更多地是面對業務系統。對于業務的監控和管理,是業務人員更加關心的問題。因此,在網管系統中,應加入業務監控的內容。
需要注意的是,業務是建立在平臺的基礎之上的,而不是孤立存在的。因此,監控中,應強調業務監控與平臺監控密不可分的聯系,從業務的角度出發,建立平臺與業務的關聯關系。在故障發生時,應能夠即時描述對業務的影響程度,能夠描述故障的影響范圍。
例如:采集源的某臺交換機產生異常,除了可以看到交換機告警外,我們還應該能夠在業務拓撲圖中直觀看到,采集系統受到影響,同時采集、預處理、分揀等相關業務也不同程度受到影響。其影響程度,能夠通過不同的顏色直觀地展示出來。
只有這樣才能夠更加直觀而全面地反映系統的運行狀態,反映業務的運行情況。能夠幫助運維人員在故障發生時,快速修復關鍵部件,減少故障帶來的損失。
五、建立科學的激勵與監督機制
多年來,系統的使用和推廣問題成為系統能否得到良好運用的一個重要問題。
假設:我們制定了變更管理流程,但是,變更管理沒有被很好地執行,而只是流于形式,則風險的防范也只能是停留在理論上的空談。
在運維系統建設過程中,建立了一整套科學的考核制度,以激勵運維人員更有效地提高服務質量和服務水平,是至關重要的。
對運維人員的考核,并不能就管理論管理,應該從客戶服務的角度出發,以客戶滿意為前提,進行考核。例如,根據每個部門的服務水平,制定了服務時限。假設,某個用戶投訴,需要多個部門協同進行處理。在處理過程中,各部門互相推托,雖然工單在各部門的停留時間沒有超過部門承諾的時限,而整體處理時間已經超過了運營商對該用戶承諾的處理時間。為了杜絕這種現象的出現,我們應該從用戶的角度出發,進行各部門處理時間的分段計算。計算結果將反映在每月故障處理情況的統計報告中,而這些報告直接與各部門、各單位的績效考核掛鉤。
通過這樣的考核機制,形成對員工日常工作的科學評價,既調動了員工積極性,又提高了工作效率和服務質量。
第四篇:運維管理系統方案
運維管理系統方案
概述
伴隨著企事業網絡規模的不斷擴大,企事業服務器的增多,企事業管理的信息化,企事業網絡管理也變的越來越重要。一旦網絡、服務器、數據庫、各種應用出現問題,常常會給企事業造成很大的損失。怎樣能7x24小時檢測網絡系統的運行情況,避免各種故障的發生,改進傳統的網絡管理方式來適企事業信息化發展的需要?
因此,運維管理系統就有他的必要性。一個完備的運維管理系統能夠提供7x24小時檢測網絡、服務器、數據庫、各種應用系統,及時發現將要出現的問題,并通過短信、Email、聲音報告給運維管理人員。運維管理人員就可以及時排除故障,避免造成重大損失。
? ? ? ? ? ? ? ? 運維管理系統的功能:
故障發現與警報;
記錄日常運維日志信息; 服務器故障統計;
服務器軟硬件信息統計; 服務進程管理;
將數據信息存儲到數據庫,并使用圖形方式直觀的展示出來; 權限、密碼管理; 將數據生成報表。運維管理系統的特點: ? ? ? ? ? ? ? 郵件和短信實時故障報警;
B/S結構,能夠通過web對遠程服務器下達指令;
監控服務器和被監控服務器之間通過python socket來發送信息; 統計日常故障處理,以便下次出現同樣故障時能夠更快的解決問題; 實現自動化管理和自動化監控; 安全管理服務器性能; 操作流程統計與管理。
第五篇:IT運維自動化概述
IT運維自動化 概述
目錄 什么是IT運維自動化傳統運維管理方式存在的問題 IT運維自動化迫在眉睫 4 IT運維自動化管理的具體內容 5 IT運維自動化的工具 建立高效IT運維自動化管理的步驟
1.什么是IT運維自動化?
隨著信息時代的持續發展,IT運維已經成為IT服務內涵中重要的組成部分。面對越來越復雜的業務,面對越來越多樣化的用戶需求,不斷擴展的IT應用需要越來越合理的模式來保障IT服務能靈活便捷、安全穩定地持續保障,這種模式中的保障因素就是IT運維(其他因素是更加優越的IT架構等)。
從初期的幾臺服務器發展到龐大的數據中心,單靠人工已經無法滿足在技術、業務、管理等方面的要求,那么標準化、自動化、架構優化、過程優化等降低IT服務成本的因素越來越被人們所重視。其中,自動化最開始作為代替人工操作為出發點的訴求被廣泛研究和應用。
IT運維從誕生發展至今,自動化作為其重要屬性之一已經不僅僅只是代替人工操作,更重要的是深層探知和全局分析,關注的是在當前條件下如何實現性能與服務最優化,同時保障投資收益最大化。自動化對IT運維的影響,已經不僅僅是人與設備之間的關系,已經發展到了面向客戶服務驅動IT運維決策的層面,IT運維團隊的構成,也從各級技術人員占大多數發展到業務人員甚至用戶占大多數的局面。
因此,IT運維自動化是一組將靜態的設備結構轉化為根據IT服務需求動態彈性響應的策略,目的就是實現IT運維的質量,降低成本。可以說自動化一定是IT運維最高層面的重要屬性之一,并且需要與之配套的一系列軟硬件平臺環境及體系。2.傳統運維管理方式存在的問題
目前許多企業的IT運維已經實現從人工運維到計算機管理,但延展咨詢在同客戶的交流中發現其中很多企業的IT運維管理還只是處在“半自動化”的運維狀態。因為這種IT運維仍然是等到IT故障出現后再由運維人員采取相應的補救措施。這些傳統式被動、孤立、半自動式的IT運維管理模式經常讓IT部門疲憊不堪,主要表現在以下三個方面:(1)運維人員被動、效率低
在IT運維過程中,只有當事件已經發生并已造成業務影響時才能發現和著手處理,這種被動“救火”不但使IT運維人員終日忙碌,也使IT運維本身質量很難提高,導致IT部門和業務部門對IT運維的服務滿意度都不高。目前絕大多數的企業IT運維人員日常大部分時間和精力是處理一些簡單重復的問題,而且由于故障預警機制不完善,往往是故障發生后或報警后才會進行處理,,使到IT運維人員的工作經常是處于被動“救火”的狀態,不但事倍功半而且常常會出現惡性連鎖反應。
(2)缺乏一套高效的IT運維機制
目前許多企業在IT運維管理過程中缺少自動化的運維管理模式,也沒有明確的角色定義和責任劃分,使到問題出現后很難快速、準確地找到根本原因,無法及時地找到相應的人員進行修復和處理,或者是在問題找到后缺乏流程化的故障處理機制,而在處理問題時不但欠缺規范化的解決方案,也缺乏全面的跟蹤記錄。(3)缺乏高效的IT運維技術工具
隨著信息化建設的深入,企業IT系統日趨復雜,林林總總的網絡設備、服務器、中間件、業務系統等讓IT運維人員難以從容應對,即使加班加點地維護、部署、管理也經常會因設備出現故障而導致業務的中斷,嚴重影響企業的正常運轉。出現這些問題部分原因是企業缺乏事件監控和診斷工具等IT運維技術工具,因為在沒有高效的技術工具的支持下故障事件很難得到主動、快速處理。3.IT運維自動化迫在眉睫
盡管IT運維管理的技術在不斷進步,但實際上很多IT運維人員并沒有真正解脫出來,原因在于目前的技術雖然能夠獲取IT設備、服務器、網絡流量,甚至數據庫的警告信息,但成千上萬條警告信息堆積在一起更本沒法判斷問題的根源在哪里。另外,目前許多企業的更新管理絕大多數工作都是手工操作的。即使一個簡單的系統變更或更新往往都需要運維人員逐一登錄每臺設備進行手工變更,當設備數量達至成百上千時,其工作量之大可想而知。而這樣的變更和檢查操作在IT運維中往往每天都在進行,占用了大量的運維資源。因此,實現運維管理工作的自動化對企業來說已迫在眉睫。
現在隨著IT運維管理工作的復雜度和難度的大大增加,僅靠過去幾個“運維英雄”或“技術大拿”來包打天下已經行不通了,企業開始需要運用專業化、標準化和流程化的手段來實現運維工作的自動化管理。因為通過自動化監控系統能及時發現故障隱患,主動的告訴用戶需要關注的資源,以達到防患于未然。
例如,全天候自動檢測與及時報警能實現IT運維的“全天候無人值守”,大大降低IT運維人員的工作負擔。而且,通過自動化診斷能最大限度地減少維修時間,提高服務質量。因此, 對于越來越復雜的IT運維來說,將純粹的人工操作變為一定程度的自動化管理是一個重要發展趨勢——
首先,IT運維流程自動化能夠提高流程的可控性,可以基于業務需求來制定個性化的流程,使企業領導有機會看見他們的業務流程,對企業流程有一個深刻的分析和理解,進而改造和優化流程。其次,IT運維流程的自動化能提高透明度。因為隨著業務需求的變化可能會有多個版本出現,手工流程的不透明將會給流程定制和優化帶來相當大的困難,而自動化流程可以使用戶能夠一目了然的看到整個流程的各個節點運轉情況,自動化工具潛移默化地提升業務保障能力。再者,運維系統實行了自動化監控以后,通過工具自動監控對人的工作是一種減負,也是一種降低成本的表現。4.IT運維自動化管理的具體內容
IT運維已經在風風雨雨中走過了十幾個春秋,如今它正以一種全新的姿態擺在我們面前--自動化,這是IT技術發展的必然結果。現在IT系統的復雜性已經客觀上要求IT運維必須能夠實現數字化、自動化維護。
所謂IT運維管理的自動化是指通過將日常IT運維中大量的重復性工作(小到簡單的日常檢查、配置變更和軟件安裝,大到整個變更流程的組織調度)由過去的手工執行轉為自動化操作,從而減少乃至消除運維中的延遲,實現“零延時”的IT運維。
簡單的說,IT運維自動化是指基于流程化的框架,將事件與IT流程相關聯,一旦被監控系統發生性能超標或宕機,會觸發相關事件以及事先定義好的流程,可自動啟動故障響應和恢復機制。
自動化工作平臺還可幫助IT運維人員完成日常的重復性工作(如備份、殺毒等),提高IT運維效率。同時,IT運維的自動化還要求能夠預測故障、在故障發生前能夠報警,讓IT運維人員把故障消除在發生前,將所產生損失減到最低。5.IT運維自動化的工具
對于企業來說,要特別關注兩類自動化工具:一是IT運維監控和診斷優化工具;二是運維流程自動化工具。這兩類工具主要應用于: 監控自動化,是指對重要的IT設備實施主動式監控,如路由器、交換機、防火墻、機房環境監測設備等;
配置變更檢測自動化,是指IT設備配置參數一旦發生變化,將觸發變更流程轉給相關技術人員進行確認,通過自動檢測協助IT運維人員發現和維護配置。
維護事件提醒自動化,是指通過對IT設備和應用活動的時時監控,當發生異常事件時系統自動啟動報警和響應機制,第一事件通知相關責任人。
系統健康檢測自動化,是指定期自動地對IT設備硬件和應用系統進行健康巡檢,配合IT運維團隊實施對系統的健康檢查和監控。維護報告生成自動化,是指定期自動的對系統做日志的收集分析,記錄系統運行狀況,并通過階段性的監控、分析和總結,定時提供IT運維的可用性、性能、系統資源利用狀況分析報告。
6.建立高效IT運維自動化管理的步驟
(1)建立自動化運維管理平臺
IT運維自動化管理建設的第一步是要先建立IT運維的自動化監控和管理平臺。通過監控工具實現對用戶操作規范的約束和對IT資源進行實時監控,包括服務器、數據庫、中間件、存儲備份、網絡、安全、機房、業務應用和客戶端等內容,通過自動監控管理平臺實現故障或問題綜合處理和集中管理。
例如,在自定義周期內進行自動觸發完成對IT運維的例行巡檢,形成檢查報告。包括自動運行維護,以完成對系統補丁的同步分發與升級、數據備份、病毒查殺等工作。(2)建立故障事件自動觸發流程,提高故障處理效率
所有IT設備在遇到問題時要會自動報警,無論是系統自動報警還是使用人員報的故障,應以紅色標識顯示在運維屏幕上。然后IT運維人員只需要按照相關知識庫的數據,一步一步操作就可以。
因此,企業需要事先建立自動工單式流程管理,當設備或軟件發生異常或超出預警指標時會觸發相關的事件,同時觸發相關工單處理流程給相關IT運維人員。IT運維人員必須在指定時間內完成流程所規定的環節與工作,以提高IT運維響應問題的效率。(3)建立規范的事件跟蹤流程,強化運維執行力度
IT運維自動化管理建設時,首先需要建立故障和事件處理跟蹤流程,利用表格工具等記錄故障及其處理情況,以建立運維日志,并定期回顧從中辨識和發現問題的線索和根源。事實上許多實踐也證明,建立每種事件的規范化處理和跟蹤指南,可以減少IT運維操作的隨意性和強化運維的執行力度,在很大程度上可降低故障發生的概率。同時,用戶還應可以通過自助服務臺、電話服務臺等隨時追蹤該故障請求的處理狀態。
(4)設立IT運維關鍵流程,引入優先處理原則
設立IT運維關鍵流程,引入優先處理原則是指要求CIO定義出IT運維的每個關鍵流程,不僅僅是定義流程是什么,還包括要指出每個關鍵流程對企業有什么影響和意義。同時,在設置自動化流程時還需要引入優先處理原則,例行的事按常規處理,特別事件要按優先級次序處理,也就是把事件細分為例行事件和例外關鍵事件。總之,實現IT運維的自動化管理是指通過將IT運維中日常的、大量的重復性工作自動化,把過去的手工執行轉為自動化操作。自動化是IT運維工作的升華,IT運維自動化不單純是一個維護過程,更是一個管理的提升過程,是IT運維的最高層次,也是未來的發展趨勢。