第一篇:一個基于ITIL的運維項目介紹總結
IT運維工作是自己工作的一個組成部分,這里就著一個項目的實施經驗,談談ITIL是怎么和具體項目結合落地的。
一、項目介紹
這是一個跨地域的數據采集、傳輸與處理的運維項目,其特點為:
1、1、跨地域廣。覆蓋全國16個省會城市的數據采集點(托管在當地IDC機房),北京城東、西兩個數據處理點,一個位于城中的業務處理與技術支持中心。
2、2、業務要求的穩定性高,7*24服務,RTO與RPO要求高。
3、3、設備種類多。有視頻信號接入設備,機頂盒(由于屬于民用設備,后期統計看該設備的故障最高),由工控機承擔的采集機,PC機做的預處理機,還有存儲服務器,陣列柜,數據庫服務器以及其他網絡設備和傳輸線路等。
4、4、牽扯人員多。包括IDC服務工程師,傳輸服務商,數據中心與業務中心的業務人員,技術人員和管理人員等。
5、5、溝通渠道復雜。每個環節都需要保證暢通的溝通渠道以保證和相關人員溝通信息。二、二、項目目標
在這個項目中本人承擔的角色,對內是IT服務角色,對內部的業務部門提供IT運維支持,對外承擔管理服務商的角色,按與服務商簽訂的SLA進行跟蹤管理。
項目的目標是:建立一個運維體系和信息化平臺,把所有業務環節、服務流程與人員納入到這個平臺中,有效合理的調配資源,及時發現處理重要事件,提高運維效率,提高運維質量從而提高IT服務支持能力,提高用戶滿意度。
結合公司實際運維需求與能力,最終把項目的實施范圍鎖定在“服務支持”流程上,包括服務臺功能,事件管理、問題管理、配置管理、變更管理和發布管理上。不求做的多,但求實用與質量。
三、技術設計
因為是跨地域的使用系統,因此采用B/S系統架構,盡管可能再速度上和表現界面上有些缺陷,但對我們這個應用來說這兩點都不是核心需求。在開發語言上選擇的是.NTE,數據庫選擇是SQL Server,這也是和我們目前產品采用一致的技術路線,方便日后的維護和對接。
服務臺
上次在1中說了項目的背景介紹,在這里開始介紹這個項目是如何實施的。
ITIL從哪里下手?聽到不少人是從“服務臺”來做的。如果按我的理想規劃來說,從“配置管理”做起比較合理,因為配置管理是所有其他模塊的支持核心,它不但對其他模塊的有效執行起到信息支持的功能,同時其他模塊也要及時的變更配置庫以保證配置庫的最新有效狀態。但這個實施的順序是有潛在的適應要求的,對一個從無到有全新的系統,這個順序無疑是正確的方式也容易操作,但具體到我這個項目,因為已經在運行當中,是邊運營邊建設的特點,假如這個時候再教條的從“配置管理”做起,那我將面對的是花費很大精力建立的“配置庫”無流程可以配合使用,因此也會導致無流程維護其內容有效性的境地,這樣的話,等到最后體系都建立完成,就會發現以前建立的配置庫信息都失真無效,還要重新來過的情況。同時,在這個項目上,先做“服務臺”也能立刻對外顯示成果,這個成果確實也是領導需要的,當然也是我需要的。因此最后還是確定從“服務臺”開始了這個運營體系的建設。
在ITIL中,服務臺是有別于其他流程的,它被ITIL定義為“職能”而非“流程”,這也就說明了在我們實現該模塊的時候,是要和其他模塊的實現有區別有不同的。我知道不少人在實際落實上并沒有注意到這點,而是把“服務臺”當成一般流程一樣看待,設計有專門的崗位,人員和流程,這點上我個人有些不同看法。”服務臺”的核心職能是“單點受理用戶事件,提供一般問題的處理支持和跟進事件處理的全過程,及時反饋給用戶”等,這些事情如果照搬普通call center的模式,安排幾個人在接通用戶后,把問題再反饋給后續人員處理,那這個設置是沒什么意義的,也許他是提高了快速響應,但并沒有達到快速處理的目的。有價值的服務臺是能在最短時間內提供有效的方案解決用戶出現的問題,而這需要有專業的知識,這不是普通熱線人員能達到的水平。但假如為達到這個水平而設置一群技術人員專職從事這個事物,那必將導致成本的上升,對我們這個公司來說是沒法支持這個模式的。
因此,在我們這個系統體系下,服務臺就是直接由技術維護人員和具有一定技術能力的業務骨干來充當的,他們各自分管設備和流程的一部分,這些分工信息對用戶是公開的,因此當各自分管的工作出現問題時,用戶直接可以聯系到這些人員以得到及時的幫助,這些人對該事件負責,也負責其他服務臺的職責。在這里可以看出,我并沒有拉出一個團隊組建一個“服務臺”這么一個組織,而是規劃出一個虛擬的“服務臺”團隊,既是一線支持人員也是事件的管理者,當這些人員遇到不能解決的問題時,由他們負責后續的協調組織工作,直到事件處理接觸。
所以,在我的這個運營體系中,“服務臺”是被設計成嵌入在“事件管理”的流程中,成為了這個流程的一部分。對“服務臺”的考核不是一天能受理多少客戶電話,而是有多少客戶需求被滿足。只要流程、制度設計的完善,能完成“服務臺”應該有的職責就可以了,而不必要一定建立一個專職的團隊,尤其是在那些人力資源緊張的情況下。
事件管理 這個管理流程是整個系統最重要也是使用最多的,因此對它的嚴謹性,簡潔性和標準性要求也就比較高。
結合實際項目的運營,我們把事件的起源分為兩大類:主動事件和被動事件。主動事件是我們運維人員等通過內部的檢查機制或者預警機制發現的問題或者發起的事件。被動事件是由系統使用的用戶在使用過程中發現的問題事件和咨詢等。這個分類主要是為了分析評估我們的檢查機制和預警機制的功效。
事件類型被分為:“故障”、“咨詢”、“新需求”和“維護通告”,基本上涵蓋了所有重要的事件。而同時又從事件診斷角度對每個事件進行了分類,包括:電力、信號、網絡傳輸、硬件設備、操作系統、應用軟件、數據庫和業務應用等,這樣細分也是為了日后統計分析,有針對性的制定相關問題解決方案,充實知識庫和CMDB。需要指出的是,這里的分類要考慮到與CMDB的同步,這樣便于兩種數據的互通。
不是所有的事件都要立馬處理解決的,我們按照業務重要性(BIA)的特點和SLA的內容,根據事件的嚴重程度和緊急程度量化事件的嚴重等級。其中嚴重程度參考故障影響范圍(頻道數和流程數等),緊急程度參考RTO和RPO的需求。事件的嚴重等級最后確認為5級,并分別對每個級別做了行動預案,規定了流程、職責和批準關系等。
為了了解事件的實施進展,一個事件的全過程被區分為以下幾個階段:事件創建、事件等待、處理中、解決完畢,評審完畢,事件關閉。每個階段都記錄責任人,起止時間,用以評估每個環節和每個人的工作效率。各個階段的切換必須由一定授權的人員完成,且受時間發起短的服務臺人員的監控下。這里需要特點談一下“評審完畢”的作用,有兩個:一是確認項目當時的分類信息等是否正確,這樣保證以后的統計正確性。二是確認事件是否引發“變更”流程,不論是知識庫還是CMDB,都需要在這個階段確認。一個事件真正意義的結束關閉不是簡單的問題得到解決,一個完整的事件流程是所有對外問題,對內分類、變更的相關流程都完成結束以后。
問題、變更&發布管理
[問題管理] 問題管理是事件管理的后續與推進,這個階段核心目標是把未知名問題轉變為知名問題。問題管理的管理內容很大程度上是來自于事件的統計分析,問題管理的“關注度”其實就是繼承了事件管理的“影響范圍”和“嚴重程度”的結果。在規劃問題管理的時候,其“等級度”這個屬性是要和事件管理的相呼應,這樣也是便于由事件管理到問題管理的平滑過度。不是所有的事件都要轉化為問題來處理,到底該管理什么?一般關注的是“嚴重程度高的事件”和經過統計后“重復出現的事件”,嚴重程度高意味著嚴重度*影響范圍的指標值就打,重復出現的事情的解決可以大大降低維護成本,減少資源,在這兩類問題上花費資源是事半功倍的,別糾結在那些影響不大,或者偶爾才發生的事情上。
問題的創建不象事件,它還需要有個“審批”的過程,這也是確保資源的有效使用,避免過度反應。其次問題管理還和SLA、配置庫、知識庫等相關聯,這在設計問題管理流程以及出入接口的時候應該注意的地方。總體來說問題管理不是ITIL的難點,關鍵要在實際中按設計的流程來執行。
[變更管理與發布管理] 盡管在ITIL中這兩個是分開的獨立流程,但在我們的業務流程中這兩個環節是由一個部門先后順序執行的,沒有在部門這個角度上再區分。本來變更管理的核心并不是執行變更,而是變更需要在一定的授權和控制直下執行。發布的核心也是在一定授權的情況下實施的,以保證最新制定的變更能及時有效正確的部署到實際流程中,如果僵化的分開執行,不但加長了流程部門間的溝通協調工作,還可能導流程事件的延長,導致標準沒有及時下達到實際生產流程中,形成不一致。因此只要在授權上和控制上設計的合適就沒必要一定要兩個流程來分別處理。但所有的變更都要保留歷史和痕跡,這樣有利于跟蹤和職責管理。
變更管理中最重要的是配置庫相關的變更,同時還有就是發布的版本控制問題,變更發布的時間點控制問題,目的是要避免影響正常業務環境。
第二篇:IT運維管理與ITIL
IT運維管理與ITIL
IT運維管理的由來
在企業IT管理的早期,更側重于對網絡、硬件等設備的管理。那時的IT管理就是通過某種方式對網絡進行管理,使網絡能正常高效地運行。早期的這種IT管理是NSM的階段,主要的面向目標就是底層的基礎網絡設備。NSM系統是對網絡中的底層設備進行實時的,統一的監控,當網絡中出現了問題或者即將出現問題的時候,NSM向網絡管理者提出故障定位和報警,這樣做無疑大大方便了網絡管理員的工作。但是,NSM系統對于網絡上運行的各種業務系統以及業務系統的用戶只能做一些簡單的管理,這個時期的IT管理,可稱之為網絡運維管理階段,這時候的IT管理人員稱之為網絡管理員,簡稱網管。
隨著企業IT系統的日益成熟和復雜,企業的關注點已從單點管理到綜合管理角度的轉變,從關注單一網絡到對業務系統的關注。原因在于,越來越多的企業意識到,業務系統涉及環節逐漸增多,單一的網絡運維管理已經不足以滿足管理需求,需要落實如何保障業務系統的各個環節。在滿足對IT資源進行統一管理,降低運行成本、提高突發事件應對能力、提高服務質量和效率的基礎上,更需要保障業務系統的正常運行,才可以保證IT投資的價值體現。同時,在國內IT管理領域,伴隨著用戶IT規模的擴大、IT技術的發展和用戶需求的提高,原有的網絡管理系統已經遠遠不能滿足當前的用戶需求。
因此,當前國內用戶迫切需要一款能夠對整個IT資源進行統一管理,解決IT資源所面臨的種種困難,同時更要做到對業務系統有效保障并提出改進意見的平臺。在這樣一個前提下,IT運維管理的概念和產品被國內知名的網絡運維管理廠商率先推出。可以說,它的出現就是對當前用戶需求的一種有效詮釋。這個時期的IT管理,被稱之為IT運維管理,這時候的IT管理人員稱之為IT運維人員。ITIL與IT運維管理的關系 ITIL誕生于國外,當時是需要針對部門人數眾多,對業務保障要求高的電信、金融等行業的IT和業務進行有序化,透明化的管理,所以誕生了ITIL標準。ITIL標準的核心思想是通過將IT管理流程化,提高工作人員的工作效率,提高IT服務質量,更好的讓IT系統為業務提供服務,從而為業務系統的穩定運行保駕護航。ITIL標準的底層是對IT基礎設施的管理,最上層是對業務系統的流程化管理。
那么,ITIL和IT運維管理到底有什么關系?
就像文章開始說到的一樣,企業最初設定IT部門進行IT管理的目的,就是希望通過IT部門能夠發現和解決各種來自底層基礎設施的問題,從而為保障網絡的正常運轉,為企業提供優質的IT服務。但隨著企業IT系統和業務的不斷發展,企業用戶發現,單純的通過對底層IT基礎設施管理無法解決底層網絡與上層業務系統之間的脫節問題。這也就是ITIL標準當初遇到的問題,最初主要是用來對IT部門的人員進行流程化和規范化的管理的,但它忽視了對底層平臺的管理及對業務系統的保障,脫離了用戶實際需要的ITIL,就像是空中樓閣,高不可及。近年來,為了更加貼近IT運維管理部門的工作需要,ITIL開始與企業的業務系統保障結合起來,形成了所謂BSM的管理模式,目的是使得ITIL能夠更好的為企業的IT運維管理提供服務。
但問題在于,無論從哪個角度來講,ITIL標準僅僅是一套方法論,沒有告訴我們具體的流程該怎么做。而實際上這個流程是建立在對日常IT管理過程中,如何發現問題,如何解決問題的經驗積累的基礎上。但企業要實現ITIL需要的是結果,不會過多的關注這個過程怎么樣。因此,這就需要IT管理的供應商來解決這個問題。那么,怎么發現問題,又怎么解決問題,這就需要通過IT管理供應商提供的IT運維管理系統來解決。通過IT運維管理系統來發現和解決各種來自IT系統的問題,保證企業的網絡和運行在網絡上的業務系統正常運轉。在這個過程中,進行不斷的經驗積累,然后才能在此基礎上實現ITIL的流程化管理。IT運維管理是ITIL標準體系的底層基礎。只有將這個底層基礎搭建完善,才能真正實現在此基礎上流程化管理。當前國內IT運維管理現狀
從IT運維管理的由來和兩者的關系不難看出,當前國內大多數IT服務廠商強調的IT運維管理概念,其實就是在網絡管理基礎之上的拓展,包涵的范圍不僅限于網絡管理,是對整個IT系統和業務所涉及到的范圍進行運維管理。但各IT服務供應商的產品對這個概念的體現不盡相同。至少在目前,實際上它還是網絡管理(或者稱之為IT基礎架構管理)外加部分應用服務管理和業務管理的含義,只是說法不同而已。
國內企業經過多年的基礎設施平臺的搭建和完善,目前對于國內各行業的用戶來說,首要保證的是業務系統的穩定運行,由業務的發展進而推進用戶去進行全面的基于ITIL標準的流程化管理,這是一個循序漸進的過程,是需要分階段分步驟來進行的。
第三篇:基于ITIL的IT運維管理系統概述
基于ITIL的IT運維管理系統概述
基于ITIL的流程框架的IT運維管理系統,能夠快速適應企業業務流程及業務發展變化需求的IT運維管理最佳實踐,能夠幫助企業從人員、技術和流程三個方面提高IT運維管理能力,本文就來為大家介紹基于ITIL的IT運維管理系統。
基于ITIL的IT運維管理系統可以逐步建立并完善、達到以下目標:
標準化——通過ITIL的流程框架,構建最佳實踐經驗的IT運維管理流程。
流程化——把大部分的IT運維管理工作流程化,確保這些工作都可重復,確保這些工作都能有質量完成。
自動化——替企業有效無誤地完成一些日常工作,比如備份,殺毒等。
基于ITIL的IT運維管理系統為用戶解決了哪些問題:
運行維護管理—重要性
事前管理——通過監控系統,及時發現故障隱患,主動的告訴用戶需要關注的資源,以達到防患于未然,事前管理的目的。
迅即的故障報警—全天候自動檢測與及時報警,通過多種告警方式實現網絡的“全天候無人值守”,大大降低管理人員的工作負擔。例:通過短消息告警和遠程客戶端管理的結合,用戶可以在任何地方輕松的管理自己的網絡,解決問題。
ITIL的標榜—IT服務最佳實踐
提供靈活的、流程化的IT服務管理,幫助企業完成流程定義、流程執行、流程監控以及流程的優化。將日常操作全部流程化,并通過自動化工具對流程執行情況進行及時追蹤。
業務流程化、流程自動化、服務規范化
通過流程管理來簡化IT部門繁瑣的業務,把維護人員從救火隊員中解救出來,規范運營管理。本文敘述的IT運維管理系統以ITIL的流程框架,締造一個流程化,自動化和規范化的IT運維管理系統。
以CMDB為運維核心,自動發現資源配置項
CMDB有兩部分重要內容,一是CI,二是CI之間的關系,這兩部分構成了CMDB比較核心的內容,在CMDB初始化方面,很多產品只是提供了手工輸入的方式對CI 的初始化,用戶需要面對大量的需要手工輸入的信息,造成系統使用前的高門檻,而摩卡軟件在這里提供了兩種方式快速進行CMDB的初始化,第一種是自動發現CI,第二種是從Mocha BSM系統中導入,大大簡化了用戶管理員的工作,快速搭建ITIL最佳實踐平臺。
多種渠道新建故障處理請求 為了提交企業各部門所遇到的IT故障處理請求,用戶可以通過自助服務臺、電話通知服務臺、監控系統自動觸發等方式發起故障處理請求。通過自助服務臺用戶可快速新建故障處理請求,并隨時追蹤該故障請求的狀態,如該故障請求是否已經在處理當中,或者已經轉為變更流程,需要繼續通過變更管理才能解決故障等。
知識庫與 FAQ 的緊密結合,IT運維管理經驗的積累,IT運維管理經驗的積累轉入到知識庫中
符合ITIL框架,規范IT部門管理
用戶實施ITIL的一個重要目的就是要規范IT 部門的管理,讓日常運維更加規范化、流程化、自動化,在產品中是通過自動化和流程化來體現管理的規范化的。
客戶化的IT運維管理流程,滿足不同業務需求
流程必須客戶化,產品如何做到呢?兩個層面,第一個層面就是可以方便的在用戶所需要的范圍內進行不同版本流程的切換,第二個層面就是用戶可以方便的通過可視化工具對流程進行定制,不需要二次開發的代碼,只需要簡單的鼠標拖動即可完成流程自定義。
可定制的KPI報表,度量流程執行績效
系統中提供了很多和報表,來度量各個流程執行的績效,報表是用來做統計用的,一般用來做各類別數量的統計或者是變化趨勢的統計,KPI 是經過計算的,衡量各個模塊執行績效的,在首頁上點擊后下面列出的黃色邊框的是報表,而綠色邊框的是KPI。
基于ITIL的IT運維管理系統的相關描述就為大家介紹完了,希望為欲了解此方面信息的讀者提供了參考信息。
第四篇:基于ITIL的醫院IT運維管理實踐
基于ITIL的醫院IT運維管理實踐
標簽: itil 運維 it服務管理 信息系統 流程
摘要:
醫院信息系統的規模日益龐大,復雜程度也越來越高,傳統的、作坊式的醫院IT運維模式已不適應時代的發展。改變原有被動處理問題的工作方式,建立主動服務的管理體系是IT服務組織發展的必然趨勢。本文結合作者的實際工作經歷,圍繞著ITIL實施的核心要素:人員、流程和工具,對傳統醫院IT運維模式的弊端進行了分析,記述了基于ITIL理念對醫院IT部門進行改造、建立全新IT服務體系的方法和步驟,最后對實施效果進行了總結。關鍵詞: ITIL、IT運維 正文:
一、前言
隨著醫院信息化建設逐年深入,醫院信息系統的規模日益龐大,復雜程度也越來越高。醫療業務在享受信息系統提供便利的同時,對信息系統的依賴度也越來越高。信息系統故障不但可能導致醫療業務的中斷,甚至有造成醫療事故的可能。IT部門在日常運維工作中遇到的問題也越來越多樣化,涵蓋了從軟件到硬件、從服務器到桌面PC機、從網絡管理到機房管理、以及信息系統安全等方方面面。因為故障原因復雜,又缺乏有效地IT運維管理方法,不能及時解決問題,常會引起用戶的不滿。所以如何有效的管理IT資源,保障信息系統的可靠運行,提高用戶的滿意度,是醫院IT部門必須面對的問題。
二、傳統的醫院IT運維模式的弊端
傳統的醫院IT運維模式是在信息系統功能單
一、規模較小的環境下形成的,IT部門的員工就像“救火隊員”一樣被動的處理故障,常常存在如下弊端:
1、分工不清
“信息中心的電話沒人愿意接,誰接電話誰倒霉。”這是一個醫院IT圈里流傳很廣的段子,也是許多醫院IT部門的真實寫照。因為電話里多半是這里或那里又有故障報修,無論是硬件故障、網絡不通、還是軟件宕機,對于用戶來說都是“電腦壞了”,故障描述不清,而解決起來也是千頭萬緒,搞不好就要花上半天的時間。大家都忙著做項目,運維工作貌似都要管,其實就是都不管,多一事不如少一事,接電話就成了燙手的山芋。
2、人員短缺
信息中心的工作繁雜且瑣碎,大家除了有新項目要推進,每天處理日常故障還要花上很多時間。IT部門是醫院的輔助部門,又是成本中心,既非主營業務,又不直接產生效益,瑣碎的工作無法量化,就很難在人員錄用上得到上級領導的支持。隨著信息系統一個接一個的上線,IT設備也越來越多,但人員還是那幾個。不但工作壓力越來越大,工作價值還得不到認可,人員短缺問題嚴重制約了信息化的持續發展。
3、重建設輕運維 由于醫院信息化建設逐年深入,業務部門對信息化建設的需求十分迫切,支持新的信息系統上線投用通常是醫院IT部門工作的重點。而上線后的系統運維工作通常仍由原項目實施人員兼顧。在這種運維模式下,一是解決問題完全依賴工程師個人經驗,對問題發生的原因、處理過程,排查分析都沒有記錄,不但沒有避免同類事件再次發生的機制,甚至在同類事件再次發生時,也無法為其他工程師提供解決問題的參照依據;二是沒有監督和跟蹤機制,在繁雜的日常工作中,比較困難的問題常常經過幾次轉手之后就被束之高閣、不了了之了。
4、系統變更風險大
信息系統運行過程中仍需隨著業務的變化做出調整與修改,既包括軟件功能的完善,服務器數據庫的調優,也包括新增網點、添置新的IT設備。在缺少配置信息和文檔管理的情況下,規模較小的系統,問題還容易控制和解決。隨著系統越來越復雜,集成度越來越高,任何一點小的調整都可能牽一發而動全身,造成整個信息系統體系的不穩定。工程師們常說“本來改了個小問題,沒想到改出個大毛病”“需求不改是等死,改了就是找死”
5、IT部門沒有IT系統
醫院的財務部門有收費管理系統、臨床部門有醫護工作站,檢查檢驗科室有LIS、PACS,然而在IT部門不遺余力的推動醫院信息化建設的同時,自身卻還停留在“口耳相傳”的作坊時代:IT設備報警靠人工巡檢、運維工作量無法統計、人員能力沒有考核依據、紙質配置文檔常與實際不符、無法形成有效的知識傳承等,常被醫院IT部門員工們戲稱為“燈下黑”。
由上可見,傳統的醫院IT運維模式已無法支持日益龐大的醫院信息系統。結果就是上線的信息系統越多,出現的問題就越多,解決問題越來越困難,用戶滿意度越來越差。
三、建立基于ITIL理念的IT服務管理體系
ITIL(Information Technology Infrastructure Library,信息技術基礎架構庫)是英國中央計算機和電信局CCTA于80年代中期開發的一套針對IT行業的服務管理標準庫[1],其核心是通過服務臺和10大管理流程,支持IT基礎架構和組織業務的持續運作,通過主動的IT服務管理,保證IT資源的有效利用和業務運作的高可用性、高持續性和高安全性。ITIL是公認的IT服務管理的最佳實踐,在世界范圍內被廣泛應用。
ITIL實施的三要素是人員、流程和工具。10大管理流程包括:事件管理、問題管理、配置管理、變更管理、發布管理、服務級別管理、持續性管理、可用性管理、能力管理、財務管理,涵蓋了IT服務中的各種場景。人員不僅僅指IT運維人員,還包括管理層和最終用戶,強調人的能力、意識和執行力是決定項目成敗的關鍵。工具是指將ITIL流程落地的軟件系統,通過IT服務管理軟件可以使流程的處理步驟更清晰、提高人員的執行力;除此之外,該軟件還應包括IT運行監控系統,將IT設備的運行狀況納入IT服務管理。
圍繞這三個核心要素,根據院區實際情況,我們按照以下思路進行了ITIL實施:
1、以甲方為主的IT運維人員外包
由于醫院是事業單位,人員錄用受編制限制,人員短缺的問題就只能借助外部力量解決了。人員外包雖然有機制靈活、人員技術能力強的好處,但外包人員只是按甲方要求提供被動的服務,缺少對組織的了解和認同感,還需要甲方進行主動管理。因此,我們確立了以甲方為主的外包策略,制定了“與業務關系緊密的崗位不外包”、“只外包工作,不外包責任”的方針,要求外包廠商與原有IT部門工程師按AB角配置,即在各個專業上都有甲乙雙方工程師共同工作:甲方工程師以管理為主,側重方案審核和溝通協調;乙方以解決具體技術問題為主,若現場工程師不能解決,協調二線專家解決。按此原則,經過公開招標,最終與某知名IT服務廠商簽訂了合同,在網絡、主機和桌面運維方面進行了人員外包。
2、從服務臺開始的ITIL流程實施策略
服務臺是整個IT運維體系的核心節點,是用戶與IT部門聯系的統一門戶,所以我們首先設立了統一的IT技術支持電話,在全院范圍內進行了“IT報障打XXXX電話,由服務臺統一跟蹤解決”的宣教,還將IT技術支持電話制作成標簽,貼到每一臺客戶端計算機上,以便用戶撥打。
在工作職責上,要求服務臺人員按照《IT技術支持電話接聽規范》進行電話應答,首先做“過濾器”,對問題進行初步判斷,并嘗試自己解決問題;再做“路由器”,不能解決的再轉到二線;最后做“司令部”,全體人員均須聽從服務臺指令,服務臺當值人員具有絕對權威,可根據自己的判斷要求二線工程師優先處理運維事件。桌面運維崗位由初級工程師擔任,負責處理現場問題。服務臺崗位與桌面運維崗位不定期輪崗,以保證服務臺人員了解現場情況,并具有解決具體問題的能力。二線崗位由資深工程師擔任,分為應用系統、網絡、主機等不同專業方向。對于服務臺和桌面工程師不能解決的問題,由二線工程師跟進研究,并給出解決方案。
3、以事件管理和問題管理為流程驅動
在ITIL的10個管理流程中,事件管理和問題管理是與服務臺關系最密切的,所有的用戶故障報修都通過這兩個流程進行處理的。事件管理的目標是幫助用戶快速恢復業務,為此我們設定了24小時的默認處理時限,若事件不能在規定的時間內處理完成,就需要升級為問題,重點關注解決。事件處理實行首問負責制,第一個接到用戶報修的人,即使將事件派轉出去了,也必須一直跟進該事件單,直至關閉。
問題管理的目標是找到事件發生的潛在原因,我們通過每周工作例會的方式,對尚未解決的問題進行多專業會診,明確責任人和預計解決時間,每周跟進,直到問題處理完畢。對于重點問題,我們還會通過OA系統向相關用戶通報進展,以獲得用戶的理解和支持。
4、以流程的建立和制度的落實來降低風險。
既然信息系統變更是信息系統生命周期中不可避免的環節,那么通過規范化IT管理可以將IT運維過程中系統變更的風險降到最低。配置管理是IT運維管理的數據基礎。其核心是建立CMDB(Configuration Management Database,配置管理數據庫),我們將原來分散在各個項目手中、手工管理的資源,統一錄入了數據庫,既方便運維人員查閱,又能保證信息及時更新。
在此基礎上,我們制定了一系列的制度和流程,保證所有的變更操作都在可控范圍內進行。如:所有服務器操作要求“方案先訂、試驗回退、通知用戶、雙人執行、操作記錄、檢查應用”,所有軟件升級要求事先提出申請,按照《軟件發布及變更操作指導書》進行,保證每次軟件升級都經過了充分的測試,并當發生問題時可以回退。
5、通過工具軟件落地流程的執行
ITIL的實施不但需要流程的設計,還需要工具軟件來落地,為此我們采購了一套ITSM(IT Services Management,IT服務管理)管理軟件,IT部門也借助信息系統提高了工作效率。
首先實施了IT運行監控系統,將機房環境、網絡、服務器、數據庫、客戶端都納入了IT運行監控體系,既減輕了信息中心運維人員的巡檢壓力,又可實時及時全面的掌握信息系統各個環節的運行狀況。然后開始逐步上線IT服務管理系統,針對運維團隊規模較小,緊急事件多的現狀,進行了如下調整:一是在工單填寫項目上進行了精簡,只要描述清楚“什么人、在什么地方、報修什么問題、如何解決”即可,多設置選擇項,少做填空,既提高填寫速度,又便于后期統計分析。二是簡化工單流轉流程,事件執行不做事前審批,而在完成后由事件經理進行審核;緊急事件可不填寫工單立即處理,但應在24小時內補填工單,記錄事件處理過程。
四、效果與思考
通過以上的工作,我院的IT運維工作正逐步走上正軌。通過統一的技術支持電話,大家從繁雜的日常事務中解放了出來;通過明確的分工,使每個人的專長得到了發揮;通過有效的工作組織,IT部門不再單兵作戰,更多的依靠團隊合作解決問題;更重要的是,通過流程的落實,實現了閉環管理,從而在制度上保障了信息系統可靠性。然而我們也意識到,ITIL的落實不是一蹴而就的,特別是對于中小規模的IT組織而言,更不能教條的照搬ITIL的全部流程,而應根據自己工作中遇到的問題,有選擇的實施某些流程或者流程中的某些部分。比如我們在事件處理流程中就減少了大量的審批環節,而進行事后審查。這樣既保證了閉環管理,又提高了工作效率。
在ITIL實施的過程中,改變了大家原有的工作習慣,總會讓人有些不適應,這不但需要實施的技巧,更需要逐步磨合完善;通過一段時間的積累,在ITSM系統中已經積累了大量的事件和問題的處理記錄,通過對這些數據進行分析,不但可以考核每個運維人員工作量,還可以將個體的經驗匯總為知識庫,建立學習型組織,從而實現知識的有效傳承。
通過ITIL的實施,提高了IT部門自身的管理能力,保障了信息系統運行的可靠運行,并提高了用戶的滿意度。但如何量化的評價這些的收益,是深化IT管理的基礎,也是需要進一步思考的問題。
第五篇:基于ITIL的運維管理創新實踐案例
基于ITIL的運維管理創新實踐淺析
——云南電網有限責任公司瑞麗供電局-岳趙君
本期博文主題是關于IT運維管理的實踐應用,博主今天要和大家分享的是云南電網瑞麗供電局的岳趙君發表在2016年第8期《現代工業和信息化》雜志的文章《基于ITIL的運維管理創新實踐淺析》(下文為主要文章內容節選)。
保障系統安全、穩定、高效的運行是信息部門的首要責任。隨著電力企業信息化的發展和完善,應用系統涵蓋了電力企業正常運轉的各個方面。業務系統軟硬件平臺復雜性高、建設及維護周期長、數據備份需求日益增長、IT系統信息安全不容忽視,這些問題都成為了電力信息化發展面前必須解決的問題。因此,創新電力信息化運維管理顯得尤為重要。
一、運維管理現狀
IT系統運維工作一般由技術、人員、流程三個基本元素組成。三個要素之問相互影響、相互制約,共同作用于運維管理工作。目前云南電網有限公司采用集中式的IT運營支撐模式,即:
1)系統集中:隨著CSGII系統已在全省范圍內廣泛使用,實施絕大部分核心IT系統都由省公司CSGII系統來進行建設維護。
2)人員集中:信息部、信息中心負責運維支撐的部門也是公司信息化建設和支撐的核心部門,對全省地市供電局信息化建設提供支撐。
3)流程集中:通過ITSM,IT呼叫中心等系統的實施,建立了全省統一的故障保修、工單審批流程等。
隨著IT集中化運營的發展,以及企業運營對IT系統廣泛應用,運維管理的問題也逐步顯露。如:集中技術維護工作量大、技術難度大、響應時問拖長等,從而造成服務質量下降、用戶滿意度下滑,服務人員往往疲于應付各種問題。顯而易見,在IT集中化運營模式中,服務管理流程的變更已成為目前最需要關注和解決的問題。
二、ITIL的創新實踐
ITIL(IT Infrastructure Library, IT基礎架構庫)是以流程作為導向,服務客戶為中心內容,整合IT服務與企業的業務為手段,提高企業的IT服務能力和水平的一種運維管理方法論。
ITIL的服務管理主要分為兩大部分:一是IT服務支持管理。是基礎性的管理流程,涵蓋了日常運營層面的內容,目的是讓用戶可以順利得到相關的IT服務。同時地是本次實踐創新重要研究的部分,主要有:服務臺、突發實踐管理、問題管理、配置管理、變更與發布管理。二是IT服務提供管理。主要圍繞IT策略過程,更多體現在ITIL在企業運營決策層面的 IT部署,是提高性的管理流程。
ITIL管理理論的創建,有效幫助整合了IT運維管理流程和體系,為IT服務管理建立運營框架。根據ITIL理論,IT服務系統是技術設施、流程和人員等諸多參與因素相互作用的結果。目前我們需要落地理論的關鍵所在是結合企業運維管理的實際狀況,找出IT集中運維模式所面臨的各類問題,進而改進IT服務的輸出質量和流程績效。
結合公司實際情況,建設了一、二、三線技術支撐維護體系。2.1一線運維工程師職責 結合IT呼叫中心建設,組建一線運維工程師團隊,負責ITIL的幫助臺和突發事件管理。提供7*24小時服務熱線電話,全年不間斷接收供電局的需求信息。碰到任何問題和疑問時,立即通知專門服務小組項目經理,由責任人立即啟動一系列預警反應機制,指導和協調下一步的處理工作。
2.2二線工程師職責
組建技術能力強、工作經驗豐富的二線技術支持工程師團隊,負責ITIL的問題管理、配置管理,由于系統的應用復雜性、設備維護的專業性,二線支撐團隊按系統組建,負責分析系統參數、數據、信息,必要時現場收集并處理信息,進行優化的實質性工作。
2.3二線工程師職責
三線工程師主要負責ITIL的變更/發布管理,由于技術專業性要求高,三線的支撐體系主要協調省公司及系統建設集成商、第三方廠商資源進行支持。在結合ITIL和公司自身情況建立起來的三線服務支持體系,需要在合理的需求分析前提下,響應的問題及時的流轉到響應的工程師,這樣問題的響應時時間大幅減少,同時又能做到專業對口、能力匹配,事件處理的效率自然就能大幅度提升。
三、基于ITIL組織框架的運維管理實踐 結合公司信息化建設集中化的建設原則,在供電局成立之日起各種專業的集中式信息系統逐步實施,供電局面臨人員短缺,技術能力跟不上,處理系統事件不及時等問題。
為了解決運維管理中的問題,2013年起供電局在省公司的幫助下開始結合ITIL開始進行運維管理實踐探索,從運維團隊ITIL培訓,三線運維體系建設,ITIL工單化流程梳理等方面進行了深入的探討和全面實施。
2013年初,為了解決事件反映不及時的問題,公司建立了一站式的IT呼叫中心和事件管理流程,安排一線運維工程師7*24小時在線接受問題,并持續培訓用戶,養成用戶有事件撥打IT呼叫中心幫忙電話,通過這一支撐服務前移的項目,取得了明顯效果: 1)接受流程::建立基于ITIL的一線服務平臺、事件管理流程的IT呼叫中心,確定一站式統一事件管理的目標;
2)梳理流程:對維護資源進行了整合調整,創建基于ITIL的一、二、三線的支撐體系; 3)總結流程:對流程關鍵點進行量化,建立了統一的對外服務標準,以及一、二、三線的內部考核指標;
4)從2013年起,經過近2年的實施,已經取得明顯的成效,目前供電局系統可用率、客戶滿意率一直保持在99%以上,顯著提升了供電局的運維管理能力。
四、結語
IT集中化運營模式,是未來信息化發展的趨勢,結合ITIL打造的快速、高效的一、二、三線運維支撐體系是我們為追求高效卓越的運維管理的初次探索,我們也將不斷探索、不斷實踐,全面提升公司的信息化運維管理能力。
如果您在閱讀這篇博文之前,還未認識過ITIL,請來電咨詢上海信息化培訓中心,我們有專門的老師詳細為您答疑解惑;
如果您在閱讀這篇博文時候,已經了解過ITIL,如果想深入實踐,請來電咨詢上海信息化培訓中心,這里不僅有一系列的ITIL課程,而且可以為公司專門定制個性化課程和團訓;
如果您在閱讀這篇博文的時候,已經學習過部分ITIL課程,請來電咨詢上海信息化培訓中心,這里有專門的老師為您解答ITIL高階課程信息!
上海信息化培訓中心(www.tmdps.cn)好課ITIL每月定期開班,咨詢021-62126633-6021.還可以關注微信微博了解最新ITIL發展前沿。
上海信息化培訓中心SITC是中國領先的信息化促進機構,是ITIL的最好殿堂。