第一篇:IT運維管理中可能存在的關鍵問題
IT運維管理中可能存在的關鍵問題
一、IT運維管理可能存在的問題
1.1 IT運維機制不完善,流程操作層面缺乏統一
沒有建立起穩定、規范的IT運維機制。現有的IT運維流程的操作層面缺乏統一。如事件單提交之后,事件預判和優先級的設定缺少統一、規范的指導文檔,僅以人員的主觀經驗或約定俗成的方式指導事件的處理過程。有識別但無規范,有處理但無管理,有人員但忙于救火,有工具但支持力度不足。因此,“輕規范、重維護”的IT運維現狀容易造成因個體技能差異帶來IT運維的不穩定,直接影響維護體系的效果。
1.2 經驗不少,知識不多,過度依賴核心人員
在實際工作中積累的、有價值的經驗僅存在于頭腦之中,未能作為書面的知識記錄規范地保存下來。經驗始終僅能在小范圍內得到傳播和繼承,無法在更大的范圍內體現其價值。這樣導致了無論是事件性質的識別、優先級的界定,還是疑難問題的分析診斷,均匯總至少數核心人員進行處理。這樣不僅增加了少數核心人員的工作量,也容易產生工作流程的“瓶頸”,降低運維團隊整體的事件及問題處理效率。
1.3 IT運維的績效考核機制尚不完善
主觀的績效考核難執行,客觀的績效考核難制定,模糊的績效考核難見效。目前在績效考核方面雖然采用填寫工作表的方式對不同崗位的工作時間進行收集、評測和考核,在一定程度上體現了IT運維人員的工作量情況,但還是很難全面準確的反映IT運維人員真實的工作績效表現。因此,IT運維人員績效考核機制需要進一步完善,幫助組織構建獎懲分明的文化和環境,推動IT運維團隊的良性持續的發展。
1.4 IT基礎架構管理工具欠缺
基于門戶、財務管理、采購管理、人事管理、文件服務等構成了公司的核心業務系統。這些復雜的核心系統保證了整體業務的順暢運行。但作為支撐核心系統運行的IT基礎架構,目前僅有H3C的網絡監控和基于Landesk的桌面管理系統。現有的IT管理工具偏重于技術層面的故障發現及預警,對于發現的事件雖有相應的管理流程匯報,但仍未找到合適的工具為其提供全面、安全、穩定的運行支持。
1.5 缺乏有效、完善的CMDB(配置項管理數據庫)
目前運行維護室僅有對關鍵應用系統相關IT設備設施的初步梳理,雖然在一定程度上收集了部分配置項信息,但是當前僅限于關鍵業務的、缺乏工具支持的、簡單的CMDB建設很難滿足今后全面實施信息化的需求。CMDB的建設是一個長期而艱巨的任務,不僅需要更詳細的配置項屬性數據、更準確的相互關系信息,而且也需要一個科學有效的配置管理模式及工具予以支持。
1.6 缺少面向用戶的IT服務報告 運行維護室對核心系統運行提供固定周期的IT 管理報告,如:系統運行報告、機房環境報告、備份報告、年度報告等等。但由于IT管理報告的內容多以技術語言提交且僅限部門內部和少數領導使用。作為外部用戶的業務部門不僅無法接觸,而且受專業所限難以理解,無法充分利用IT管理報告提供的信息。
在期望從成本中心向利潤中心轉型的過程中,運行維護室面向外部用戶時不能再以技術語言提交IT管理報告,而應該提交符合一般用戶閱讀需要的IT服務報告,實現IT運維的“服務于用戶,為用戶所用”的目的。
二、加強IT運維管理的措施
2.1 建立統一的IT運維管理體系,完善并規范IT運維流程
參照ITIL最佳實踐并結合公司的實際情況,將IT運維管理規范化為一系列標準流程,包括服務臺、事件管理、問題管理、變更管理、發布管理、配置管理和服務級別管理等。然后通過IT服務管理工具將各個IT運維流程集中在同一個平臺上進行管理。基于標準的流程體系和統一的管理平臺,與IT運維相關的資源(包括部門、人員)得以有效整合,并采用相互識別的“相同語言”進行深入、充分的溝通,提高生產效率和信息傳遞的及時性。
2.2 建立基于IT運維管理流程的IT人員績效管理和激勵機制 根據公司全面實施信息化的要求,建議運行維護室組建具備完善的專業知識和管理能力的IT運維管理團隊。因此,建立與IT運維管理流程體系相符的人員績效管理及激勵機制顯得尤為重要。建立量化KPI,對包括服務效率及服務質量等多方面進行業績考核。通過IT運維管理系統平臺,對IT運維人員的工作進行數量和質量上的記錄、統計和分析。在基于ITIL流程明確IT人員崗位職責的基礎上,定義關鍵考核指標并通過IT運維管理系統收集數據,進行整理、分析產生績效報告,最終實現IT績效管理的信息化。
2.3 提供面向客戶的IT服務報告,為業務部門和IT運維管理提供決策依據
參考ITIL及ISO20000的最佳實踐,可建立專門的工作流程對IT服務報告及IT運維服務管理信息作進一步的完善。實現向客戶或業務部門以“客戶化的語言”提供約定的服務信息,同時也能為內部IT運維提供有價值的管理信息。如:某個時間段內那些方面的故障出現的數量最多;那些方面的故障解決的效率最高或最低;IT維護人員的工作負荷統計;問題分布在哪些系統或設備等。這些服務信息統計,能幫助IT運維管理和決策部門進行決策和趨勢分析,從而做到對IT系統中的各類問題和相應的服務狀況進行全面掌握和了解。
2.4 支持經驗和知識的共享化
提供豐富知識庫和完善管理。用戶通過知識庫,如FAQ、關鍵詞檢索等,可以初步搜尋解決方法,這樣問題就會以最小的資源開銷和最快的處理效率得以解決;IT維護人員通過知識庫及時、準確地選擇解決最優方案,可解決大部分常規問題;資深運維人員、專家,可以根據故障發生的頻度,把經過實踐證明正確的解決方案形成知識庫,供其他運維人員使用;另外,相關應用系統的業務處理人員可以通過共享的知識庫或實踐指導庫,提交或者獲取相關業務處理的知識。
2.5 建立并完善CMDB
實現用戶、資產、以往問題的歷史記錄等可查詢、可追溯IT運維管理系統通過組建CMDB對用戶信息、資產信息進行記錄和維護,并把每個事件/問題與用戶以及發生故障的資產對應起來,形成歷史記錄以便查詢和借鑒。如:某個用戶報告某路由器通訊故障,維護人員就可以根據資產編號查詢到該路由器以往的故障狀況。如該路由器出現過多次故障,并且都是線路質量較差,維護人員則可以根據這一依據向有關部門提出線路維護申請。
2.6 推行服務級別管理,提高客戶對IT運維的服務滿意度
在“內部市場化”的要求下,最終用戶的服務滿意與否將成為IT運維質量的考評尺度。為此,推行服務級別管理有利于明確用戶/客戶的業務需求并使之規范化、標準化。因為只有在服務雙方都認可的服務范圍內提供合乎需求的IT服務才能最終獲得用戶/客戶滿意的評價。比如:故障的響應時間約定、備品備件的替換原則、約定的設備巡檢日期等。通過服務級別管理不僅可以提供清晰、規范的IT運維服務,根據服務級別管理的流程可以對服務的結果進行持續改進。
三、結束語
加強IT運維管理,及時發現問題及解決問題,從根本上提高IT運維效率和效果,實現IT運維知識規范化、模板化,提高客戶滿意度,并提升運維服務的核心競爭力。
第二篇:變電運維管理中存在的危險點及改善對策
變電運維管理中存在的危險點及改善對策
[摘 要]本文闡述了強化變電運維管理工作的必要性,分析了變電運維管理中存在的危險點,提出了加強變電運維管理工作的改善對策。
[關鍵詞]變電運維管理;必要性;危險點;改善對策
中圖分類號:TM732 文獻標識碼:A 文章編號:1009-914X(2017)02-0353-01
隨著電力體制改革的不斷深入,供電企業對變電運維管理工作提出了更高更新的要求,變電運維管理工作逐漸由傳統方式向現代化、由粗放式向精細化方向發展。目前,變電運維管理中存在的危險點阻礙了企業的長周期穩定發展。因此,科學排除變電運維管理中危險點,確保變電站的安全高效運行很有必要的。
1、強化變電運維管理工作的必要性
變電設備是變電站的核心設備。變電運維管理水平的提高,決定整個變電運維安全狀況,加強變電設備運維工作,有助于強化變電運維人員的專業素質,提高變電運維工作人員主動性。為了確保變電站的長期穩定、安全運行,加強對變電設備的維護與管理已成為供電企業的重要內容之一。目前,供電企業有必要加強對對變電系統中變電設備的檢測與監控,要求技術人員必須全天候、全方位進行監控巡視,以便在第一時間發現變電設備運行過程中潛在的安全隱患,從而根據隱患問題采取相應的解決措施,有效降低變電設備安全事件的發生。當變電設備發生故障及異常運行時,容易造成整個電網無法正常運行,不僅會對電網的供電質量造成影響,還會使供電企業的運行成本不斷增加。隨著現代科學技術的不斷進步,積極應用先進的技術,強化變電運維管理有利于提高變電設備的健康水平及用戶供電質量。因此,供電企業必須要充分認識對變電設備運行維護工作的重要性,才能切實做好變電設備的日常維護及管理工作,從而確保變電站的安全高效運行,推進供電企業的健康持續發展。
2、變電運維管理中存在的危險點
2.1 自然環境因素帶來的危險點。在變電設備的正常運行中,一旦天氣發生了異常,就會導致變電系統運行出現一系列的故障。在特殊天氣情況下,變電設備存在以下危險點。①大風時,引線有可能劇烈擺動,上面有掛落物,周圍有可能被刮起的雜物。②雨天時,變電設備斷路器各部存在電暈、放電及閃絡現象,接點有冒氣現象。③霧天時,變電設備斷路器各部有電暈、放電及閃絡等現象。④下雪時,變電設備斷路器各接頭積雪有明顯溶化,有冰柱及放電、閃絡等現象。⑤某變電設備過負荷運行時,易發生運行中母線和刀閘過熱現象,從而影響變電設備的健康水平。
2.2 直流回路操作導致的危險點。在變電運維技術管理中,直流回流操作作為一種常見項目,也存在一定的危險,若操作不當很容易使自動裝置運行受影響,繼而引起一些不必要的事故。在變電設備直流回路操作中,人為誤操作、誤碰或保護誤動會導致直流母線短路、高頻整流充電裝置的充電模塊組運行中跳閘、直流系統永久性接地故障、直流系統瞬間或間斷性接地故障、直流饋線熔斷器熔斷(直流饋線空氣開關跳閘)、直流母線電壓過高或過低等異常事故,從而降低變電站直流系統的供電可靠性。
2.3 母線倒閘操作造成的危險點。母線倒閘操作的不規范性及不合理性,易造成變電站停電事故的發生,甚至影響變電設備的正常運行及操作人員的人身安全。在變電值班人員危險點防范意識薄弱情況下,很容易誤入帶電間隔,并進行不規范操作時,易發生誤分(誤合)母線斷路器、帶負荷拉(合)母線隔離開關、帶電掛(合)接地線(開關)、帶接地線(開關)合母線斷路器(隔離開關)等惡性誤操作事故。同時,母線設備的安全自動裝置及繼電保護壓板的誤投退、空載母線充電時電壓互感器的操作程序錯誤會帶來母線電壓消失及諧振現象的發生。
2.4 變壓器倒閘操作發生的危險點。變壓器在變電站中占據著最為重要的位置,對其危險點進行排查具有重要的意義。若在變壓器操作中發生失誤,有可能嚴重影響變電站的供電質量及安全可靠性。在變壓器的倒閘操作中存在以下危險點:①在對空載變壓器進行切合的過程中會產生過電壓,這會對自身的絕緣性能造成損傷。②空載電壓的不斷增大會對變壓器的絕緣性能帶來永久性損害。同時,在變壓器絕緣受到破壞的情況下,極易對工作人員人身安全帶來較大的危險。
3、加強變電運維管理工作的改善對策
3.1 完善變電運維監督管理制度。為了有效的避免變電運維的危險,需要完善變電運維監督管理制度,并確保變電運維管理制度能夠得到規范的落實和執行。在變電運維工作進行的過程中,落實安全生產責任制,細分各部門的職責,并成立制度落實監督小組,針對制度的落實情況進行監督,確保制度在執行的過程中能夠發揮出積極的作用。同時對每項工作內容都要進行量化和細化,明確每個操作事項,嚴格遵照安全生產準則,不斷提高變電運維安全生產水平。
3.2 強化變電設備的巡視檢查。在變電運維工作中,針對不同的自然環境、氣候對設備的影響,重視日常及重點巡視檢查工作。例如在大風環境下,檢查線路是否發生松動、斷股,周邊環境是否有飄浮物存在,是否有異物搭落在設備上,對設備運行的安全性以及穩定性造成影響。雷雨季節,要對避雷器和避雷針的完好情況進行檢查。冰雪天氣下,要對設備電暈及放電、爬弧現象進行檢查,檢查設備絕緣是否有損壞的情況。在巡視檢查中,發現問題及時處理,有效避免變電設備異常事故的發生。
3.3 提高變電運維人員的綜合素質。在變電站日常運維管理工作中,增強變電運維人員的安全意識,充分發揮他們的積極性、創造性和主動性,科學規范倒閘操作程序,全面提高運維人員的綜合素質,使他們在思想和行動上都能夠朝著良性方向發展。通過加強運維人員的培訓,不但要在專業技能上滿足工作要求,而且進一步提高專業理論水平,從而更好地勝任本職工作,以積極的態度與行為來開展管理工作。同時,強化職工間的業務溝通及技術交流,探討和分享工作經驗,使他們能夠在學習溝通中互相促進并提升運維人員自身各方面的能力。
3.4 推進變電運維一體化工作。為了能夠進一步促進變電運維一體化的實現,需要對業務進行整合,對人員進行重組,確保現有業務能夠有序開展,為電網運行的安全提供重要保障。在實踐中,供電企業高標準嚴要求每個運維人員,按照工作推進實施方案的要求,改變原有傳統的工作模式,對檢修人員進行專業的、系統的技能培訓和現場操作,并逐步融合變電運維、檢修人員實現各運維工作站統一負責實施設備巡視、倒閘操作、帶電檢測、維護性檢修等業務,并為此提升變電運維的工作效率,實現運維檢修一體化。
3.5 加大變電設備技術革新力度。在變電設備運維工作中,面?ι璞父?高性能的要求,供電企業應加強設備檢測技術,不斷加大設備反事故改造、技術改造力度,重點改進設備薄弱環節,定時開展設備檢測活動,科學規范運維工作程序。針對變電設備紅外熱像精密檢測、帶電維護、保護差流檢查、通道檢查、壓板檢查等工作,運維人員有必要應用先進的設備維修用具,使用安全的設備維修用具,采取先進的設備維修工作方法,從而全面掌握設備狀況,減少工作人員的工作強度,保障變電設備安全運行。
4、結束語
良好的變電運維管理工作有利于提高供電服務質量及綜合經濟效益,從而推動企業長遠發展。在變電運維實際工作中,供電企業應更加關注設備的細節和隱患,認真分析變電運維管理工作中的危險點,開發更多維護技術,建立更多更全面的維護方案,加強科學合理的變電運維監督,降低各危險點對電網運行造成的影響,提高變電設備健康水平。
參考文獻
[1] 李云啟.關于變電運維中危險點控制的分析[J].科技視界,2012(30)
[2] 仝海梅.變電運維管理中危險點及控制探討[J].科技風,2014(22)
第三篇:運維管理定義
運維管理(IT Operations Management)幫助企業建立快速響應并適應企業業務環境及業務發展的IT運維模式,實現基于ITIL的流程框架、運維自動化。
核心思想隨著國內企業業務信息化的深入, IT運維部門所負責的IT設備及軟件的運行維護工作變得越來越復雜,技術難度也越來越高。傳統的IT工具和流程集中在技術上,而不是業務目標上。業務服務管理(Business Service Management)使IT能輕松滿足業務的需求,轉變企業的環境,使業務部門和IT部門領導者能夠擁有統一的語言,通過統一的界面面對挑戰,理解新變化所帶來的影響。
BSM主要強調從業務的視角來看待企業的IT運維,從而最大化發揮IT對企業業務的推動作用,這就IT運維的核心思想。
著眼點IT系統的業務服務管理主要著眼點
一、確立以業務價值為核心,業務驅動管理的管理思想面向業務要首先在IT管理的戰略層面上建立“業務驅動”的IT治理和管理思想,使得業務部門的目標和IT運維的目標一致,都是為了企業整體戰略目標的實現,把對業務的支撐能力和管理實效,作為評價IT系統效用和IT部門工作的首要指標。只有這樣,才能在全企業范圍內建立“技術服務于業務發展”的意識和文化,是真正實現IT與業務融合,共同為企業的戰略目標服務。
二、建立關鍵業務服務模型今天的業務部門對應用程序的依賴性比過去更強了。應用程序軟件可以實現關鍵業務流程的自動化 —自動化既包括付款、資金轉賬、下訂單和訂單履行。由于應用程序故障或性能問題可能導致嚴重的業務影響,因此業務部門迫切需要 IT 部門在發生問題時提供更高的應用程序服務級別和更快的問題解決方案。所以,必須結合企業戰略和目前業務運營情況,辨識企業業務服務,特別是關鍵業務應用。為這些核心業務系統服務,建立和企業未來發展愿景、目前IT架構、管理模式等相適應的業務服務模型,能夠清晰地描述業務與IT之間的關聯關系和IT服務的關鍵目標。
三、管理信息共享目前,出于對IT資源專業化、精細化管理的要求,企業部署了諸多的監控管理工具,如網絡監控、系統監控、數據庫監控工具等。一般來說,這些監控工具往往來自于不同的廠商,彼此之間缺乏信息共享的手段。而一個具體的業務是由網絡、主機、應用本身所組成,管理信息無法共享,這就造成了當一個故障出現時,無法通過系統直接自動分析并定位故障點,加大了IT故障的分析難度,降低了解決問題的效率。業務服務管理可以有效整合企業已經構建的眾多IT監控系統,將分散的IT管理信息集中到一個單點的管理平臺中,從而可以快速進行故障定位。
四、根源問題定位隨著企業業務的快速發展,IT環境越來越復雜,IT組件越來越多,同時各組件之間的關聯關系也更加紛亂和復雜。業務服務管理能夠提供有效的根源問題定位能力,它著眼于企業的核心業務系統,通過集中與業務相關的IT信息,根據業務邏輯和IT組件之間的關聯關系進行建模,企業可以在業務模型中的任何一點進行快速的根源問題分析和定位,大大提高了解決問題的速度和準確度。
五、故障影響范圍評估當我們發現IT故障時,我們不僅應該關注故障本身,更應該考慮該故障對業務系統的影響。通過建立業務服務影響拓撲,可以快速的了解企業的關鍵性業務及業務故障時的影響范圍,通過了解企業具體的業務環境,優先處理關鍵故障點。
第四篇:項目運維管理
龍崗區項目運維管理
1、設備應用
1、負責對所有設備的應用操作,每季度提交每個設備的配置和存儲應用情況報告、網絡拓撲報告、IP分配報告,并負責對龍崗區城管局的相關工作人員進行培訓;
2、對新應用的設備需求,駐場工作人員應及時提交設備配置現狀及設備規劃報告,以便該應用能及時實施;
3、掌握設備的運行情況,就保修期、存儲空間等及時進行提醒;
4、建立相關系統軟件各種故障的恢復流程及應急措施;
2、環節與設備
1、定期對機房供配電、空調、溫濕度控制等設施進行檢查記錄
2、做好機房人員的出入、服務器的開機或關機等工作進行記錄;
3、根據維護合同附件資產清單,建立服務器及網絡設備的檔案,形成不易破壞的醒目標識,并定期更新相關內容;
4、對資產清單所列的各種設備、線路等,做好檢查維護工作,發現故障,及時報告,并安排服務聯系或維修,對維修情況提交書面報告;
5、形成每日巡視制度,對機房中相關設備的告警顯示、空調、UPS等實際狀態進行記錄。
3、監控和安全
1、通過IT資源監控系統,對通信線路、主機、網絡設備和應用軟件的運行狀況、網絡流量、用戶行為等進行監測和報警,形成記錄、妥善保存并按重要性級別,定期書面報告;
2、針對網絡運行日志、網絡監控記錄的日常維護和報警信息分析和處理工作,提出優化建議及方案;
3、定期對網絡系統進行漏洞掃描,對發現的網絡系統安全漏洞進行及時的修補
4、定期檢查違反規定上網或其他違反網絡安全策略的行為,書面報告;
5、指派專人進行核心服務器的工作壓力監控,針對業務的增長定期生成主服務器的工作壓力報表,并且預估業務增長對服務器壓力的影響提出合理化建議;
6、指派專人進行核心數據庫的工作壓力監控,定期生成報告,并就改進提出合理化建議。
4、操作系統安全
1、根據甲方業務需求和系統安全分析結果,確定系統的訪問控制策略;
2、定期進行漏洞掃描,對發現的系統安全漏洞及時進行修補;
3、及時安裝系統的最新補丁程序,在安裝前,首先報告同意,且在測試環境中測試通過,并對重要文件進行備份后,方可實施系統補丁程序的安裝;
4、所有對系統進行的維護,均需詳細記錄操作日志,包括重要的日常操作、運行維護記錄、參數的設置和修改等內容,嚴禁進行未經授權的操作;
5、備份與恢復
1、根據印制中心實際應用情況、根據生產相關數據的連接關系、根據應用的業務特點和軟硬件資源,制定詳細的系統數據備份計劃,確定合理的系統備份策略。定期備份重要業務信息、系統數據及軟件系統等;
2、應根據數據的重要性和數據對系統運行的影響,執行數據的備份,每月提交數據備份報告,必要時實施數據恢復;
3、按照控制數據備份和恢復過程的程序,對備份過程進行記錄,所有文件和記錄應妥善保存;
4、定期進行備份介質的維護、更新、替換、輪轉,保證備份介質可靠有效,針對重要備份介質進行雙機房異地輪轉;
第五篇:IT運維管理
IT運維管理
目錄
定義
IT運維管理包含內容
運維員三大法則
在網絡的基礎設施建設完成之后,整個網絡處于運行狀態,IT部門采用相關的管理方法,對運行環境(包括物理網絡,軟硬件環境等)、業務系統等進行維護管理,我們把這種IT管理的工作簡稱為IT運維管理。
IT運維管理包含內容
IT運維是IT管理的核心和重點部分,也是內容最多、最繁雜的部分,主要用于IT部門內部日常運營管理,涉及的對象分成兩大部分,即IT業務系統和運維人員。其管理內容又可細分為七個子系統:
第一、設備管理:對網絡設備、服務器設備、操作系統運行狀況進行監控,對各種應用支持軟件如數據庫、中間件、群件以及各種通用或特定服務的監控管理,如郵件系統、DNS、Web等的監控與管理;
第二、數據/存儲/容災管理:對系統和業務數據進行統一存儲、備份和恢復;第三、業務管理:包含對企業自身核心業務系統運行情況的監控與管理,對于業務的管理,主要關注該業務系統的CSF(關鍵成功因素Critical Success Factors)和KPI(關鍵績效指標Key Performance Indicators);
第四、目錄/內容管理:該部分主要對于企業需要統一發布或因人定制的內容管理和對公共信息的管理;
第五、資源資產管理:管理企業中各IT系統的資源資產情況,這些資源資產可以是物理存在的,也可以是邏輯存在的,并能夠與企業的財務部門進行數據交互;
第六、信息安全管理:該部分包含了許多方面的內容,目前信息安全管理主要依據的國際標準是ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36個控制目標和127中控制方式,如企業安全組織方式、資產分類與控制、人員安全、物理與環境安全、通信與運營安全、訪問控制、業務連續性管理等;
第七、日常工作管理:該部分主要用于規范和明確運維人員的崗位職責和工作安排、提供績效考核量化依據、提供解決經驗與知識的積累與共享手段IT運行維護管理的每一個子系統中都包含著十分豐富的內容,實現完善的IT運維管理是企業提高經營水平和服務水平的關鍵。
運維員三大法則
【此法則適用GPL協議,歡迎各位自由發揮】第一法則,運維員不得危害服務器的安全運行,偷窺篡改服務上的數據,或袖手旁觀服務器受到入侵;第二法則,運維員必須保護自己,除非違背第一法則;第三法則,運維員必須服從運維經理的命令,除非違背第一和第二法則。