第一篇:運維工程師面試題[范文]
IT運維工程師筆試題
姓名:時間:
一、填空題
雙絞線兩種制作標準的線序:
EIA/TIA 568A:、、、、、、、EIA/TIA 568B:、、、、、、、連接方法有兩種:
正線(雙絞線兩邊都按照EIAT/TIA 568B 標準連接)
反線(一邊是按照EIAT/TIA 568A 標準連接,另一邊按照EIT/TIA 568B 標準連接)填寫以下各設備的連接方法: PC-PC:、PC-HUB:、HUB-HUBHUB-SWITCH:SWITCH-SWITCH:、SWITCH-ROUTER:、ROUTER-ROUTER:
某公司申請到一個C類IP地址,但要連接6個子公司,最大的一個子公司有 26臺計算機,每個子公司在一個網段中,則子網掩碼應設為
已知某一主機的IP 地址為201.103.136.184,其子網掩碼為255.255.255.192,該主機是在_______類網絡中,該主機所在子網最多允許有__________臺主機。
OSI/RM的傳輸層提供的服務有兩大類,即___________的服務和____________的服務。交換機工作在OSI七層的哪一層?
平均無故障時間的英文縮寫是_______。
在TCP/IP協議集中,傳輸層的_____協議是一種面向無連接的協議,它不能提供可靠的數據包傳輸,沒有差錯檢測功能。
在IP網絡中,從IP地址映射到物理地址采用______協議。
到目前為止,已出現了三種類型的防火墻,即數據包過濾、__________、____________。下面幾條PIX配置是否正確,為什么?
access-list 101 permit icmp any host web
access-list 101 permit tcp any host X.X.X.X eq www
access-list 101 permit tcp any host X.X.X.X eq 3389
access-list 101 permit tcp any host X.X.X.X eq ftp
access-list 101 deny tcp any any
access-list 101 permit tcp any host Y.Y.Y.Y eq www
access-list 101 permit tcp any host Y.Y.Y.Y eq 3389
答:斷電后,會使存儲的數據丟失的存儲器是______。
下列服務的默認端口是多少SSH、Telnet、SMTP、POP3、DNS、遠程桌面
PAT和NAT有什么區別?
答:說明下列Raid技術至少需要幾塊磁盤:
Raid 0Raid 1、、Raid 0+、描述raid0、1、5的特點和優點。
答:配置一個與DNS集成的活動目錄,客戶端在加入域的時候提示找不到域控制器,其中最有可能出現問題的地方在哪里?
答:SQL復制的基本元素包括、、、、SQL復制技術類型、、局域網內某臺電腦不能通過UNC方式訪問文件服務器,提示找不到路徑,但其他客戶端均可正常訪問,該如何解決?
答:
某文件的權限為:drw-r--r--,用數值形式表示該權限,則該八進制數為:,該文件屬性是。(linux)
22、Nagios 監控系統中負責主機和服務監控的配置文件名稱是。
23、簡述IBMX系列服務器安裝步驟:
答:
24、已知 10.105.239.197的用戶名為administrator,密碼cosft#08#&ATS02,請問如何訪問默認共享?
答:
25、用sql語句 查詢teasttable中姓名為“張”的nikname的字段和email字段
答:
26、簡單介紹你使用過的服務器監控軟件,并陳述它們的特點
答:
27、windows群集(cluster)和網絡負載均衡(NLB)各自的特點及用處是什么? 答:
28、服務器需要監控哪些項目?憑借這些項目如何判斷服務器的瓶頸?
答:
第二篇:上海Linux運維工程師 面試題 個人總結)
這下面的是一個企業發的面試題 1你常上的相關技術站有哪些?
2簡述你所理解運維工程師的主要職責?
3你管理過的服務器數量級? 1臺 2臺 2-5臺 5-10臺 10臺以上
4描述一次你印象深刻的服務器運維經歷。
5有一臺服務器出現安全問題,你會采取什么樣的方法處理?說出你的診斷處理思路。
6有多臺服務器需部署相同應用文件,文件會持續更新,你用什么方式實現不同服務器間的文件同步。
7某一臺服務器部署多個Web站點,其中有一個w3wp的CPU占用達到100%,如何找出有問題的Web站點?
8你眼中的滬江是怎樣的?談談你對滬江的理解。
9是否有以下相關經驗?如有請簡要說明掌握情況。a、Squid相關經驗 b、Nginx、Lighttpd等 c、Memcached d、負載均衡
e、分布式文件處理 f、Email Server
上午-10點雷傲普文化傳播有限公司
1.DNS使用的端口號和協議,簡單描述一下DNS正向解析和反向解析的工作原理和作用還有應用場景? 2.編寫IPTABLES使用內網某臺機器的80端口可以在公網訪問,假設公網IP為10.10.1.1,實現192.168.1.0/32段的NAT.3.舉出三個以上的主流WEB服務器,并簡述他們的特性和優缺點不限操作系統?
Apache 源代碼開放 可以欲行在unix,windowns,linux平臺上,可移植性,而且模塊很是豐富 缺點:性能,速度上不及其他輕量級的web服務器,但是也是重量級產品,所消耗的內存,cpu也比其他的要高
Nginx 源代碼開放發 高性能的http和反向代理服務器,在高并發的情況下,nginx是apache不錯的替代品,他能夠支持高達50000個并發連接響應,內存,cpu等系統資源消耗也是很低的。缺點,支持模塊比較少吧,相對沒有apache穩定,支持動態頁面不是很強。
Tomcat 對高并發跟靜態頁面處理還不是很強
Microsoft IIS 配置很簡單,只能運行在windows。Linux上,如果要使用還購買商業windows server操作系統。
4,舉出兩個主流代理服務器,簡述工作模式和優缺點? 5,舉出兩個負載均衡的軟件,并簡述工作模式和優缺點 ? 6,IE,FF,chrome游覽器最大并發請求數是多少?,7,簡單舉例一下linux和windows系統今年都有哪些漏洞? 8,mysql數據庫備份都有哪一些,部署一個高可用mysql應用 環境,并說明他的高可用性? 9,什么是裸設備,他的好處是什么?,mysql支持裸設備嗎?
10,如果給你一個100g的INNODB類型數據庫,你會用什么備份方案來做備份。11,寫一個簡單的shell腳本,腳本運行時讓CTRL+C無法中斷的該shell腳本? 12,如何快速編譯單一的內核模塊? 13,如何動態增加apache和PHP模塊?
14、說出linux開機流程?
15、具體說說cacti的安裝過程?
16、cacti與nagios的區別?cacti如何監控mysql ?
17、mysql主從復制如何實現?
18、raid 0 與raid的區別?
19、DNS解析詳細過程?從主機訪問域名(三家公司都問這個問題)讓寫出來? 20、腳本會多少?掌握程度?sed awk 區別?
人事問題(下面的都是每一個企業問的最多的問題,這些問題是我自己經歷的,都是我自己的回答,僅供參考,每個人經歷不一樣,回答的時候一定要和寫在網上的還有自己寫的簡歷保持一致,他們好多都是把你投的簡歷下載下來,然后看著下載下來的簡歷問你問題)
1.先問問你寫的工作經歷,在以前公司主要做什么,是什么公司,多少人,主要負責什么,還有你寫的項目經驗,項目具體怎么實施的,(一定要明白原理性的東西,把他說出來就可以)
2.問完工作經歷后,問你為什么辭職?。
我說因為以前的公司的工作接觸到了linux。被linux的開源所吸引,對linux的開源產生了興趣,但是靠自己去學有點吃力,就辭去工作在鄭州找了一家培訓機構培訓RHCE 3.問為什么不在本地工作,來上海有什么規劃? 4.談談你對運維工程師的理解
5、家庭情況,家庭有沒有負擔?
6、上海有沒有同學,會不會在上海長期待下去?
7、薪水問題?
對于這個問題一般不要直接說4k 5k,填表的時候不用寫具體數字,等技術人事面試通過后,他會問你具體。就說這個沒有強行的要求,根據跟人能力及個人對技術的掌握程度一般說在3500-4500
1、自我介紹三分鐘。(教育經歷,性格特長,所作項目)
介紹內容與個人簡歷一致 表述方式盡量口語化 要切中要害,突出針對性,不要過多談精通,不要說自己做過主管或者經理
善于利用開源軟件滿足企業不同的網絡服務,突出個人腳本能力,不要主觀說會多少腳本,可以談自己寫過什么腳本實現什么樣子的功能,不要抱怨任何東西,不要說學校或者企業老板不好,技術術語描述的精確度,最后要說應聘目標崗位 不要說做過什么實驗,做過什么就是做過什么,對方不問,不要說自己的缺點 語氣詞,不要用語氣詞,開場問題,各位面試官好
想法設法突出自己的自學能力,及英語能力(沒有英語能力,不要亂說 項目,用幾臺服務器構建了什么架構,實現了什么功能,客觀用數字說話
運維,自信,語言流暢
高建華,惠普中華區 自我推銷能力特別關鍵,三個詞描述自己的優點,三個詞描述缺點(表達憂缺點,盡量描述性格特征)有責任心,自學能力強,誠信 隨和
接面試電話的時候問清楚公司名稱,公司地點,上網查對方公司基本信息,了解對方公司的主營業務,企業文化 仔細了解對方的崗位需求,了解對方公司的近幾年發生的大事
電話面試注意語速和語調,保持自然,最后以禮貌結束,感謝給自己的電話面試機會,期望成為對方公司一員,面試的時候要提前十分鐘到達,不要過早到達對方公司 面試問題常見問題要熟練掌握
通過google 官方文檔,別人總結 制定出適合企業的需要 五年的規劃,五年內在運維工程師上作出一定的成就 對方要文檔,不能給,熟悉實施過程
了解自己寫的項目名稱,幾個人,實施過程,所用配置 缺點,太過隨和,顯得軟弱 優點要簡明扼要
朋友給對你評價,側面表達你的與人處事,如,我的朋友說我比較有人緣,或者我的朋友說我比較愛鉆研
加班的看法,我的工作效率是高效的不會把工作拖到下班完成,如果工作 公司項目進度,或者公司需要,我也會樂意的加班 為什么離職,公司有什么要問,可以問對方公司的發展計劃,對新員工有沒有什么培訓 評價過去的公司,和以前公司老板員工相處很好,不會的問題,可以說幾天之內 給出解決辦法
抽象的角度去描述一個東西,專業,很專業是裝出來的
心態要自信,不要過去謙虛
1、LINUX系統軟件安裝和卸載的常見方法
2、Windows和LINUX常用的遠程連接工具有那些
3、如何修改LINUX的IP地址、網關和主機名
4、編寫腳本實現以下功能;
每天早上5點開始做備份
要備份的是/var/mylog里所有文件和目錄可以壓縮進行備份
備份可以保存到別一臺器上192、168、1、2 FTP帳號 aaa 密碼 bbb
要示每天的備份文件要帶有當天的日期標記
5、IPTABLES相關的命令
6、mysql相關的題
新安裝MYSQL后怎樣提升MYSQL的安全級別
MYSQL的主從原理,怎么配置文件
為MYSQL添加一個用戶
7、WINDOWNS相關的問題
你是否對WINDOWNS系統打過補丁,如果有100臺你會怎么做
WINDOWNS下怎么為MYSQL做定時完全備份
在沒有硬件防火墻的情況下,怎樣提高WINDOS系統安全
Yun面試 shell: 1.判斷一個文件是否為字符設備,如果是將其拷貝至/etc
2.在A目錄下創建50個文件file1-file50,然后將其移至/path/B
網絡: 1.VLAN原理等
2.如何使不同VLAN間通信
3.二層交換機三層交換機有什么不同 4.單臂路由知識
5.linux網卡bounding。bounding的主備模式下如何進行網絡連接達到主備,上層路由端需要什么設置? 6.系統: 1.dns原理、端口;使用協議及其作用;View視圖;DNS主從 2.系統自動化安裝工具,是否用過,簡要描述 3.LVS描述,算法描述。。DR優勢及其過程描述 4.tcpdump的各種使用
5.cacti原理、nagios原理。比較;客戶端服務端。agent名稱 6.mysql主從的搭建及其故障恢復,簡要描述 7.iptables簡要描述,幾個表。幾條鏈
設計:
1.1000臺服務器需要放一個2G的單個文件,請設計幾種放置方法,并且描述各種方法利弊(涉及到一個對單播多播組播概念的描述,如果明白,為較好的一種方法)2.雙網卡服務器,對網絡做高可用,畫一個簡圖
在上一個公司的工作職責;
1、檢測某個端口所占用的進程
2、對于linux主機的cpu負載使用,什么情況下user的比例升高,什么情況下system的比例升高,請聯系實際舉例。
3、在不umount的情況下,如何重新設置mount的參數。
4、不小心在系統下執行了chmod-x/sbin/chmod 怎么辦?
5、linux文件的權限位x對目錄和文件有何不同?
6、找出/taomee目錄下的所有常規文件并設置權限644
7、如何查找某一文件被哪個進程打開?
8、新增一塊存儲設備,lvm操作的命令如何寫
9、給主機host:172.16.0.2 增加gateway10.0.0.1
10、socket和tcp訪問mysql的區別?
二、shell
1、使用awk打印出 welcome to taomee
2、如何將一個文件中的taomee、******、peoplenet中的*內容進行替換成network(*的內容不同)
3、找出access.log中訪問top 10的ip地址
4、打印1-100奇數
5、刪除一個文件中行號為奇數的行
6、替換某一個文件的字符串
7、exec和souce區別
8、顯示24小時前的內容,9、linux的優化
10、iptables表和鏈
綜合題(好像是這樣叫的): 1,談談你對工作和生活的看法
2,XX家電公司,銷售員小王把一臺新款高檔的冰箱,以普通的冰箱的價格授給了李先生,現在讓你給李先生寫一封E-mail,希望李先生能把錢給補上,你應該怎么寫(你可以以XX家電任何人的身份寫)
3,談談你對我們公司的認識
專業題(好像是這么叫的,呵呵): 1,什么是單點故障,并舉例說明
2,現有一wap網站,單臺服務器,配置8核CPU,24G內存。環境是 Ubuntu Server 9.10+Nginx0.8+Tomcat6.0+Mysql5.0,很久沒有做程序升級,平時內存使用8G,日訪問量500W,網卡IN 500K OUT 5M,有時候會系統崩潰,請分析原因并給出解決方案!
還有一個專業題,給忘了,另外技術問了 MySQL能插入多少條記錄,MySQL怎么優化,Nginx怎么優化,MySQL讀寫分離,MySQL集群
第三篇:運維工程師崗位職責
運維工程師崗位職責
1、響應及解決客戶的技術要求、疑問以及系統使用過程中遇到的各種問題;
2、負責服務過程中問題現象和處理方案的收集撰寫,形成知識庫,并對知識庫進行維護更新;
3、及時反饋技術處理過程中的異常情況,及時向部門負責人、服務開發PM、客戶經理等相關人員報警;同時,主動協調資源推動問題解決;
4、定期對所有服務問題進行分析,并對服務效率有影響的問題提供反饋意見,提升服務支持團隊專業度
崗位職責2:運維工程師崗位職責
1、負責數據中心日常巡檢工作,并根據要求形成相關統計報告。
2、每周按照要求制作機房運行參數等的統計分析。
3、能夠部署相關的操作系統(windows、linux)以及一些基本服務,例如AD、DNS、DHCP、AAA、IIS、文件系統等。
4、能夠配置交換機的基礎配置(MSTP、RSTP、主從VLAN、動態VLAN等基礎配置)
5、路由協議(靜態、RIP、ospf路由)。
6、了解防火墻的工作原理,能夠進行簡單的策略下發。
崗位職責3:運維工程師崗位職責
無論做什么運維,運維工程師最基本的職責都是負責服務的穩定性,確保服務可以7___24H不間斷地為用戶提供服務。在此之上運維工程師的主要工作職責如下:
質量:保障并不斷提升服務的可用性,確保用戶數據安全,提升用戶體驗。
效率:用自動化的工具/平臺提升軟件在研發生命周期中的工程效率。
成本:通過技術手段優化服務架構、性能調優;通過資源優化組合降低成本、提升ROI。
從產品的生命周期來看:
1.產品發布前:負責參與并審核架構設計的合理性和可運維性,以確保在產品發布之后能高效穩定的運行。
2.產品發布階段:負責用自動化的技術或者平臺確保產品可以高效的發布上線,之后可以快速穩定迭代。
3.產品運行維護階段:負責保障產品7___24H穩定運行,在此期間對出現的各種問題可以快速定位并解決;在日常工作中不斷優化系統架構和部署的合理性,以提升系統服務的穩定性。
崗位職責4:運維工程師崗位職責
1、參與設計、審核、優化公司IT系統以及各應用系統的體系架構;
2、全面負責公司運維項目的系統升級、擴容需求與資源落實,配合開發需求,測試、調整運維平臺;
3、負責網絡以及服務器的網絡設置、維護和優化、網絡的安全監控、系統性能管理和優化、網絡性能管理和優化;
4、建立面向開發部門,業務部門的服務流程和服務標準;
5、負責IT運維相關流程的規劃、設計、推行、實施和持續改進;
6、負責內部分派下發,對實施結果負責。
7、負責日常網絡及各子系統管理維護。
8、負責設計并部署相關應用平臺,并提出平臺的實施、運行報告。
9、負責配合開發搭建測試平臺,協助開發設計、推行、實施和持續改進。
10、負責相關故障、疑難問題排查處理,編制匯總故障、問題,定期提交匯總報告。
11、負責網絡監控和應急反應,以確保網絡系統有7______小時的持續運作能力。
12、負責日常系統維護,及監控,提供IT軟硬件方面的服務和支持,保證系統的穩定。
第四篇:系統運維工程師
系統運維工程師
系統運維工程師年終個人工作總結及下年工作計劃
時間一晃而過,彈指之間,2010年悄然而至,自從2010年3月份剛進入公司,我是第一次接觸公司、接觸通信行業、接觸公司網絡管理及維護。雖然跟我的專業和技能都一致,但所有的實際經驗都是第一次,讓我沒有任何準備,同樣也打消了任何顧慮,人生就是這樣,所有的一切都是要從第一次開始,沒有接觸過、干過并不可怕,領導給了我機會,讓我有了一次嘗試、一次展現自己的平臺,那么我一定會更加倍的努力做好工作才是最大的回報。并且也是對自己的一次肯定。經過一段時間的工作及陌生環境的磨合,專心鉆研業務知識,努力提高理論知識和業務工作水平。遵紀守法,踏實工作認真完成領導交辦的各項工作任務,使自己漸漸的融入和適應到新的工作環境中。過去的大半年里在領導和同事們的悉心關懷和支持幫助下,通過自身的不懈努力,在思想、學習和工作等方面取得了新的進步。現總結如下:
一、公司電腦日常維護工作
剛一開始接手工作的時候,發現公司大部分工作電腦都沒有安裝安全防護軟件和升級系統補丁;員工隨意安裝系統及應用軟件,致使公司局域網內病毒隱患嚴重、工作不穩定和系統崩潰,工作秩序被打亂,員工不嚴格要求自己,上班時間聊QQ、玩農場、看娛樂網站等;為此公司和個人工作經常受到影響,工作效率降低。針對這種情況,我采取了以下措施:
1、先對公司員工進行一次基本知識培訓,讓員工了解到計算機的正確使用方法,病毒防范,重要文件的備份等。從而大大提高了員工對電腦使用的熟練程度。
2、先恢復良好的秩序。電腦使用時如發現故障和需更改設置,必須先報告公司運維人員,由專門人員來進行專業及針對化的操作,個人不能私自進行改動,進行這樣做的目的避免由于人為的盲目操作使某一臺電腦的故障影響整個局域網內的其它工作,使故障擴大化,并延長了解決問題的周期。
3、使員工使用統一的、經過安全測試的系統及應用軟件,安裝、設置統一的殺毒軟件、防火墻等安全防護軟件,且經過努力實踐,并在每臺機器上設定了自動系統補丁升級及定期查殺規則。
4、對于個人的關鍵性數據資料、郵件進行路徑轉移備份,使這些數據遠離危險故障點,避免意外丟失所帶來的嚴重后果。操作系統進行常規定期備份,便于事后的還
原。
5、對于網絡管理進行了監管工作,公司所有電腦安裝了行為管理軟件后,員工工作效率逐步提高,自覺性得到明顯改進,從而凈化了公司網絡辦公環境。
經過一段時間的貫徹和工作,先前的混亂現象得到有效控制,現公司的十余臺電腦,工作狀態穩定,沒有出現大面積的系統崩潰和故障。
二、網絡的日常維護
路由器及交換機的維護管理,確保公司網絡運行正常,員工正常利用網絡資源。加強路由器的規則設置,優化外網接口,內部員工合理地分配帶寬流量,使公司的網絡能穩定有效地工作。
三、公司網絡制度管理和完善
公司經過一段時間的運轉,各個部門的規章制度通過大家一起研究、探討、立會并完善制定了各項規章制度,計算機管理也形成了制度,大家按章辦事,使之成為一種工作習慣。同時公司的資產管理及日常的文書表格非常混亂和環節上的缺失。為此特地制作了一批表格、登記申請單及統計表。使得公司資產和資源得到有效的管理和控制,杜絕管理上的失控和資產流失。
四、公司服務器平臺管理與維護工作
公司發展逐步擴大,對于公司所有的業務支撐平臺-服務器,為重中之重;本我司服務器相應出現幾次重大故障,分別如下:
1、網絡故障七次,重大一次,因服務器遭DDOS攻擊,導致我司服務器無法正常工作。事后通過緊急處理后得以恢復正常。其它幾次分別為機房斷電、網絡升級、電信與聯通DNS解析故障影響到我司服務器平臺網絡連接不正常。
2、系統故障三次,其中一次為短信平臺服務器系統文件損壞,導致系統崩潰。經過技術部采用緊急預案措施在兩小時內得以恢復系統。
3、其它故障共計5次,因聯通網關溢出,無法與我司IVR服務器數據庫網關同步,導致用戶無法正常訂購與使用我司親情相伴業務。
經過出現幾次重大故障后,技術部多次研究與討論,制定出一套完善的應急措施與日常維護計劃。盡量歸避風險及減少事故發生,同時確保做到問題提前預防、及時發現、迅速解決并恢復正常運營。
4、針對服務器出現在問題所在,在技術部其它同事的配合下完成服務器的重新部署,訪問權限及安全性的提高,數據庫優化等相關措失后,目前服務器已運行正常。
5、公司針對員工的工作崗位與職位重新部署了FTP服務器的訪問權限與互聯網訪問,使每個員工都能把重要的文件放到服務器上相關部門的文件夾里作備份,且通過內外網均可實現訪問FTP服務器,大大方便了員工在外出差或在家里隨時提取相關資料,且員工的訪問權限不一樣,故某些與自己無關或公司重要資料進行了保密設置,從而大大提高了公司重要資料的完整性與保密性。總結本的工作,盡管有了一點點的進步和成績,但在一些方面還存在著很多的不足。比如:工作經驗不足,對公司的網絡與辦公環境未得到很大的改善;遇到困難的時候與領導溝通不夠等等,這都有待于在今后的工作中加以改進。
在新的一年里,將百尺竿頭,更進一步,2011年的大致工作計劃為:
1、在公司內部使用一種簡便、有效的軟件工作平臺,使之便于公司所有員工的工作、交流、探討,發布公共信息等(如OA軟件)。
2、利用投影儀設備資源制作會議幻燈片為員工培訓計算機操作及工作常用軟件知識的小竅門,爭取進一步提高全公司工作人員的專業化及工作效率。
3、解決企業網站制作等專業性知識問題,業余時間強化學習并能勝任網站管理工作。
4、進一步增強IT系統和網絡系統的穩定性和管理,使用更為高效的域控制系統來代替目前的工作組局域網,使內、外網連接任意,在任何地方工作都能連接本公司服務器資源。
5、重新改建機房機柜網絡布線,使機柜走線更加美觀,同時方便以后維護時線路排除更加明了,直觀。
6、在資金允許的情況下對公司辦公電腦、網絡、會議系統布署方案升級優化,進一步提高員工工作效率,為公司節約成本開支。
7、學習更多的網絡知識,充分的將一些新的技術應用到公司當中來。為公司提供更優質、更便捷、更效率、更節能的辦公方式。
2011年,是全新的一年,也是自我挑戰的一年,我將努力改正過去一年工作中的不足,強化理論和業務學習,不斷提高自身綜合素質,把新一年的工作做好,為公司更好的發展盡一份力!
擴展閱讀:如何 成為系統運維工程師 要成為系統運維工程師,需要學習那些課程?Windows、Linux、網絡和Oracle哪些知識點需要學習,武漢怎么參加培訓?
[標簽:工程師,linux,oracle] 聽前輩說軟件開發工程師,以及系統運維工程師,在考慮選擇。大家幫忙說一下我該選什么?學習哪些內容?才畢業沒什么工作經驗,該如何準備?
系統運維要求什么都懂一點,主要是基于Linux、UNIX有前途,shell網絡數據庫都需要懂一些。越老越吃香知識不需要太多創造性的東西了解基本規律然后去部署排錯以后轉管理。
我們來看看系統運維都有一些什么要求深入了解Linux/Unix操作系統 深入了解分布式系統、計算機網絡、硬件體系結構
精通Linux/Unix環境下腳本語言(Shell、Perl、PHP、JSP、Python)的編程熟練使用grep、awk、sed、vi等系統工具
可以學RHCE+CCNP+OCP RHCE是紅帽Linux認證目前最普及的企業版LINUX發行版的認證學了通吃LINUX再學一下AIX就UNIX搞定;可以朝RHCA發展
CCNP基本是思科網絡工程師比較成熟基礎的技能培訓認證,將來有錢了可以朝CCIE發展
OCPOracle數據庫DBA認證專家也是成熟的基礎認證,可以發展為OCM 這個課程可塑性很強延展性出去能滿足絕大多數的工作需求至于日常的局域網維護硬件什么的就不說了
你是武漢的話你可以找授權培訓官網都可以查 武漢譽天RHCE+CCNP+OCP 系統運維做的很多啊網絡操作系統數據庫網站運維《互聯網運營智慧--高可用可擴展網站技術實戰》本書深入淺出地介紹運維架構中的各個節點,從網絡規劃到服務器安裝到負載均衡、分布式文件系統等架構規劃,無一不囊括,包括:從簡要說明選擇開源技術作為運營環境開篇,到選定平臺及工具的部署實施,以實例展示如何使用開源工具,來實現用戶訪問量在1000萬這樣的一個級別的站點功能。
運維工程師熟悉tcpip系列協議,熟練配置思科和華為網絡能參考手冊配置其他廠商設備包括安全設備
熟悉服務器硬件系統配置操作系統unixlinuxwindows等安裝配置檢測其運行等 熟悉常見的應用如webftp郵件等服務搭建及排查熟悉常見的系統安全設置,以及整個安全體系架構
會安裝及配置維護常見數據庫oraclemysqlsql-server等有一定的存儲方面的知識。。。。
要熟悉你服務器的環境相關的東西特別是網絡相關
熟悉服務器的硬件配置熟悉服務器上的操作系統及各種常見的應用系統熟悉發生故障的時候處理流程等
不強求你精通內核調優等但是你知識要全面而且有一兩手是拿手的 主要想當linux運維,服務器管理方面 最佳答案
操作:下個虛擬機,裝CentOS。
教材:《鳥哥的Linux私房菜基礎學習篇》、《鳥哥的Linux私房菜服務器架設篇》第三版。這兩本書深入淺出,原理講得很透徹而易懂,不像很多書只講皮毛或很枯燥。第三版是以CentOS為例的。
RedHat官方也有教材,但是一來你沒有配套的系統練,二來它的原理方面不如上書講得深。
CentOS和RedHatEnterprise的源代碼是一樣的,很多都兼容。學好CentOS再遷移到RHEL很容易。如果是小型企業,用CentOS就可以了。大型企業才有必要購買RHEL。
軟硬并施!軟件:主要是服務器操作系統和數據庫系統
硬件:服務器硬件,數據存儲硬件(如EMC、IBMSAS磁盤陣列,存儲服務器)網絡:Cisco網絡設備,局域網,接入網,光纖通道存儲網國家電網的工程師,責任重于泰山!
linux運維工程師主要干些什么?有什么要求?我們知道多少?對于linux你了解多少呢?linux運維工程師職責linux運維工程師招聘linux服務器
工作職責:
1、負責Linux操作系統的安裝、配置,系統監控和維護,問題處理,軟件升級。
2、負責Linux系統下的常用軟件(如FTPServer、Apache、NginX、MySQL、ORACLE等)安裝及日常維護。
3、負責Linux的系統維護、優化。
4、負責Linux系統的網絡安全及數據日常備份。
5、會編寫常用的SHELL腳本。
6、能獨立完成新軟件的安裝和配置及工作文檔
7、了解Web技術/Java語言開發,支持其他部門工作。
8、了解TCP/IP/UDP/DDNS協議,能在Linux配置包括網站服務器,以及DNS/DDNS,和DHCP服務器等。
職位要求:
1、具有2年以上Linux系統維護的經驗,熟悉Linux/Unix常用服務的安裝配置與使用
2、精通Linux系統原理,熟悉內核參數調諧,精通基于linux的常用服務配置,如mail/nginx/dns等,并能夠快速部署;深入掌握apache、tomcat及weblogic配置及調優
3、熟悉Linux系統架構,管理以及優化。
4、熟練掌握LINUX網絡安裝、配置、日常管理、安全、備份、恢復、故障處理、日志分析等技能。
5、熟悉虛擬機技術,熟悉虛擬化架構下的系統維護、分布式管理、容錯、備份等技術。
6、熟練掌握交換機,防火墻等常用網絡設備的配置,熟悉TCP/IP協議
7、熟練相關應用服務器如web、email、ftp、http等
linux運維工程師主要干些什么?有什么要求?我們知道多少?對于linux你了解多少呢?linux運維工程師職責linux運維工程師招聘linux服務器
工作職責:
1、負責Linux操作系統的安裝、配置,系統監控和維護,問題處理,軟件升級。
2、負責Linux系統下的常用軟件(如FTPServer、Apache、NginX、MySQL、ORACLE等)安裝及日常維護。
3、負責Linux的系統維護、優化。
4、負責Linux系統的網絡安全及數據日常備份。
5、會編寫常用的SHELL腳本。
6、能獨立完成新軟件的安裝和配置及工作文檔
7、了解Web技術/Java語言開發,支持其他部門工作。
8、了解TCP/IP/UDP/DDNS協議,能在Linux配置包括網站服務器,以及DNS/DDNS,和DHCP服務器等。職位要求:
1、具有2年以上Linux系統維護的經驗,熟悉Linux/Unix常用服務的安裝配置與使用
2、精通Linux系統原理,熟悉內核參數調諧,精通基于linux的常用服務配置,如mail/nginx/dns等,并能夠快速部署;深入掌握apache、tomcat及weblogic配置及調優
3、熟悉Linux系統架構,管理以及優化。
4、熟練掌握LINUX網絡安裝、配置、日常管理、安全、備份、恢復、故障處理、日志分析等技能。
5、熟悉虛擬機技術,熟悉虛擬化架構下的系統維護、分布式管理、容錯、備份等技術。
6、熟練掌握交換機,防火墻等常用網絡設備的配置,熟悉TCP/IP協議
7、熟練相關應用服務器如web、email、ftp、http等
第五篇:漫談運維—運維工程師
《談網站或其他服務器運維》,這里只談運維工程師所要做的細節工作,讓人們知道運維工程師到底都在做些什么,至于上級所要做的,只是提一下,不做參考。
以下是個人觀點,我說的只是我自己的想法,也是我發展的目標。你可以有異議,我們是來交流的。你對的我肯定會向你學習。因為我也在摸索。運維工程師至少要能做以下的工作:
1,網絡工程師的工作
你至少要能配置CISCO 6509以下的設備,熟悉各種網絡協議,否則網絡出問題的時候你會傻掉。
2,系統工程師的工作
你至少要理解各種系統服務,在出問題的情況下要迅速解決問題,而不是等系統工程師來解決。
3,安全工程師的工作
我不要求你一定要會各種網絡編程,但是在服務器收攻擊的情況下,沒有防火墻的情況下,做一些簡單的處理工作。
4,存儲工程師的工作
至少要熟悉各個廠商的設備,各種備份和還原的辦法
5,測試工程師的工作
在新版本上線之前,你至少要協同測試工程師做測試工作,因為你是運維人員,不了解程序架構導致無法解決故障,你也有一份責任。
6,研發人員的工作
運維工具都需要自已開發,熟悉開發語言,需要有過實際開發經驗,否則工作會非常痛苦,我深有體會。
7,英語
不想說了,我的最大痛苦就在這里
8,好的溝通者 不出問題時候你可以打游戲睡覺,出問題的時候要能和項目人員溝通,快速解決問題,而不是推;我知道有很多人能推責任,你可以做替死鬼,但是離開這個工作你還能找到更好的;把責任推到別人身上的人,下次出問題的時候,絕對沒人幫你。你要能和各個兄弟部門關系非常的密切,出了問題有兄弟幫你擔責任;也要能非常扯皮,沒事在會議上把別人都搞定。
9,庫房管理員
數萬臺服務器讓你來管理,任何丟失或者損壞都是不負責任和失職的表現。
10,運動員
不要回家就睡覺,有空還是運動下吧;在服務器down機的時候,機房恰巧就你一個人,機柜沒有空間,你需要更換一臺HP 585 4U的服務器,滿配約80公斤的服務器,你怎么做?
11,責任心
這個我不想說什么,這是你的職業精神。
12,組織者
給你2個啥都不會的民工,再給你2000臺服務器,要求你2天把服務器裝完,你咋辦?
13,1-7條中,你必須有一條非常精通,是這個行業的專家。否則過了32歲,沒有公司要你。
大家看了肯定覺得這個人是神仙,但是這必須是你慢慢能做到的,至少是我6年來運維經驗的一點總結。
因為現在的公司都在用招聘民工的錢招聘神仙,其次我也是想讓各位看看,運維工程師要擔負多少責任。
我去面試過的一些公司都說,你什么都會,什么都不精。我說對,正是需要我們這些什么都會的人領導什么都精的人。
我這句話沒有貶低大牛的任何意思,只是當時一個臨場的發揮。雖然說完就知道這個面試白來了,但是我還是想為廣大的運維工程師出口氣。
不怕千招會,就怕一招精。這仍舊是我給大家的建議。
最后給大家最后最大最重要的建議,做什么工作都可以,千萬別做SA。我把SA的定義成:speediness answer而不是system admin。為什么?你可以想象一下哪些工作需要快速響應。網絡工程師需要,機房網絡骨干交換機故障,整個機房所有服務器無法連接,需要快速響應不?系統工程師需要,系統出問題了,要快速響應不?安全工程師需要,服務器被攻擊了,要快速響應不?存儲工程師需要,公司核心存儲有問題了,要快速響應不?
你可以做研發,出了問題可以測試,可以想辦法慢慢解決;你可以做DBA,出了問題可以推到網絡工程師或者系統工程師身上,說不是DB連接問題;你可以做測試工程師,你說有問題這個東西就可以不上線??在出問題的時候,倒霉的就是SA,所以不要再爭論SA包含哪些工作,SA就是一個倒霉的快速響應者,你想,哪個SA 24小時不開手機?哪個SA 晚上可以舒服的睡覺或者安心的出去度假?走在路上一聽到和自己手機短信鈴聲一樣的,利馬下意識的抓出自己的手機看看是不是服務器報警;晚上和老婆 XXOO00,一個電話過來,立馬停下,抓出手機看流量圖;包里放著筆記本,但是因為還要開機,太慢,拿著手機上putty ping或者telnet機器??
這就是大家羨慕的SA,你也不要抱怨自己做了SA,生活就是這樣。所以不要再爭論哪些xxx員應該歸屬于SA,系統管理員或是運維工程師,如果想做這行,就安生的當一個“快速響應者”,這是你的職業,也是你需要做到的。作為一個SA,你肯定經歷過通宵好幾天加班做事,你肯定經歷過飯買來已經忘記了吃,你肯定經歷過幾天加班沒睡覺,著個沙發坐下就失去知覺睡倒??沒有經歷過不能說你不好,只能說你管理的機器太少。
我公司是每月發21天工資,某兩月我一月發了44天工資一月發了47天工資,創全公司建司7年來加班記錄??項目做完自然也就落了個部門通告表揚,然后的結果就是健康情況急劇下滑,然后就是某天晚上在機房內加班一通宵,穿著短褲進機房,然后一個通宵被機柜下面的冷風吹了個關節炎??這就是做SA的代價。
以下是一些實際經驗,發給大家做參考,有任何問題可以mail我,answer3ai@gmail.com
有的東西是企業機密,我不能透露也不能給你相關文檔。
一,架構設計
現在你要做的,就是設計你的服務器架構和網絡架構。這要先看你的網站是做什么的,每日有多少的人數訪問,例如,我打算站點初期每日有20000左右的訪問量,和1000人左右的并發量。我可以用我的人數并發量1000×站點中每個頁面的平均大小200k×每個訪問用戶可能要打開4個網頁=800 000k=800M的網絡流量(當然這個數字肯定是非常的過分,至于為啥,自己可以想下)
然后可以用測試環境用軟件檢測在你的真實環境下的服務器壓力,比如在2000人在線的情況下,服務器的cpu占用多少,內存占用多少。
那么你可以得到你大致配置,其實市面上的標準服務器配置都足夠你用了,比如現在的DELL 1950,HP DL360G5,IBM X???(忘記了)
等服務器,足夠我跑一個這樣簡單的網站。其實說白了,雙奔3都夠,真的。當然你網站的流量比我要大的多,那你可以買的更好一點的服務器。或者負載均衡器。
網絡架構
站點現在是一臺獨立服務器,未來采用的是分布式架構,比如bbs.hilinux.com是一臺服務器,man.hilinux.com是一臺服務器??
mysql是一臺服務器。這樣你要算服務器要多少臺,交換機要多少口,防火墻要買什么級別的。
哪些服務器可以放在一個防火墻下,哪些服務器不用防火墻保護,哪些服務器是內網服務器,需要什么樣的網絡連接,最好是畫出大致拓撲,方便你預算設備花費。
服務器交換機等設備選型和購買
說的簡單點就是買什么機器,你可以和google一樣開始,買幾臺pc作為你的網站服務器,也可以自己組裝一臺服務器
或者也可以和我一樣,去挑選品牌服務器當然,現在你要看你服務器做什么的,你可以親自去電腦城看組裝服務器,也可以打電話到IBM,HP,DELL的各地銷售商讓他們送服務器來測試,當然你不要告訴他們你只買一臺,那你就別指望測試了。我告訴供貨商hilinux.com需要200臺服務器,一個F5,10臺CISCO 2960交換機,3個NETSREEN206防火墻,一個EMC CX500+滿硬盤 那么不到3天,hilinux.com所需要的4臺測試服務器,就送來了??當然,不要牛了這么多最后只買1臺,那么你晚上走夜路會被人打的。
最后就是價錢問題了,這個你自己看著辦吧。讓你公司的財務或者采購出馬砍價付錢就是了。當然,除了服務器的服務,你最好還是想想有利于自己的服務,比如人家公司可以幫你拆箱子了什么的。我做的最弱智的一件事情就是,來了400臺服務器,50個交換機,8臺EMC,我一個人花了一星期把箱子才全部拆完??
機器選型的時候你也要為自己考慮,比如HP的ILO功能,可以讓你遠程BIOS級操作服務器,比如浪潮的自動資產管理等等,為自己管理服務器提供便利,否則機器10來臺還好,100臺還一般,我這里3萬來臺,我不死幾百遍了。丟失一臺服務器,幾個月工錢就沒了??
二,IDC選擇
首先要看你服務的地區是哪里,然后再去找當地的電信機房。畢竟,雖說全國已經互聯了,但是各地的網速還是有差異的。
或者說有的IDC機房利用率高,雖然出口帶寬大,但是利用率高的結果是導致你網速慢的原因之一。
我的做法是在全國各個機房的服務器用pingplus這個軟件進行一周的的流量測試。可以看到平均丟包,最大延時等等。
當然,你也可以到你目標服務的地方,找個可以上網的地方進行網絡測試,比如說網吧包個機器??
好了,網絡測試完了。那么你已經決定去哪個IDC了吧。
然后你就可以電話或者自己提著禮品登門拜訪一下IDC服務商的老大了
當然,你也可以找代理服務商,因為他們拿到的價錢有時候比電信或者網通給你的價錢低,但是,關鍵還是一個服務,因為你畢竟服務器放在那,晚上關鍵著急沒人給你重啟,機器出了問題其實按個F1就可以解決的問題,服務商的值班人員不懂。你就只能打晚上的打飛機去機房維護吧。
提著東西拜訪一下服務商老大是禮節性的東西,東西不在多而在精,這樣你未來談事情人家也給你綠色通道,做事情要好做很多。當然,我也不反對你空手去,你一次租個100個機柜+10G帶寬,人家還是很優惠的。哈哈。大家都是混口飯吃,也不至于難為你什么。
最后你要知道現在的中國還是賣方市場,你給人家牛,那你買的產品只能是??蒙牛 然后是開始去參觀機房
細心的檢查一下空調數量,空調出廠和最后維護日期,網絡布線類型和架構,是否可擴展,主備從電力等。
基本都是非常關鍵的東西,出問題了,人家可以給你更換一個新的,服務很好,但是你服務器掛一天的損失是多少,你可以自己掂量。
還有機柜電力,現在的機柜放置16臺1U的服務器是正好,多了過于熱,少了資源浪費;但是你發現人家只讓你用10安培電力,過了要交錢買電;
或者不限制你用電,但是插線板只有10個,你還真買個托線板去轉接?你要想想你一個托線板掛了,你服務器要掛幾個?
最后,我的一個機房包間里140個機柜,2個空調,結果某天掛了一個空調,雖然6小時人家IDC商就給更換了一個空調機(這速度已經非常快了),結果我機器至少被熱死了100臺以上,機器是HP的,機器過熱,HP會自動關機,而且會不讓你啟動。你崩潰不?注:不是給hp做廣告哈。
三,服務器上架
好了,要是你買的服務器到了,你會發現你接到電話后,樓下一個N大的“擎天柱”集裝箱車給你送服務器來??(某次我收2000臺服務器就是這樣的陣勢);在這里有個重大的提示,你們財務給廠商下單的時候,收貨地址一定要寫對。比如 XX路XX號XX大廈XX樓XX室,你寫到xx號,送快遞的會給你堆到院子里,你寫到xx樓,送快遞的會給你送到電梯口,你寫到xx室,他們才會給你搬到室內。因為送貨的都是服務器廠商找的,你因為這個事情去聯系廠商修改送貨地址,至少要多等N小時。而且他們視你的單子的數量和樓層,判斷來多少搬運人員。而且,一定要把服務器搬到你指定的地方再簽字收貨,否則??嘿嘿??
我最霉氣的是:來了20臺機器(還好不多),下著大雨人家給我往院子里一丟,讓我自己搬上19樓,我沒推車沒啥的??
你可以說,找電信的幫忙撒,廢話,這個我還不知道。那我告訴你,我在某電信大樓工作時,從CCIE到機房主管到機房工作人員,全部是美女??
雖然我在這個地方只干了5天活,我的同事們口水都有3尺長??你還叫人家給你搬機器不? 你可以說,雇民工撒,我又不是沒雇過,錢得你自己支付,公司不給你報銷的話,爽不?
下面是拆箱子,面對著堆積如山的2000臺服務器,我是連抬手的力氣都拿不出來??當時機房只有我們公司3個人+電信值班2個人??
這時候,我的辦法是??我打電話找來了2隊收廢品的:
這么多箱子,除了機器和電源線留下,里頭的導軌光盤等等你全部拿走,誰拆的多誰拿的多??
最后按照我的要求幫忙搬到機柜上??于是我們5個人是監工??看人家拆箱子搬機器。
于是人家2隊人找來了30多號人,一早上把2000臺機器全部拆箱子完畢放到機柜上。
要是我們幾個人拆,估計????
最后再說個行價,服務器箱子一個價值5塊錢甚至更多。你服務器到了,賣賣箱子請大家吃飯吧。別讓掃地的阿姨拿走,幾個無所謂,10來個箱子,夠大伙兒吃頓烤肉了??還有EMC的木箱子??拿去養個小雞小鴨的??
42U機柜1U的服務器最好是16臺。你就看著上吧。呵呵
四,安裝系統和布線
好了,面對幾千臺服務器開始裝系統,我不知道你會怎么想??
全部是1U服務器有什么辦法安裝系統?(我們公司窮,買不起刀片;而且電信不配合,要是上刀片,電路你們自己拉線,價錢還是原來的價錢;最重要的??我們公司以人為本,寧愿多養個人也不愿意買個好服務器讓人失業),而且不允許GHOST,因為你這是服務器,不是網吧??GHOST出來的系統,我不知道誰用過,爽不。我自己是郁悶郁悶到了,莫名問題的時候,你就知道GHOST還是靠不住的。
其次,我們公司安全部要求:必須得一臺一臺安裝,先安裝光板的系統(比如沒有SP的WIn2000),然后手工打SP4補丁,不能網絡打補丁。于是我們就光盤堆成山。最扯淡的,為了快,我做了一個補丁共享的服務器,所有的補丁CP的本地來打。結果忘記拔網線,導致人家說我們是插了網線打補丁,有中毒的危險,需要重裝。我直接崩潰?? 辦法1,你可以1臺1臺慢慢裝,反正這么多機器,你可以管公司要更多的時間。但是我們公司一般是機器到了,最多2-3天就要要,一向是那種計劃不如變化快的沒有計劃沒有進度管理的“小”公司,項目組拿著雞毛當令箭,牛x哄哄的公司。郁悶!
這個時候前期的準備就比較重要了(我公司多用windows2003),因為首先我要裝一個光系統,再打驅動,再打補丁,再安裝遠程控制軟件。一臺機器裝完大約要1小時多點。那么機器多了怎么辦?光盤不夠怎么辦?等等問題就來了。
我的辦法是,我一看TMD全部是DVD,IBM的機器直接佩combo,公司給我們發的全部是CD,娘的,典型的沒有最慢只有更慢,出了問題閑你慢的領導班子。于是只好自己出錢買了DVD,用軟件把RAID,網卡,顯卡其他驅動做到光盤里,需要安裝的軟件也直接做成自動安裝的方式,補丁也刻錄到光盤里(我們要求補丁必須單打,不能安裝集成補丁的ISO,shit),這樣弄,你只用把光盤往光驅里一丟,分區一分,就可以下一臺機器了。然后等你在去關注這個機器的時候,已經可以設置IP插網線了。靈感來自番茄花園。吼吼。
當然這時候你最好是買個KVM,16口的KVM,一次準備16張光盤就可以用一套鍵盤鼠標操作16臺機器。當然啦,KVM是可以級聯的,我最牛一次一次一套鍵盤安裝166臺機器。郁悶的是,塞光盤塞死,插KVM線插死,配置IP配死,有時候還會弄錯??
辦法2,你可以用NETKVM去遠程安裝,但是你插那些NETKVM的線路,2000個插下來,爽不?然后你繼續扎KVM和網線的時候,看著和瀑布一樣的網線和KVM線交錯在一起。估計直接崩潰。遠程KVM有的牛x的是可以分發ISO的,就是傳說中的遠程分發安裝。可以自己買一個研究研究了,我們公司以人為本,從來不買這類高科技。
辦法3,我犯賤時候發明的:我們的機器全部是RAID1,于是我安裝一臺raid1的機器,系統全部安裝好,然后拔掉一個硬盤,插上一個新硬盤自動恢復鏡像,基本10來分鐘恢復好一個硬盤,插到機器上去。這樣,還是比裝系統來的快。當然啦,型號是一模一樣的??
辦法4,HP的ILO2功能,實現遠程分發。前提你得一臺一臺配置好BIOS里的ILO2。也是蠻痛苦的。IBM和DELL現在也都有這個功能,但是你在分發以前,還是得一臺一臺機器插上網線,配置好BIOS的IP,痛苦。然后把操作系統和機器的驅動程序和后續的軟件全部做到一張DVD里,讓他自動運行。然后所有的服務器遠程運營這一個ISO,最好多弄幾臺,否則一臺機器弄的慢死。
辦法5,絕對最簡單的辦法!!就是買機器前,讓廠家給你在硬盤里灌好系統,和你買筆記本一樣,打開是個安裝完成需要你輸入序列號的系統。但是弱點是后續的軟件需要自己裝。因為服務器廠商是不會幫你安裝別的軟件的。還有更多的辦法,只是暫時沒想到,大家也可以談論自己的辦法。互相交流嘛。(51CTO編輯注:其實現在已經有很多無人值守安裝系統的管理軟件,比如KickStart和現在流行的Cobbler,都是不錯的批量安裝工具,而且都是開源的。現在都追求自動化,希望越來越多的運維們將不必面對一臺一臺裝機的困擾)
所以我喜歡linux,可以用N種辦法安裝系統。
windows就是個讓IT人當裝機男,挨踢人當民工。
好了系統裝好了,電源線和網線連接完,和瀑布一樣的。這時候還是盡量把他扎一下吧。
否則機器通風不暢,會導致熱死。
簡單辦法就是電源線扎一邊,網線扎一邊。有錢的公司可以買個網線序號標,沒錢就自己拿膠布標。
你可以隨便扎,或者和給你老婆梳頭一樣,好好扎。哈哈
插交換機的時候,從上往下,從1-24往后,這樣網絡異常,數一下就知道了。
想來想去這里也沒啥值得關注的地方。所以就幾行帶過。
五,資產統計
假如你的機器只有2000臺反而好容易管理了,但是現在我要管理的全國IDC有31個,平均每個機房有不同品牌服務器1500臺。
一共大約有45000臺的樣子(我的資產管理系統里的數字,不包含交換機,防火墻等)
這時候怎么辦?
每季度和財務小MM一起出去旅游盤點IDC資產,幸福啊??(我們財務小mm很PL的哦)到了機房就是我一個人干活點資產,小mm帶著大口罩,披著雙層的放輻射服??
可憐我們這些干活的,短褲背心,IDC里一呆就是好幾個月(IDC辦公室就在機房邊上??),不知道精子被輻射殺死多少??
1,必須有資產管理系統,雖然這個其實是個很簡單的數據庫,但是你可以把每一臺機器的品牌,硬件信息,操作系統信息,購買年限,質保年限等,你非常關注的東西做一個詳細記錄,并配發同一的資產編號。比如我們的資產號,FWQ-123456 服務器-123456,這是一個總的資產號,這個服務器哪怕搬到美國,也是這1個資產,直到丟失,或者拋棄,都是這一個資產,永遠不會變。
比如我現在的板凳就是一個資產號是:服務器-000010的一個4U服務器,配置是P2 300*2 256M內存 16G硬盤×4 購買時間是1999年10月,從中維修過1次,升級過1次,在哈爾濱機房-廣州機房-河南機房-北京網通機房-上海公司內部測試機房-上海庫房服役過。
有歷史吧??.2,送到機房
看過我這個服務器去過的地方,羨慕不?見證我們公司的發展史。9年過去了,終于成了我的板凳??
服務器在購買合同確定以后,就應該按照配置記錄資產,并且在財務備案,資產編號一定和財務記錄相同。這樣這個服務器走到哪里,都有備案和記錄。現在要把這個服務器送到某個機房去,搬著走吧??汗
送到機房,我們要給服務器按照財務給的表格粘貼資產編號,選個順眼的地方,不會磨損的地方。
一般是機器正面某個地方,然后是機器屁股后面某個地方,然后機器側面把手的地方,粘貼3個,以防掉了就煩了。
然后在粘貼這個機器的應用資產號和IP標簽:
應用資產號舉例:FWQ-SH-XX-B31-WEBSERVER 意思是:服務器-上海-xx機房-B列31號機柜-web服務器
IP標簽舉例:外123.234.123.234內10.0.0.1。這2個標簽你可以分開也可以在一張標簽上寫清楚。
并且在安裝服務器的時候。把FWQ-SH-XX-B31-WEBSERVER-123-234 把這個作為你的HOSTS信息,windows里叫做計算機名
這樣遠程上來都非常清晰自己在哪個服務器上,出問題時候也非常容易找到這個機器,不要閑麻煩,一切的麻煩都是為了以后快速的解決down機問題而做的。當然啦,甚至在密碼管理上你也可以用這個規則來設置密碼,但是最好規則別讓別人知道了??
3,把這些信息全部錄入你的資產管理系統
系統無非服務器名,IP信息,用途,機架位置,或者是否在使用一類的,我就不多講了
4,資產系統軟件交互,也可以說是監控系統。
企業可以開發一個軟件,在裝機的時候安裝到服務器上。然后資產管理系統定時去取服務器上的信息,比如網絡流量,CPU內存硬盤負載一類的東西,這樣你的資產管理系統又變成了一個監控系統;
當然啦,你也可以在資產系統里集成一個遠程桌面管理系統,自動載入用戶名和密碼,還有隨機碼,就可以登錄系統。省的還得管理服務器密碼。
然后用戶的訪問權限不同,看到的節面權限就不同。
比如說,監控人員沒有登錄權限,或者IDC人員沒有登錄權限一類。權限分配你自己研究好了。
5,還是IDC的工作。
話題繼續回到我和財務小mm去盤點(你公司比較大的話,你可以多派幾個人分開去各個地方??)
小mm一看我們機房服務器黑壓壓的一片,鋪天蓋地的,直接無語。為啥,因為要拿著資產表一個一個核對,面對幾千個機器,直接暈倒。
雖然按照資產管理系統里導出的信息,機柜號,IP號,機器從上到下的順序都非常精確,但是你一個一個核對,還是慢。
怎么辦?
庫房管理的工作用上了,哈哈。你買服務器或者買筆記本電腦的時候有沒有注意到箱子上的條碼?
那個條碼非常清楚的記錄了這個機器的詳細信息。所以黑莓手機或者NOKIA手機(別的我沒用過)都有掃描條碼的功能??好像與主題無關??
那么剩下的就簡單了。
去買個這種條碼標簽的打印機,編輯成自己需要的條碼,一個一個貼好,上面有你所有需要盤點的信息?? 比如我們是從資產到機柜號到服務器名字到內外網IP都要盤點??小崩潰
打印出來貼上去。然后買個掃描槍,和超市那種一樣,不過你要買有存儲功能的,否則你要端著筆記本去掃描,SB了。
然后我和財務mm本來需要一個人念號碼一個人核對(你要直到在機房里大喊資產號,喊一天的結果是啥,自己想),現在一個人拿一個掃描槍,按照規則一個一個掃描。完成后把數據導出后重新整理分析。直接和數據庫核對(當然這個也需要你自己開發),核對完成生成一張表。
表上寫的非常清楚你哪個機架沒有哪個機器,哪個機器不在特定的位置上,哪個機器缺少??等等
這樣比如說,機器位置不對扣5塊錢工資,機器IP不對扣2塊錢工資,或者??反正扣到最后??這月不給發工資了,還得倒貼點??哈哈哈
六,監控架構
監控架構其實每個地方都有自己的做法,我也知道我的辦法不是很先進,但是仍然拿出來和大家一起討論
首先談談監控軟件,一說起這個常用的東西MRTG,cacti一類的就都可以用了。只要稍微歸類一下,流量展示看的還是很清楚的。
要是要監控服務一類的,那就只好啟用大名鼎鼎的nagios,和一些牛x人基于這個做的一些別的商業軟件。
或者就是自己做個腳本去定時探一下,不通了給你發郵件了啥的,你vim一下nagios的chack_xxx,學習一下里頭人家探測的辦法,自己也能搞出來個啥東西,都還是很不錯的了。
作為IDC工程師,我們所要關注的東西就是個流量了,我們要很清楚某臺65下的某臺35上每個口的應用,當遭受攻擊或者流量異常的時候,一眼就能知道是怎么回事。我不相信你天天看著10M的流量,某天突然一下給你來個80M,你說這是正常事件吧。哪怕正常,你也找相關的人確認一下吧,一個100m口跑 80M,估計電信的人都來找你了。
每天看著這些流量圖是很枯燥的事情,那么我們沒事只能想辦法讓他自動報警給我們了,于是EMAIL報警,然后把他發送到一個有手機提示新郵件的郵箱,你手機就有了。MSN報警,還是不錯的吧,手機報警一類的辦法都是不錯的。這樣你你可以和我一樣放心的去打網游了。這里只談經驗,不談詳細的技術,因為我一說我的系統架構地球人都知道我是哪個公司的了,雖然已經離職,但是咱也有個職業道德,謝謝。
當然了,有些公司是有網絡監控部門的。但是我就一直在想這個問題,所有的數值都可以用短信報警,你隨時都可以收到信息。用這個部門干啥,讓一群可憐的家伙 8小時一動不動盯著屏幕,公司又在他們電腦上安裝了抓屏軟件,上班事件聊天上網就扣錢??我估計他們每天最期望的事情也莫過于服務器掛了,可以給我們打個電話重啟個服務器或者連到服務器上檢查一下啥問題,重啟個服務了啥的。當然了,這些兄弟最后的職業方向也只能是進入運維部門了,至少公司服務器宕機維護的流程性東西掌握的非常熟練了。但是這是用好幾年時間換來的經驗,太??所以我是奉勸兄弟們有發現監控部門招聘人,就別去了吧。面前8臺顯示器,猛一看還以為是黑客帝國吶,結果仔細一看全tmd是流量圖。常年對著8個顯示器,那個輻射??
我就不清楚設置個節點,出現問題告訴人,人去操作會死啊,非要讓人和機器一樣一動不動的盯著顯示器,TMD,官僚。雖然我沒經歷過,但是想也能想到。做SA,最大的要點是懶,把一些需要人做的事情都自動化??但是話說回來,我公司以人為本,人海戰術嘛,可以理解。
上面的帖子位子已經滿了,下來的帖子在這里寫。
企業實際面對的一些問題
我大概通讀了veyron 大俠的文章,認為系統架構方面的我絕對不如他。我就不在這里賣藝了,那么我賣企業都會實際面對的一些問題。
1,自動化,流程化你的信息管理
為什么要自動化,這年頭流行辦公自動化,你丫沒事還拿著工單四處簽字,老土了吧。
為什么要流程化,這念頭流行流程管理,假如你公司沒有一個固定的流程管理,出了事情,大家都不知道怎么做,各個部門的電話亂打,大家都一鍋粥沒有效率。所以,未雨綢繆,在沒有出問題的時候,模擬出問題,多多準備,建立規范的流程,公司的每個人都要遵守,這樣,流程化的管理+辦公自動化,大家只用在電腦上翹翹鍵盤,點擊確定,流程就發出去,一路審批,OK,流程發送到做事的人地方,也許這個做事的人在美國,也一樣方便。
上面說的是一個原理和意思,用這樣的理念去管理你的服務器應該如何去做?當然了,你假如只有10來臺服務器,就不用考慮這個了??.首先服務器采購錄入資產管理系統(詳細見上面有寫),服務器的去向和調度都在管理系統里有提現。
這里說的是:如何去上架,維修,下架等流程控制
先說上架下架:服務器到機房以后,別人要用服務器怎么辦?先可以到你的資產管理系統里,看你機房還有什么配置的機器多少臺,然后讓他們選擇自己項目服務器的配置,數量。在流程管理系統中,把這些機器選中,生成一個表單,表單名字為xx項目上架需求,寫清楚誰用,做什么,數量,哪個機房等。然后提交給他們部門領導,他們部門領導同意后,轉給需要審批的領導,一層層下來,流轉到我們部門領導,我們部門領導流轉給部門機房員工,員工收到流程,檢查上架下架服務器;如要上架,安裝完系統后填寫IP,機器名,機架等相關信息。如要下架,刪除相關信息,提交給流程控制的人員,流程控制人員確認后,這個流程完成。屆時,所有的人審批過的數據,經手人,數據庫里都有,出現什么問題找相關責任人,一下就找到了,省的和某些XX部門JJYY。
維修也一樣了,機器壞了,或者需要重裝系統,按照上面的流程,一步步走一遍,就可以了。年底統計機房一天要干多少活,省的某些領導認為機房人TMD都在閑著。機房的人呢?沒有流程不干活,否則白干。
在流程系統里重啟服務器,重啟服務器要是要流程,就太慢了,那么你可以做一個綠色通道,寫清楚原因,重啟哪個機器,直接提交給相關機房人員,在你的流程系統里綁定一個短信網關,機房人員可以收到需要重啟服務器的短信。準確無誤。
這樣代替了無紙化辦公,既有自己做的事情的每一個記錄,又有相關人員管理,可以量化自己的工作,免得年終獎的時候xx人有說你干的少,發的少。你把記錄拉出來對比對比就知道誰多誰少了。
2,如何升級你的服務器
服務器老了,或者需要加內存加硬盤,怎么升級。
雖然說是很簡單換個CPU,加個內存,加個硬盤很簡單。
但是,如何控制你的配件不丟失,確定的安裝到機器上利用了呢?
簡單,在服務器上做一個探測服務器配置的客戶端,每天探測一次硬件配置發送到資產管理服務器上。
與資產管理系統的硬件配置做對比,出了問題就報錯發一封郵件到機房工作人員,抄送流程控制人員一封就可以了。
至于的加內存的時候注意型號啥的問題就不說了,大家應該都沒問題了 要說的是,假如你一個機柜上放的機器比較多,比如4個6個機器一摞,恰巧壞了,恰巧一個人在機房,非得解決,怎么辦?
簡單,一個辦法,但是還是需要你有力氣,雖然有力學原理
比如有4臺服務器,最下面的壞了,你可以拽住最下面的把4臺一起往出拉,拉出來一點,把上面3臺往后推,這樣一點一點的拉出來,下面最關鍵:
拉到最后,前面要留出來一點,輕輕的把上面3臺的尾巴著地,然后一只手抬住上面3臺機器,一只手拉出下面一臺機器。
上面3臺一定要留出來一點,否則放下的時候,機器和機柜托板會壓住你的手,你一松手,機器震一下,硬盤就掛了??
所以在推進去的最后仍舊要留一點在外面,最后放下來了再推進去這最后一點。
然后就可以換或者加內存了。相對比較省勁,不危險,不會壓倒自己,不會砸壞服務器的辦法就是這樣了。