前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的網絡運維服務培訓主題范文,僅供參考,歡迎閱讀并收藏。
系統運維工程師需要熟練掌握硬件維護知識與技術手段,熟悉計算機操作系統、交換機等知識,能及時解決問題與故障,以下是小編精心收集整理的系統運維工程師工作職責,下面小編就和大家分享,來欣賞一下吧。
系統運維工程師工作職責11.負責城市視頻監控系統前端系統的巡檢、調試工作;
2.負責城市視頻監控系統前端系統故障的判斷與排除;
3.負責一般性網絡、監控等技術問題的咨詢工作;
系統運維工程師工作職責2負責ERP等應用系統的安裝、配置、升級,保障系統正常運行;
負責ERP等系統的日常技術支持,系統異常處理;
負責ERP等系統的數據備份;
負責編寫ERP等系統有關的操作和培訓文檔;
負責公司內部業務需求調研,流程梳理、方案規劃并實施ERP等系統二次開發;
系統運維工程師工作職責31、orcale數據庫日常管理及優化
;
2、NC系統需求收集、整理及分析、問題處理;
3、NC系統報表收集、整理及分析;
4、NC基礎數據維護、;
5、OA系統的維護;
系統運維工程師工作職責41、負責公司測試環境和生產環境的Linu_Uni_服務器維護管理工作,保證測試和生產環境的穩定運行;
2、負責公司特定線上產品的安裝、部署、更新、監控、日常運行維護;
3、負責公司服務器及日常系統維護、優化,保證系統的穩定,負責應用系統上線安裝、調試、優化、備份、故障處理與跟進;
4、負責公司實施和維護項目的服務器支持工作,解決生產和測試環境中出現的故障或問題,同時提供數據備份、性能監測優化等方案;
5、負責監控全網站線上所有服務器與應用,系統狀態監控,故障受理,常見故障處理與分析及反饋,報表統計等工作。
系統運維工程師工作職責51.負責協同MES系統的上線實施及上線后的運維、優化工作,確保產線的正常運行;
2.負責協同ERP系統的上線實施及上線后的運維工作;
3.負責公司日常桌面支持(包括常規辦公設備及網絡故障排除)。
4.負責相關工作文檔資料整理、修訂及領導安排的其他相關工作。
系統運維工程師工作職責61.負責計算機軟硬件安裝、配置、升級、故障診斷及日常維護;
2.負責其他IT設備(打印機,NAS,網絡通信設備等)的選型、供應商對接與日常運維等;
3.負責公司OA以及釘釘系統用戶管理,應用配置,流程配置,表單設計等日常應用運維;
4.負責新入職員工電腦辦公軟件,郵箱,OA系統,共享盤等必備軟件的初始化工作;
5.負責信息化系統與相關硬件的使用培訓,操作注意事項宣導等工作,建立良好的信息化環境;
系統運維工程師工作職責71:負責相關故障、應急問題的排查處理,整理故障;
2:負責網絡監控和應急反應,以確保網絡系統724小時的持續運作能力;
Abstract: The quality issue of IT operation and maintenance services has drawn increasing attention of customers and service providers. The service quality improvement can start from the research and analysis for customer needs and the status of services, through the analysis for the service quality problems and their root cause, to find the most effective way to solve the problem. Quality improvement using project-oriented approach to manage and implement, through the project plan and start meeting for formal confirmation of quality improvement objectives and their implementation and management methods, can effectively ensure the quality improvement work smoothly. IT service management system construction is the focus and fundamental to improve the quality of service, according PPMT implementation framework to define the specific content of management system, and fundamentally improve IT operation and maintenance service quality.
關鍵詞: IT服務管理;運維服務管理;服務質量改進;管理體系建設;PPMT實施框架
Key words: IT service management;operation service management;service quality improvement;management system construction;PPMT implementation framework
中圖分類號:C931.2;C932.2 文獻標識碼:A 文章編號:1006-4311(2013)23-0168-04
0 引言
當前,國內已經步入“服務經濟”的發展階段,以現代服務業為主導的現代產業體系也逐步建立起來。信息化在提升企業的運營效率和核心競爭力的同時,也使企業對信息化的需求和依賴程度不斷提高,而IT運維服務作為現代服務業的重要組成部分,為企業信息化提供了強大的支撐。因此,IT運維服務越來越受到各級政府和各類企業的重視。在IT運維服務業蓬勃發展的同時,IT運維服務的質量問題也引起了相關客戶和服務提供商的關注。
筆者有幸參加了W公司所承接的廣州市某信息中心網絡平臺與IT設備維護項目(以下簡稱本項目)的IT運維服務質量改進工作。在提供本項目的服務過程中,W公司收到了客戶方領導層對服務質量的嚴重不滿和投訴。筆者作為公司后端的IT服務管理咨詢顧問,受命啟動專門針對本項目的IT運維服務質量改進項目(以下簡稱本質量改進項目),著手改進其服務質量并提高客戶滿意度。本文將筆者在本質量改進項目中的主要實施方法和過程進行介紹和展現,希望能夠給同樣關注IT運維服務質量的同行們一點啟發和幫助。
1 對客戶需求與服務現狀的調研和分析
任何服務質量的改進都是源于對客戶需求的高度關注和對服務現狀的調研和分析[1]。筆者在介入本項目之初,就將重點工作放在對客戶需求的調查了解、以及對IT運維服務現狀的調查與分析兩個方面。
通過與客戶方和前端一線服務團隊的充分交流、以及對服務情況的現場調研,并在此基礎上進一步調閱和分析了本項目的招標文件、投標文件、項目合同書等關鍵資料,筆者了解到W公司在IT運維服務提供過程中主要存在以下四個方面的不足,需要進行重點質量改進,以盡快提高用戶的服務體驗和客戶滿意度。
①沒有為客戶提供針對三年服務期的一整套目標明確的工作計劃和時間表;沒有幫助客戶理清和優化IT服務管理業務流程;在日常服務過程中沒有認真落實IT資產管理辦法,沒有為客戶提供一套定制的IT資產管理系統軟件并有效使用起來,最終導致客戶的IT資產失去應有的管理,過去一年中IT資產數據基本沒有與實際情況同步變更,目前整個IT資產數據不全不實。②客戶需要對全區電子政務網絡提供系統化的診斷和保養,解決目前該網絡可靠性不高、上網速度慢的隱患,這項工作一直沒有開展;客戶強調提供服務的應當是一個有技術梯度的專業網絡團隊,而不僅僅是一名前端服務工程師。③提供服務的IT服務工程師技術能力不足,一個故障要反復上門幾次才能解決,服務只能依賴于個別技能較好的服務工程師。④每月例會上客戶提出的服務目標和要求盡快改進的重大問題基本無法實現,計劃和執行情況的檢查工作沒有開展,用戶的真實需求沒有上傳到公司,造成公司的決策偏差。
上述四個方面的問題,可以通過運維服務計劃和實施方案、資產普查、IT資產管理系統軟件的定制開發與應用、專業網絡團隊的診斷和保養、知識管理和業務培訓、團隊管理、問題管理、會議管理等方法分別予以解決。但是,如果只是采取“頭痛醫頭、腳痛醫腳”的方法解決眼前的問題,也很難真正解決客戶在未來可能遇到的其它問題,只有充分挖掘上述四個方面問題的根源,從根本上解決導致這些問題的本質原因,才能真正保證以后的服務能夠充分滿足客戶的需求。因此,筆者對造成上述問題的根本原因進行了分析,發現這四個方面的問題,主要來源于兩個方面:一是W公司對客戶需求的理解偏差和溝通不暢,二是W公司沒有一整套嚴格的標準化的IT運維服務規范和管理制度。由于溝通不暢和需求理解偏差,所以客戶的重點需求沒有得到應有的重視和實現;由于缺乏標準化的IT運維服務規范和管理制度,所以需求理解偏差沒能及時發現和糾正、計劃和檢查沒有開展、不能發揮團隊能力。而這兩個方面的最根本原因,則是W公司沒有真正建立科學的標準化的IT運維服務管理體系。因此,筆者將本質量改進項目的工作重點放在IT運維服務管理體系建設方面。
2 質量改進項目的工作計劃與項目啟動
在明確了本質量改進項目的工作重點以后,在著手開始質量改進工作之前,首先要得到客戶和W公司雙方領導的確認,以保證質量改進項目的工作能夠真正實現對運維服務質量的改進目標。因此,筆者在前期調研和分析基礎上,草擬了《運維服務質量改進工作計劃書》,在征求雙方領導和運維服務團隊負責人等主要項目干系人的意見并獲得通過后,召開了“運維服務質量改進工作項目啟動會”。啟動會上有客戶方領導、W公司高層領導、運維服務團隊負責人(包括運維服務項目經理和W公司運維服務中心項目總監)、運維服務質量改進項目負責人(筆者)和其他項目干系人到會參加。通過項目啟動會的召開,將本質量改進項目的項目目標和工作范圍、項目組織結構(如圖1所示)、主要項目團隊成員和分工、項目工作內容和工作方式、項目進度計劃等內容進行了討論和確認,從而正式將質量改進工作以項目化運作的方式確立下來,并使本質量改進項目的目標和范圍得到各方面的正式確認,從而為質量改進工作的順利開展創造了一個良好的工作環境和管理基礎。
根據項目啟動會上確定的質量改進工作計劃書,本質量改進項目的總體目標包括完善運維服務管理體系建設、IT資產與運維管理系統軟件的定制開發、IT資產普查與資產數據庫的建立和維護、網絡診斷和優化及其整體解決方案的提供、加強對IT服務工程師的服務規范和服務技能的培訓、進一步完善運維知識管理和知識庫、對用戶提供常用軟件使用和常見故障處理的培訓等七個方面。在這七個方面的總體目標中,第一個目標“IT運維服務管理體系的建設”是重點,其它六個目標在完成相應的工作任務后,都要將其工作內容形成規范和制度,并集成到IT運維服務管理體系中去,從而保證W公司在今后的IT運維服務過程中、以及其他的IT運維服務項目中,能夠始終保持改進后的服務質量,并使本項目的經驗得以固化和重復使用。因此,筆者將本質量改進項目的工作重點集中在“IT運維服務管理體系建設”這個目標上,其他目標的實現則根據任務類型由其他項目干系人分工負責。例如,“IT資產與運維管理系統軟件的定制開發”由W公司軟件研發中心負責人負責完成;“IT資產普查與資產數據庫的建立和維護”和“對用戶提供常用軟件使用和常見故障處理的培訓”由運維服務項目經理負責完成;“網絡診斷和優化及其整體解決方案的提供”由W公司運維服務中心二線專家團隊負責、“加強對IT服務工程師的服務規范和服務技能的培訓”和“進一步完善運維知識管理和知識庫”由W公司運維服務中心后端的IT運維服務管理咨詢團隊負責。這樣分工負責后,質量改進項目的七個目標就得以落地執行。
3 IT運維服務管理的實施框架與體系建設
在IT運維服務管理體系建設工作中,首先需要確定一個科學的IT運維服務管理實施框架。目前實施IT運維服務管理的較成熟和普遍的方法是ITIL最佳實踐[2]和ISO 20000國際標準。綜合企業再造理論[3]、多層BPR實施體系結構[4]和技術管理咨詢的PPT模型,IT運維服務管理的規劃與實施,需要從作業流程(Process)、組織架構(People)、管理與評估系統(Management)、IT技術和工具(Technology & Tool)、企業文化和觀念(Culture)這五個方面進行考慮[5];一般情況下,可以從前四個方面(即PPMT實施框架)實施IT運維服務管理,然后逐漸向第五個方面(即企業文化)滲透(如圖2所示)。因此,在本質量改進項目的IT運維服務管理體系建設中,筆者采用PPMT實施框架進行服務管理體系的設計和實施。
根據PPMT實施框架及項目需求,本質量改進項目的IT運維服務管理體系建設的主要內容包括IT運維服務管理業務流程及其配套的數據表單和統計報表的設計、運維服務管理組織結構及其崗位職責的設計、運維服務規范和管理制度的建立、IT資產管理及運維服務管理系統軟件的設計與開發等四個方面,在完成上述四個方面的設計以后,再將設計結果在IT運維服務項目過程中實施和應用。在設計和實施時,均要遵守“作業流程組織架構管理與評估系統技術和工具企業文化”的先后順序。
4 IT運維服務管理體系建設的具體內容
根據W公司與客戶的項目合同及其招標文件要求和投標文件承諾,在本質量改進項目中的IT運維服務管理體系建設可以從本項目的IT運維服務范圍和服務方式與服務級別、運維體系框架和各服務管理工作流程、運維服務組織結構及崗位職責、相關服務規范和管理制度、相關數據表單的格式設計與填寫說明、相關統計報表的格式設計與數據來源、IT資產管理和運維服務管理系統軟件的需求分析與設計說明等七個方面進行展開。在這七個方面的設計過程中,要兼顧考慮吸收本質量改進項目的另外六個目標在工作中形成的規范和制度,將其經驗和成果集成到IT運維服務管理體系中來。
4.1 IT運維服務范圍和服務方式與服務級別一般是由招標文件的要求和投標文件的承諾所決定的,然后再結合IT運維服務提供商(例如W公司)的管理水平和服務質量現狀進行設計和規定。
4.2 運維服務體系框架主要對所有的運維服務管理流程及其相互之間的關系進行總體規劃和說明,并通過服務管理流程關系圖對各流程的前后銜接關系進行描述和說明;然后通過各服務管理工作流程的詳細流程圖對各工作流程在各種情況下的處理規則進行描述和說明。在本項目中的運維服務管理流程,主要包括服務級別管理、IT資產管理、日常工作管理、常用服務流程、備件管理流程、桌面運維流程、網絡運維流程、其他工作流程等八個方面,每個方面又包括多個服務管理流程,總共包括21種管理流程。究竟應當包括哪些流程,應當根據具體運維服務項目的實際情況和客戶需求,結合ITIL最佳實踐和ISO 20000標準進行梳理和設計。
4.3 運維服務組織結構一般由IT運維服務提供商和客戶雙方參與本項目的人員組成,一般可以分為一線、二線、后臺支持、第三方支持等四個級別;運維服務項目經理一般介于一線和二線之間,作為一線服務團隊的管理者,同時也是二線服務團隊的成員之一。在確定了服務組織結構后,再根據所設計的各運維服務管理流程的需要進行崗位分工,再根據崗位分工確定各個崗位的職責;通常可以分為客戶方管理人員、運維服務項目經理、服務臺、服務工程師、配置管理員和服務助理等崗位或角色。
4.4 相關服務規范和管理制度一般是指在IT運維服務管理流程以外、無法或不便于通過流程方式進行規范的管理制度和相關規定。它作為運維服務管理流程的有效補充,使IT運維服務的提供過程實現進一步的科學化和標準化。在本項目中的相關服務規范和管理制度主要包括服務臺工作規范、日常運維服務規范、網絡運維服務規范、資產普查工作規范等方面。其中服務臺工作規范又包括服務熱線接聽規范、故障判斷技術規范、事件類別判斷方法、事件優先級判斷方法、服務單回訪規范等;日常運維服務規范又包括上門維護服務規范、備件庫管理規范、運維檔案管理規范等;網絡運維服務規范又包括網絡設備日常維護規范、網絡安全運維規范等;資產普查工作規范又包括普查工作組織架構、普查人員上門服務要求、普查準備工作、普查工作注意事項、普查數據檢查標準、普查數據錄入和統計規范等。具體應當包括哪些服務規范和管理制度,也沒有一定之規,主要根據具體項目的實際情況和服務管理需要而制定,制定者需要具備一定的項目管理、服務管理和質量管理的基本知識和經驗。
4.5 相關數據表單的格式設計主要是根據各運維服務管理流程的需要,在某些服務管理流程的某些環節需要工作人員填寫相應的數據表單,則根據該環節和整個流程的需要、以及后期統計報表采集數據的需要進行表單內容和格式的設計。在本項目中的數據表單包括了常用數據表單、備件管理表單、桌面運維表單、網絡運維表單、資產普查表單和其他表單等六大類。其中常用數據表單包括服務單、用戶投訴處理單、收款服務單等;備件管理表單包括備件借用登記表、備件清單、備件出入庫登記表等;桌面運維表單包括設備采購驗收單、設備采購匯總表、設備采購明細表、資產報廢登記表、資產報廢意見書、供應商維修設備回執單、設備維修回執單、設備維修報價單、設備采購報價單、升級換件登記表、用戶入網申請單等;網絡運維表單包括網絡故障報告、網絡系統端口登記表、配線間鑰匙借用登記表、網絡巡檢報告表等;資產普查表單包括資產登記表、資產普查匯總表、資產普查明細表、資產標簽等;其他表單包括知識庫表單、配置變更登記表、日報檢查問題記錄表等。
4.6 相關統計報表的格式設計主要是根據IT運維服務管理的各種管理需要,從各服務管理流程和相關數據表單及數據庫等數據源中采集數據,從而對需要生成的相關統計報表的格式和數據來源進行設計,其主要目的是供運維服務團隊的管理者和客戶方管理人員了解運維服務狀況,并據此進行服務管理。在本項目中的統計報表主要包括服務單統計報表、故障報修統計報表、硬件故障統計報表、網絡故障統計報表、軟件故障統計報表、服務質量統計報表、資產統計報表、服務費用統計報表、運維服務周報和月報表等九大類,在每個大類中又包括多種具體的統計報表,共計有45種統計報表需要進行格式設計和說明。
4.7 IT資產管理和運維服務管理系統軟件是對前述的服務管理流程、服務組織結構、服務規范和管理制度、數據表單、統計報表等內容的固化,通過計算機軟件系統的方式將其固化到計算機程序中,從而保證這些管理規則的嚴格執行。因此,對該系統軟件的需求分析與設計應當在前述各個方面的設計基礎上進行,同時兼顧今后可能存在的變革,并適當考慮軟件系統的靈活性進行系統分析和設計。根據本項目的具體需求,其IT資產管理和運維服務管理系統軟件的功能模塊主要包括個性化視圖、事件管理、網絡運維管理、資產管理、運維檔案管理、廠商資料管理、知識庫、統計分析報表、用戶意見反饋、系統管理等。
5 項目實施結果與結論
筆者根據本文前述的實施方法和過程,對本項目的運維服務質量進行化化和改進。由于本項目的服務質量對客戶和W公司雙方都有較大影響,所以本質量改進項目得到了雙方各級領導的重視和大力支持,從而較順利地完成了質量改進工作任務,取得了預期的質量改進效果。
本質量改進項目的成功實施,驗證了筆者在實施過程中所應用的項目化管理和實施方法、PPMT運維服務管理實施框架、IT運維服務管理體系建設的主要內容等,在IT運維服務管理及其質量改進中是行之有效的。IT服務管理體系的建立,使服務提供商“建立起一套持續改進的機制,使自己能不斷地發現問題、解決問題”[1],從而從根本上解決了服務質量問題。這對關注IT運維服務管理及其服務質量的其他同行們,無論是客戶還是服務提供商,均具有一定的參考價值和借鑒意義。
參考文獻:
[1]戴穎達.質量管理實務教程[M].北京:科學出版社,2009.
[2][荷蘭]Jan van Bon.IT服務管理——基于ITIL的全球最佳實踐[M].章斌,譯.北京:清華大學出版社,2006.
[3]李福海.管理學新論[M].成都:四川大學出版社,2002.
關鍵字:濟寧廣電、運維、外包
中圖分類號: F407 文獻標識碼: A
進入到2014年,隨著三網融合的推進,未來的競爭優勢不僅體現在網絡本身的質量上,更體現在運維體系對市場、客戶、服務的全面支撐能力上。因此對于有線電視網絡公司來說,運維仍然是我們排列在第一位的日常工作。
山東廣電網絡有限公司濟寧分公司全面負責濟寧市有線廣播電視網絡的規劃、建設、維護和運營。廣電網絡覆蓋市中區、任城區、高新區和北湖度假區,共21個鄉鎮(街道),約38.6萬居民戶。2012年縣級網絡整合工作已全部完成,業務覆蓋12個縣(市、區),有線電視用戶超90萬戶,寬帶用戶超1.2萬戶,隨著網絡的整合,網絡和網絡運維有了巨大的改變,由過去內容單一的模擬電視維護逐漸轉變成對數字電視整轉網絡、寬帶IP城域網、接入網的維護,相應的維護手段和操作也發生了相應的改變,這就對維護人員提出了更高的要求。
最近公司正在探討將維護外包的事情,作為一名普通員工,我想提出一點自己的看法。
首先,我們要分析一下運維外包的優劣點。優點,外包隊伍保障力量建立快,維護響應速度與效率提高;易于控制成本;易于控制自身人力規模;運維部人員可以騰出手來做一些更核心維護,減輕內部人員的工作壓力。缺點,外部成本高;運維工作的網絡質量與服務質量的管控難度較大;內部技術人才儲備不足;對外依賴性較大,對外包市場的成熟度要求較高。現在外包隊伍主要還是原來有線電視的維護隊伍,他們對于IP城域網的維護幾乎沒有任何經驗,這是一個亟待解決的問題。
其次,相對于其他的電信運營商,廣電網絡公司受到原來事業單位體制的約束,運維能力和其他電信運營商不可同日而語。我們網絡管理和運維規范機器極其缺乏,更談不上運維外包方面的管理規范了。對維護的外包主要集中在末梢部分,包括EOC局端、EOC終端、機頂盒等,這對維護人員能力的要求提高了很多,我們應選派人員進入外包單位,進行全方位的教育、培訓和扶持,使其能在較短的時間里樹立起廣電網絡的維護理念,掌握維護技能,提高管理水平,在較短的時間內適應廣電網絡的維護要求。
為了加強職業教育與企業的聯系,提高專業教師實踐水平,培養“雙師”型專業骨干教師,學校安排專業教師暑期到企業實踐活動。我作為計算機專業教師,有幸參加了上海中軟計算機系統工程有限公司系統架構師崗位的企業實踐工作。專業教師下企業鍛煉是提升教師綜合素質的重要舉措。教師通過下企業鍛煉,了解企業生產、經營全過程,提高動手能力,為專業建設與中職培養目標做好市場調研。轉眼間,兩個月的企業實踐已經結束,現將企業實踐所見、所聞、所得總結如下:
一、實踐時間:2019年7月1日—2019年8月30日
二、實踐基地簡介
上海電子信息職業教育集團和上海中軟計算機系統工程有限公司共建的教師企業實踐基地自2013年以來已連續六年成功組織實施了教師企業實踐培訓活動。六年中上海中軟實踐基地共接待了來自上海信息技術學校、上海市工程技術管理學校、上海新聞出版職業技術學校、重慶安全技術職業學院、云南楚雄技師學院等20所院校,共計38名學員教師參與了企業實踐活動。
上海中軟基地為上海市中等職業學校信息技術類專業教師提供互聯網應用設計師、系統集成架構師等企業實踐崗位,旨在滿足教師的企業實踐需求,使教師通過崗前培訓、原廠商技術知識培訓、優秀項目的實地觀摩學習、先進設備的參觀、實體項目的參與和頂崗實踐、學習成果的交流、總結與評審等實踐內容,縮短教師理論知識與實際應用之間距離,提升教學內涵。
參培教師通過了解企業工作規范,將相關理念融入到學生培養過程中;了解新技術的發展趨勢,進行專業教學知識的更新;及時掌握本專業、學科發展的前沿動態及實際應用情況,努力提升教師的創新、實踐能力;通過感受企業文化,了解職業素養,讓教師貼近職場,了解企業對人才的需求,將實踐的成果轉化到課堂教學中去,有效改進教學內容及方法,促進專業教學改革及專業人才培養。
三、實踐崗位
系統集成架構師,崗位實踐具體內容:
1)參與項目方案的設計或者實施,了解理論知識是如何在系統集成架構設計和部署中體現的,了解理論知識是如何實現項目需求功能;
2)與企業實訓集成團隊共同探討,結合最新網絡技術、虛擬化技術、軟件技術和教師多年教學經驗,形成更適合院校的專業發展的成果;
3)參加公司、廠商、合作培訓機構舉行的技術交流會和產品展示活動,了解新技術以及未來的發展趨勢。
四、實踐目的和內容
1、實踐目的
目的主要是進行現場觀摩、上崗操作,熟悉相關專業領域的新知識,切實感受日常教學活動和企業對職工專業素質要求之間的差距,為在日后的教學工作中更好地發揮教學能動性、積極促進教學改革具有深遠的現實意義,為計算機專業下一步的專業課程教學做準備。
2、實踐內容
本次企業實踐我申報的是系統集成架構師項目,項目包含三個階段,分別是網絡工程、虛擬化建設、網絡安全。
首先是第一階段的學習,帶教師傅周寅生針對系統架構中最基礎的網絡工程,給我做了培訓。我所實踐的工作地點是上海市稅務局臨江計算機機房,首先周老師帶我熟悉了網絡架構。
培訓內容切合主題,周老師作為企業工程師,對網絡工程有很深入的見解。上圖中VRRP協議在政府機關的應用是我雙項目的學習目標,這個內容是我的學習重點。配合生動幽默的講解,讓我很快的進入狀態,結合自己的所學將其應用到網絡工程中去。培訓中我們學習了網絡工程的特點是明確設計目標、詳細設計方案、根據權威的設計依據、完備技術文檔、完善實施機構。了解網絡工程各個層次的專業定位,以及網絡工程師需要具備的組織和實施工程的能力,與不同用戶進行溝通的能力,獨立解決問題的能力及很強的團隊協作精神。最后總結了網絡系統的集成步驟分別是規劃、設計、實施、驗收。通過這幾次培訓,我掌握了網絡項目實施中的各個元素,了解了各個知識點如何對應企業當中的崗位,從中總結出更有針對性的教學方案。
網絡工程中運維工作具有舉足輕重的地位,只有良好的運維才會產生良好的用戶體驗,下面我著重對運維工作進行總結。通過對實踐崗位運維工作的學習,我發現網絡運維更適合我們職校學生去勝任,它要求有較高的動手能力,這點恰恰符合我們中職學生的特點。日常運維工作主要包括終端部分和網絡部分,終端部分包括客戶端電腦的硬件排障,系統及應用軟件層面的維護,客戶端外設打印機等設備的安裝,互聯,運維,協助排除稅務專網終端電腦系統及生產環境下使用故障,抽查并更新各單位終端資產統計,信息及安全統計,制定終端應用故障Q&A等。網絡部分包括接入層,匯聚層網絡交換設備,物理鏈路層信息點維護,內外網用戶接入問題,協助服務器維護,核心網絡設備維護,網絡設備巡檢工作。日常運維工作瑣碎復雜,如何進行工作績效,運維工作的數據統計與分析就尤為重要了。
通過對工作內容的量化數據分析,可以直觀的反映出工作狀態,對今后的工作安排可以合理的安排人力配置,此部分內容需要中職生格外重視,光是有技能是不夠的,還要學會工作方法與技巧。
接下來,在經歷兩周第一階段網絡課程的實踐學習后,我們進入第二階段虛擬化的課程學習。整個學習過程貼近實際,帶教師傅周老師從虛擬化的基礎架構介紹到虛擬化的實施過程,并為我們展示了服務器虛擬化的架構界面以及虛擬化在實際當中的應用。由于參加學習的各位老師,或多或少都接觸過虛擬化。學習過程中,老師們踴躍提問,積極討論。針對實際需要,向企業專家咨詢。通過這一過程,真正的將理論轉換為實際。培訓完成后,企業專家還熱心的給我們提供了很多虛擬化方面的資料,讓我們能更深入的學習。我通過這次培訓,大概的了解了虛擬化的配置過程,在接下來的實踐中,我準備自己動手創建虛擬服務器,將所學轉化為成果。
在接下來的培訓中,師傅給我們部署了一個網絡實踐的虛擬環境,并提供了多種類的網絡設備的配置方案,讓我們進行了網絡配置的實踐。演示過程,我們結合行政管理學校虛擬化環境的搭建與維護的實施方案,進行了討論,效果明顯。此外,大家對師傅部署的這樣一個實踐環境,非常感興趣,希望將這樣一個環境作為虛擬實訓環境應用到教學中去。這個虛擬實踐平臺eve-ng,部署在liunx環境底下,其中的實訓設備主要是CISCO及華為。所有的網絡設備都是使用真實的設備系統運行的,效果更接近于真實環境。師傅給我們提供了大部分的網絡設備系統,便于我們實現虛擬網絡部署,檢驗我們的網絡實施方案是否可行。通過實訓,我們即學到了網絡部署方案的撰寫及實施,又認識并學習了一個網絡實訓平臺,對今后的工作起到了更好的促進作用。
最后,就是第三階段的網絡安全的學習,企業師傅帶我熟悉了企業中日常防護網絡攻擊的方法,如:arp病毒查找攻擊源主機的方法,稽查一局網絡事件應急預案V1.1等。
不可否認,網絡是把雙刃劍。在現今社會,網絡越來越普及的情況下,各類網絡犯罪日益增多。網絡安全不得不引起人們的重視,作為從事信息化管理的人來說,更是工作重點。近期國家安全部提出的等級保護制度,就是網絡信息安全的一種監管措施。
本次實踐活動,正好給我們提供了這樣一個平臺,讓我們深入企業,了解安全防護的各項知識。分別從系統安全及網絡安全對我們進行了培訓。在系統安全方面,企業專家整體描述了安全防護的必要性及安全防護的種類。最后,在兩類常用于服務器部署的系統中,演示了安全加固的一些實踐操作內容。非常實用,很有針對性,整個過程涉及到攻與防。從演示中,我們學到了服務器安全加固的必要性及操作方法,收獲很大。
在網絡安全方面企業專家根據不同學校的實際情況,對目前常用的幾類安全設備進行了分類討論。總結出不同設備在安全防護中的作用,以及部署的必要性。讓我們更加直觀的了解網絡安全的重要性,在今后的各類項目建設中,安全將成為我們首要考慮的因素。
總結這段時間的實踐學習,感觸最深的就是,企業的先進技術以及規范的管理理念。一個好的企業,要能成功,一定要有規范的流程,成熟的項目實施經驗,完善的管理,合作無間的團隊。而我作為計算機教師,同時兼任信息中心的工作,在今后的項目實施中,可以借鑒企業學習到的經驗,更好的、規范的管理項目實施。此外,圍繞本次實踐活動的成果目標,我將總結學習到的知識,跟隨項目工程師,將虛擬化的技術應用到教學當中。為學校的信息化建設盡一份力,為學校的信息化教學盡一份力。
五、實踐體會
本次實踐項目目前都已經圓滿結束,整個過程雖然有點苦,有點累,但收獲良多,通過這次培訓,我開闊了眼界;思考問題能站在更高的境界;許多疑問得到了解決或啟發;業務素質得到了進一步的提升。有幾點體會如下:
1、企業文化應和職業學校校園文化對接,企業文化的目的,就是要在企業內部倡導和營造一種積極健康、活潑和諧的精神氛圍,職業學校的校園里也需要這種精神氛圍,應該讓學生提前感受到企業文化,通過校園文化感受到企業員工工作紀律性要求和工作態度的嚴謹作風,使學生在校園內就能在一定程度上了解、熟悉并認同企業文化。企業文化也是培養學生形成良好職業素養的一條重要途徑,為今后在企業的立足和發展奠定基礎。
2、學生的技能應與企業要求對接,通過這次企業實踐,使我了解到職業學校學生在校所掌握的知識與企業需求仍有較大的差距,計算機是一個高速發展的行業,物聯網、大數據、人工智能等新的技術手段無時無刻不在影響和改變人們的生產和生活,這就要求我們的教學設備和相關技能要趕上時展的需求,課本上的知識遠遠不能滿足現代行業、企業發展的要求,更多要求學生在專業知識的基礎上能夠學會應對社會發展的變化。
【關鍵詞】網絡設備 主動運維服務能力 雙機切換演練 數據中心
1 網絡設備切換演練的工作描述
1.1 工作方案制定
數據中心階段性的開展信息系統切換演練,其中包括硬件、軟件、基礎設施,網絡設備切換演練即是其中一項重要內容。由于網絡設備屬于基礎設施范疇,是信息系統的數據傳輸的經脈,影響面廣,因此,這項工作的開展準備工作成為重中之重,網絡運維團隊精心研究切換演練工作的具體內容、范圍、方案以及具體實施步驟,嚴格把關每一個環節,做到切換演練工作開展時不慌、不亂、沉著、按部就班。
網絡設備的切換演練,與網絡架構、具體設備戚戚相關,針對不同的網絡架構、不同的具體設備,設計出標準的基線方案,針對牽涉業務系統的不同,制定完善相關的演練方案及實施步驟。目前數據中心網絡設備種類多、品牌雜,包括路由器、交換機、負載均衡器防火墻等,每一種類網絡設備品牌多達數種。網絡設備的切換演練可以劃分為多次實施,劃分區域、劃分設備、劃分業務系統。根據方案設計思路收集設備信息、理清網絡拓撲、梳理業務、應急方案、備品備件以及廠家支持等,諸多準備工作保障切換演練工作順利實施,同時運維流程、運維管理、運維技術、運維制度得到有力提升。
1.2 工作目標
通過網絡設備切換演練工作檢驗信息系統的軟硬件的穩定性、高可靠性、業務不中斷性、健壯性以及冗余模式下系統有效性,運行環境潛在隱患無法藏匿,并對切換演練過程中出現的各類異常進行制定相應措施,對發現的問題及時整改,確保設備發生故障時雙機冗余切實有效,達到主動演練、主動發現隱患、主動排查問題,為主動運維提升服務能力添磚加瓦。具體內容如下:
(1)確保實時業務訪問連續性。切換演練時,達到業務透明無感知,使得業務連續性得到保證。
(2)確保服務器集群正常使用。服務器集群中不管是HA還是RAC,切換演練工作可使得各種切換機制正常工作,確保應用數據、后臺數據正常傳輸,生產業務不受影響。
(3)確保災備數據備份不中斷。數據庫、存儲上存儲的數據能實時同步到災備中心,保障數據傳輸穩定可靠。為生產主中心數據提供有力支撐和保障。
2 網絡設備切換演練工作內容
2.1 相關組織機構
數據中心階段性的切換演練,不論是應用軟件、主機存儲、數據庫集群,還是網絡設備、電力基礎設施相關切換演練,都具有嚴格的組織體系,任何一個層面切換演練,都需要其他相關專業組織進行配合支持,因此演練工作需要縝密的組織體系結構、完整的運維管理制度、詳盡的實施方案以及強大的運維支持服務團隊,以保證網絡設備切換演練工作順利進行。
2.2 切換演練相關流程
制定切換演練工作流程是切換演練工作開始之前的一項重要工作,不容忽視,對切換演練整個工作的開展具有總體把控指導作用。結合切換演練工作實施步驟、運維技術保障團隊、業務驗證以及應急措施。確保演練工作有序進行,確保演練工作結束后生產安全穩定運行。流程如圖1所示。
2.3 切換演練具體內容
如前文所述,網絡設備屬于基礎設施范疇,牽涉范圍廣,雙機主備模式、虛擬化模式,原則上切換演練對生產不具有影響,演練的目的就是發現隱患,為了避免影響范圍擴大,切換演練可以劃分為多次實施,劃分區域、劃分設備、劃分業務系統進行工作實施。網絡架構可分為核心區、匯聚區、接入區、廣域區,可以按照區域進行分批次進行切換演練,如按照邊界路由器、局域網核心區、局域網匯聚接入區三個批次進行切換演練。網絡設備種類品牌具有多種,按照網絡品牌進行切換演練,有利于廠家支持協調,一些數量少的某種網絡設備,可以集中進行切換演練。按照業務系統進行切換演練,有利于應用軟件開發廠家運維支持協調,一些業務系統共用網絡設備,可以安排在同一批次進行切換演練。上述幾種切換演練策略都具有一定的合理性,前提是在可控范圍內將切換演練工作有序順利完成。
網絡設備切換演練工作,網絡運維管理員的角色影響至關重要,當冗余網絡設備進行啟停操作時,網絡管理員需及時對網絡狀態、網絡配置進行核查,如網絡收斂狀態、網絡鏈路狀態、網絡路由狀態等,還需要協調廠家支持、協調其他專業組進行配合驗證業務是否正常。一旦發現切換過程發現諸如硬件損壞、網絡中斷、業務中斷等問題,切換演練工作的首要任務是恢復生產,及時記錄相關現象,便于事后進行詳細分析并得出結果,進而找到問題所在以及進行問題整改工作。每一項操作均驗證無誤后方可進行下一步操作。
每一批次網絡設備切換演練結束之后,將演練結果匯報給領導,對于發現的隱患進行整改,形成相關文檔進行留存。至此,切換演練整個工作才完成。
3 網絡設備切換演練的總結與改進
3.1 網絡設備切換演練運維管理成效
通過網絡設備切換演練工作加強鞏固運維管理體制,結合實際操作演練,解決日常運維管理中存在的技術弱點和管理缺點,使得信息系統各個層面,包括應用軟件層面、主機資源層面、基礎設備層面、第三方技術支持層面有機統一協作,相互協調,共同提高運維保障能力以及運維技術團隊的技能,確保銀行信息系統平穩運行。
運維團隊技術的提升。任何一個企業的運維工作只有運維制度沒有運維技術支撐,猶如船無舵手。運維技術不僅體現在某種網絡設備的熟悉程度,而且體現在運維態度。在整個切換演練過程中,每個環節都強調操作謹小慎微、雙人復核。技術能力再過硬也抵不過一個粗心大意,對突發性問題的定位、分析以及解決,既不影響生產的穩定運行,也不影響整個切換演練的時長局限。演練過程中突發問題的發生,對運維團隊技術以及抗壓能力的考驗極高,這也是運維團隊技術的考驗和提升的過程。
運維團隊水平的提高。信息系統不僅僅只有軟件應用的存在,從基礎設施到上層軟件應用,任何一個環節都不能出現問題,只有各個層面各個專業有機協調配合,才能將信息系統這個“人體”保持“精力充沛,健康成長”,特別是數據中心近年來發展迅速,成立兩地三中心,一體化運維滲透到各專業之間,更是滲透到各專業內部。一旦信息系統出現故障或者問題,各中心各專業組積極配合,共同分析問題,解決問題。通過切換演練,使得各個層級的運維團隊協作能力得到提高,在遇到故障后能及時解決問題。
信息系統隱患的發現。切換演練的目的即是發現信息系統的隱患,對發現的隱患制定相應措施,進行相應整改,解決安全隱患,確保雙機設備在設備故障發生時,及時切換,提升信息系統運行水平。
3.2 網絡設備切換演練中存在的問題及改進
演練方案需要進一步完善。在日常運維管理工作中,出現許多方案、實施步驟、應急方案,切換演練也針對性的形成演練方案、實施步驟、應急方案,如果使其更具有實用性,那么切換演練的方案結構、內容、策略以及驗證方式需要進一步完善修訂,使其成為切換演練工作中一個標準模板方案,亦可作為知識庫,供日常運維查閱。
運維團隊的技術素養需要進一步提升。階段性的切換演練提高了運維團隊的技術素養,但是處理分析問題的能力尚需要進一步提高,不僅包括團隊專業知識,還包括協作能力、實戰經驗等。積極組織培訓,培養主動運維意識和能力,面對信息系統運維工作中出現故障時,能盡快梳理故障,整理思路,發現故障點,且能在最短時間內解決問題。對發現的問題以及分析解決問題過程,進行積極的總結,得出一套經驗知識庫,提高主動運維服務能力。保障信息系統安全平穩運行。
關鍵詞:ITSM; 流程優化;網絡管理
中圖分類號:TP311 文獻標識碼:A 文章編號:1671-7597(2014)01-0130-01
1 IT服務管理的基本理論分析
IT服務管理(ITSM):是指對滿足業務需求過程的IT服務的服務質量的實施和管理。 ITIL是實現IT服務管理的一種方式,而ITIL的核心內容是流程。優秀的流程在規范業務運作的同時,也在不斷的總結和固化優秀的經驗,從而能夠提升企業的核心競爭力。
2 優化的條件與薄弱環節分析
2.1 實施流程優化的條件
1)理論研究基礎充分。ITSM可變被動服務主動化,優秀的IT管理服務可以做到提前預測在網絡運維中可能會出現的問題,從而達到預先處理問題的目的,而實現這一目標的關鍵在需要IT管理工具支撐的同時,更需要規范的流程和人員的技能支持,而這也是實現ITSM的關鍵所在。從1999年ITIL引入中國至2007年更全面合理的ITIL V3正式,融入了IT服務管理領域當前的最佳實踐,并首次引入了生命周期的概念,通過全面質量管理應遵循的PDCA模型,持續不斷地循環改進,從而保證ITIL持續的生命活力。
2)有修訂和完善了標準與規范。標準化方面可參考國家標準、行業標準或企業內部標準,為網絡運維實現流程管理體系提供了標準和理論基礎。
2.2 現有流程的薄弱環節
1)對于流程的認識和理解不足。很多企業網絡建設較早,網絡基礎建設基本完成,已進入提升完善階段,正處于關注技術也重視管理的階段。雖然現在有流程,但和很多成功案例的ITIL理論和流程相比,流程規劃還存在的一定距離。
2)流程建設的不完善。隨著業務的發展,很對企業都面臨這項目組人員流動性較大的問題,對于新進員工來說,如果沒有較完善較新的流程,對于業務走向不明,容易造成降低了工作效率,并浪費了人力的,這是因為ITIL理念沒有深入人心。
2.3 實施ITIL管理的價值
實施ITIL管理,保證IT流程與業務流程的統一,可使IT服務提供者為客戶提供更好的服務,建立更加融洽的工作關系。起到支持業務的作用,在整體上可以提高業務運營的質量:通過提供高質量的IT服務,幫助業務人員更好的掌握信息,提高工作效率。
3 實施流程優化
一般的企業信息系統管理項目建成后,所有的系統使用一個運維平臺,在使用上利于管理,但由于使用部門各不相同,情況不同,使運維平臺流程不夠詳細,這就需要組內流程的補充,兩者結合,可形成較為完善的流程管理體系。
3.1 編制流程體系建設方案
網絡運維可以根據流程面向對象,進行不同層次、不同詳細程度的流程設計將流程分成3層,組間流程、組內流程、業務基本操作。每一層次以“業務服務管理”為導向,按照業務應用分工進行設計,參照ITIL,結合已成功的最佳實踐,規范各個服務流程。
3.2 確定流程模版
流程三要素:輸入、活動、輸出。并且具有可度量(measurable能考核)、明確結果(specific results)、交付給客戶(delivers to customers)、對于一個特定事件的反應(responds to a specific event)。
1)組間流程。很多業務是需要多個部門協作完成,部門之間的工作接洽點和各階段工作時長要明確,以免發生扯皮現象。
2)組內流程。根據業務發展,企業會新增很多小部門,新增小組往往沒有梳理組內流程,這一部分是優化的重點,每一個小組根據業務不同,根據組內實際情況,梳理流程。
3)業務基本操作。在優化組內流程的同時,需要詳細規范業務基本操作,這樣既可以防止由于人員流動的帶來的知識流失,也可以防止由于不同人不同操作習慣帶來的失誤,新進員工可直接參照基本操作進行業務操作,快速上手,節約老員工帶徒時間等。
3.3 梳理制度、崗位職責
1)組間流程。調研組間工作內容、分工、銜接點、時間分配、流程關鍵點、使用表單等,根據以上信息進行流程編寫。
2)組內流程。①梳理業務范圍。各小組對工作內容及規章制度進行全面梳理,梳理工作任務清單,形成全面的業務文件梳理表 ,達到沒有遺漏、重復的工作,使任務清晰明確,有前瞻性。對于一個小組流程梳理要經過單獨梳理和綜合梳理兩個過程;②繪制流程圖;③文字描述。流程圖確定后,進行文字描述工作,文檔格式統一,對流程適用情況進行說明,崗位職責描述、資源配置、管理崗位流程清單、流程網和風險控制文檔進行編制;④表單優化。隨著工作情況的變化,一些表單已經不適合現在的業務,需要進行優化或新造。
3)業務基本操作。網絡中常存在的業務,例如賬號開通、日常巡檢等,可以進行標準化規定,要梳理基本操作流程,利于新進員工學習及操作規范,減少疏漏。
3.4 流程審核
每一個流程梳理結束后,都要進行審核,審核是否滿足法律、法規、標準以及內外部狀況,防止流程官僚化,脫離實際,同時確保流程覆蓋整個組的業務范圍。對于不合理的流程要進行修改。
3.5 流程培訓
對于流程建設工作來說,不光要有制度,還要提高制度的執行力,把執行制度的落實作為一項重點工作來抓,抓出亮點、抓出實效,使制度的約束作用、規范作用得到最大程度的發揮,推動制度管理水平實質性的提高。所以流程通過審核后,需要進行培訓,根據不同的流程面向對象,組織培訓,使按流程辦事的理念深入人心。
3.6 流程提升
根據ITIL理論,流程是閉環系統因為他們利用自加固和自修正的行動來提供面向系統的變更和轉換。對流程的每一次觀察、總結和后評估,都是企業管理水平的自我提高和自我完善。在流程的使用過程中,如果有流程的變更,通過審核后,可進行變更。
4 結束語
本文簡要分析了流程體系在網絡管理過程中的應用,其內容主要包括網絡運維流程優化的條件與問題分析、流程優化的原因及流程模版、梳理制度的過程,在流程梳理完成后,如何編制流程、審核流程、培訓及提升。
參考文獻
[1]陳宏峰,張亮,黃新峰,黃爽.ITIL V3白皮書[M].上海:翰緯IT管理研究咨詢中心,2007:14-15.
[2]吳澤童.基于ITIL的任務管理流程研究、設計和流程成熟度評估[D].中山大學,2009.
分布式網絡管理
如今,服務于企業自身業務發展的自主網絡體系日益擴張,結構更加復雜,呈現出地理分布廣、接入方式多、對網絡性能要求高等多層次化需求。
如果整個網絡的運行過度依賴于一個網管中心,那么,一旦網管中心發生故障就容易導致整個網絡管理的無序,甚至癱瘓。所以,這種過度集中式網絡管理的模式不適于對大規模網絡進行實時性要求較高的監控與管理。在這種大背景下,網絡管理的層次化分布部署勢在必行。
分擔負載
明晰責權
大型行業均以省、市、地州或行政大區劃定了與其業務特性相符的配套網絡架構和管理體系。在這種多分布、邏輯架構復雜,且廣域特性涉及BGP(邊界網關協議)、OSPF(開放式最短路徑優先)、多域、單域等多種環境下,要想在單個管理中心實現有效的監控,是不太現實的。數據采樣間隔過大時,不能實時反映性能數據的變化趨勢,并及時做出應有的反應; 相反,采樣間隔過小,面對大型、復雜的網絡又會造成管理信息的交換消耗大量的帶寬和計算資源,成為系統的I/O瓶頸,造成存儲空間的急速增加。例如,在某行業的大型網絡實際運維中,用戶發現采樣間隔由10分鐘變為5分鐘后,數據量每天遞增了20GB。
因此,依據行業的業務特點和網點的分布情況,CIO需考慮地理環境的優勢、運維人員的技術支持能力、網絡鏈路資源及機房場地、交通便利條件等諸多因素,選擇與企業業務規模相對稱的區域級別的網絡運維管理中心。各分支機構依據就近接入、統一管理的原則接入網絡運維管理中心。這樣大量節省了長途鏈路的資費,提高了相應的互連帶寬,各分支機構也有了技術支持后盾。
由于這種網絡管理的層次化劃分,加上軟件產品對分布式部署的支持,可以有效地將事件和性能數據過濾和歸并,通過制定一定的管理策略,把有限的管理信息用于向總運維調控中心匯聚。這樣,各區域網絡運維中心有效地分擔了網絡管理對細節因素的追蹤,同時又能使總運維調控中心具備宏觀的視野,從而顧全整個業務體系的正常運轉。
從單一的集中式管理走向層次化分級管理是網絡管理發展的一大進步,大型網絡從一個大的星形結構逐步過渡到層次化星形結構(樹形結構),甚至網狀結構,其優勢是非常明顯的。層次化管理模式明確了運維管理的關注點和與之相應的職責,網絡有廣域、局域之分,那么管理也必定有差異。
采購分布式網管系統
五項注意
在大型行業的運維管理中,運維管理中心往往設立在總部機關所在地,其運維重點在于關注廣域鏈路的通斷、長途鏈路利用率、雙鏈路負載均衡、路由抖動、時延等保證關鍵業務全網通達的技術參數性能。而各分支機構的日常運維事項又與樓層交換、用戶終端、網內異常流量審計等內容密切相關。那些諸如樓層交換設備、用戶端故障、局域網內流量異常、病毒局部侵擾等并非廣域運維關心的重點。因此,合理的層次化分級管理會有效地處理好這種管理范圍和職責的劃分。利用現今網絡管理軟件對分布式部署的全方位支持,管理員可在局域范圍內把網管工作做細,也可通過過濾策略把關鍵信息上傳到運維管理中心,從而把控全網細枝末節的網絡健康狀態,保證關鍵業務的順暢運行。這種分級化管理的方案選型應關注如下幾點。
分布式網管在分支機構進行部署時,不宜求全求大,宜求精求實,最好采用統一的系統平臺, 避免各自為政采購大型軟件,最后因無實施能力導致擱置。在實際情況中我們不難發現,由于網絡建設并非同步進行,而且缺乏統一的實施標準,許多信息部門雖然很有預見性地采購了網絡管理配套軟件,但由于未考慮它的實施難度和基層技術人員的運維技術水平,導致采購的大型網管軟件并不能發揮其產品宣傳所能達到的實際運維功能。所以應在一個大的整體策略下,通過集中評測甄選適合本企業統一部署實施的管理軟件。
應加強基層技術人員的技術和管理策略培訓,并同步進行配套管理策略和制度建設。通過標準化的流程策略和相關制度約束,保證網管策略自上向下地有效貫徹。
企業采購的軟件無論是商品化軟件或者自主二次開發的平臺,應考慮支持分布部署策略和事件上傳過濾、歸并機制。實際網管實施過程中,告警事件不是報不出來,而是報得太多,“狼來了”喊多了就沒人相信了。這在采用了郵件、短信、聲、光、電等多種報警模式的情況下尤顯突出。做好告警事件的有效歸并,不但能減少告警事件量,而且便于故障根源的快速判斷和響應。
總運維控制中心應具備基于業務視角的監控運維管理手段。依據關鍵業務的特性將相關監控管理技術指標用一個維度綜合計量,加快故障根源的快速定位與分析,規避“眉毛胡子一把抓”的無序狀態; 也能有效避免出現業務故障時,相互推諉責任的現象。
配套行政手段需落實到位,僅靠單純的技術手段,管理策略并不能完全落實。需建立有效的機制,落實督促管理策略。分布式管理,并不意味著放任自流,而是要通過有效的機制使網絡管理工作更加有效。
在規模不是很大、網上業務應用不是很多的企事業單位,可采用分布式管理模式,在數據采集的及時性、技術細節的把控和響應上都會有較好的保證,而且能起到相互冗余的作用。
集中式網絡管理
在層次化分級網絡管理的基礎上,隨著網絡管理外延的逐步擴充,基于業務的運維管理模式,特別是基于數據大集中的管理模式,又作為一種新亮點凸現出來。
在傳統的分布式處理模式下,業務信息分布在不同地理區域的內部服務器上,業務信息的管理和可用性受到了很大限制,許多應該透明、共享的信息在人為的壁壘下不能充分發揮應有的作用,而且系統的升級和新業務的開發部署也都不能及時響應。加上新業務系統的逐步上線,分布式部署在機房場地的雙路供電、空調、機柜布放空間等一系列問題上都明顯陷入捉襟見肘的窘境。要想改變這些局面,企業投資金額勢必會遠遠超出新建一個數據中心的預算,并且發展空間受制約。在這種情形下,以業務信息為主導的集中式網管再次走上了歷史舞臺。
數據走向集中的需求
隨著業務規模的擴大,許多應用都面臨著數據大集中的問題。數據信息所體現的時效性價值需求日益提高,數據越能及早匯總,就越能體現出相應的價值,這在股票交易、原油交易、電子化貿易等業務實時性要求較高的行業尤為突出。而這些數據及應用系統的多層次化部署,隨著配套設備的逐步老化、數據量的急劇增加,帶來了運維成本越來越高、時效性越來越差的諸多弊病。原本一套運維體系所具備的人力、物力、運維手段、硬件支撐環境,在層次化部署環境中需要復制出若干個大小不一但又“五臟俱全”的拷貝,這無疑增大了運維成本支出,也是一種資源的浪費,而且也不符合業務快速發展的需要。
隨著網絡管理外延的逐步擴展,從單一的網絡設備、鏈路管理,發展到目前針對業務應用所涉及的服務器性能、存儲、網絡、關鍵應用監控、流程管理、服務級別管理等一系列基于業務服務管理(Busssiness Service Manager-BSM)的全業務服務支持模式,IT綜合服務管理體系集中化管理的趨勢愈加明朗,并在諸如Cisco、IBM、HP等國際大公司的實際部署中得以驗證。
采購集中式
網管系統關注四點
在Cisco、HP、中國網通等國內外知名大企業的關鍵業務集中化管理中,其IT業務垂直化管理的框架也頗有借鑒之處。它們在全業務系統范圍內提供同等水平的業務服務支持,提高了客戶的滿意度。與此同時,業務數據的集中存儲與管理,為高水平安全的數據保障創造了條件,業務連續性達到了一個新的高度。用戶只是授權數據的使用人,無需關心數據的地理位置、存儲介質、維護背景。而且,這樣就規避了分布式部署中產生的軟、硬件投資金額巨大的問題,也為集中有限資金提高運維管理手段提供了良好的基礎。
在企業規模較大、業務應用較多、業務網點分布較廣的大型企事業單位,應考慮設立區域數據中心集中管理與關鍵應用相配套的網絡設施、服務器設施、存儲設施等。集中式網管發揮了數據大集中和財力、物力、人力集中的優勢,做強做大相應的配套設施,為業務應用的持續發展提供擴展空間。在考慮災備冗余的同時,適度把控建設規模的拓展預期,避免前期投入預期過大而實際發展緩慢造成的不必要浪費。
在基于數據大集中的數據中心集中管理系統選型中同樣也須注意幾點。
不盲目跟風。目前,隨著國際大型網管軟件公司的戰略調整,許多軟件公司之間的并購、整合屢見不鮮。而其整合后的產品線往往也只是從概念上有了一個更完整的體系。但在實際情況中,新老產品的更新換代、用戶端使用習慣、產品功能的預期差異等都或多或少會出現問題,特別是做過相應二次開發的用戶單位,在盲目跟風中,不但產品功能提升有限,而且會與預期實施效果存在較大落差。許多產品的整合未必在真正意義上做到功能的提升,在追求利益最大化的商業軟件銷售中,這種產品整合后的潛在風險向最終用戶轉移的傾向比比皆是。
在加強網絡管理的同時,要不斷引進成熟可靠的新技術。以虛擬化技術為例,有些企業的應用程序已經是多年前開發的產品,只能運行在一些特定的操作系統和硬件上,而那些特定的操作系統和硬件由于過了保質、保修期,維護和運行的成本很高。而通過虛擬化技術虛擬出來的硬件平臺能夠運行那些特定的操作系統,盤活了企業的資產。諸如這種虛擬化技術的應用會大大提升業務的發展空間,如早期企業的自有郵件系統給每個員工20兆附件、總計50兆的存儲空間,這在當時已經算是“富家子弟”了; 現今發展到50兆附件、200兆空間已不足為奇。但舊技術條件下實際存儲空間利用率遠非我們預期,而是更加浪費了。
利用虛擬化技術的動態存儲空間調配,能很好地解決此類問題,提高存儲空間的有效利用率。所以新技術的引進絕對是“第一生產力”,管理只是一種優化的運維手段,新技術的不斷引進創新才是發展的最終動力。
在考慮與業務相關的軟、硬件環境建設監控管理的同時,要充分考慮機房場地環境的監控管理。集中化管理涉及的刀片服務器、PC Cluster等大容量存儲的集中上線,使得針對機房場地空調、濕度、電源、消防和部署空間提出了更高的需求,因此要充分考慮到各因素的可拓展空間和性能需求。目前,PC Cluster從256個節點、512個節點到1024個節點的大批量部署愈發普遍(目前,諸如Cisco、IBM等國外知名大公司除在一定高端領域保留大約14%左右的高端Unix服務器外,其在x86平臺和Linux平臺的業務拓展呈明顯上升趨勢,所占比重越來越大),這種部署方式對高密度堆疊產生的熱量排放就提出了很高的要求。網絡管理在集中模式下應有針對性地對業務附屬設施進行全方位的監控。在有條件的情況下,應盡可能地將業務相關性涉及的服務器性能、網絡設備、鏈路狀態、UPS、空調等綜合信息展現在多塊大屏之上,配合聲、光、電的多種告警觸發方式加強告警事件的及時響應,保證業務的高可靠持續運行。
在集中模式下的網絡管理要充分考慮大流量數據帶來的壓力。由于集中模式產生的數據匯聚壓力明顯增大,加上目前高端設備均采用支持大帶寬的光纖接入(這在機房預先布線、交換設備模塊采購中尤其要引起高度重視),所以硬件網管設施在接入實際網絡,特別是在直連模式的情況下,信息部門在關心接口類型的同時,一定要考慮流量壓力產生的負載問題。諸如帶寬管理器等設備如果與實際物理帶寬不匹配,無疑會導致瓶頸的出現; 同時,也要考慮在這種高密度部署情況下,軟件在采集數據時的采集間隔和數據遞增之間的平衡關系。
鏈接
集中和分布相得益彰
IT,歸根結底要服務于業務,因此,CIO必須首先從業務的角度來考慮企業要搭建一個什么樣的IT架構,相應的服務管理模式也必須與之相符。在面對業務分布式部署和數據大集中形成的數據中心這兩種不同的運維管理需求時,應著眼于實際需求情況,把關注點放到影響關鍵業務順利運轉的細節上。如果對長途網絡帶寬、服務器并發數據處理性能壓力等有較高要求,則選擇分布式部署方式。它能合理地分擔單點的壓力承載,減少對長途鏈路資源的占用,能更好地根據業務部署特性做到更加有針對性的、更加細致的監控管理。
對于數據大集中模式的網絡管理而言,在做好常規管理內容的同時,應全面考慮面對大集中產生的大規模服務器、存儲、交換設備、空調、UPS等集中部署帶來的管理壓力,要將這些與保證業務順利運轉密切相關的因素統籌監管起來,特別要關注和引入面對集中模式的自動化監控管理配套設施的上線。試想,面對成千上萬臺服務器設備,在發生電源故障、年度巡檢等引發的停機事件時,設備起停操作在人工方式下將是一個“浩大的工程”。
關鍵詞:堡壘主機;內控管理;運維審計;實踐案例
中圖分類號: TP393.08 文獻標識碼:A 文章編號:1672-3791(2015)05(c)-0000-00
近年來,筆者所在民航系統內的信息化水平正在逐步從初級應用階段發展至高級應用階段,而伴隨著這個過程產生的信息化應用與信息安全管理的矛盾也愈發突出[1]。筆者所在單位近年來在局域網內先后部署了多項網絡安全和網絡分析產品,已經形成了較為完善的信息安全防護體系,主要技術人員也積累了運維經驗。但信息系統故障等網絡安全問題仍然時有發生。通過分析故障產生的原因,發現大部分違規行為竟然來源于一些合法用戶的例行操作。傳統意義的安全防護系統可以從技術角度解決一些潛在的安全問題,但對于內部人員操作的管理手段不完善帶來的數據破壞和泄露可能比技術原因造成的損害更為嚴重。
國家公安部《信息系統安全等級保護基本要求》中明確規定了二級(含)以上的重要信息系統網絡安全、主機安全、應用安全都需要具備安全審計功能[2],所以,根據等級保護要求以及本單位的實際情況,我們迫切需要一種有效的手段來對內部人員的設備維護行為進行控制和審計,解決信息安全管理中遇到的難題。難題具體體現在:運維權限分配復雜、系統密碼管理不足、操作風險難以控制、共享賬號安全隱患、系統資源授權不清晰、訪問控制策略不嚴格、重要操作無法有效審計等。而以上這些信息安全問題,通過引入內控堡壘主機并結合管理措施之后基本得到了有效解決。
1 內控堡壘主機介紹
1.1 什么是內控堡壘主機?
最早的堡壘主機主要定位于防御外部進攻[3]。通過將其部署在防火墻或路由器之外,可以使那些需要面向外部的服務集中于堡壘主機上進行集中保護,以此來換取內部網絡的安全。
而隨著信息化應用的日趨復雜,由被動防御型的堡壘主機發展出來了更加偏重于對內部網絡、應用和數據進行綜合安全保護的管理控制平臺,也就是我們所說的內控堡壘主機。它從網絡內部出發,通過多種信息安全技術(訪問控制、身份認證、虛擬化、協議、操作審計等)實現用戶對內部網絡資源的安全訪問,同時對用戶的操作過程形成完整的審計記錄。這樣的內控平臺正可以有效地解決我們在日常運維和內控管理中遇到的難題。
1.2 功能特點
1.2.1 設備的集中管控
內控堡壘主機可以將服務器和網絡設備的信息,以及用戶信息和訪問權限提前配置在堡壘主機中,這樣便從傳統的分布式管理模式轉變成可控的集中式管理模式,以此為基礎帶來了設備管理效率和安全穩定性的提升。
1.2.2 操作的集中審計
內控堡壘主機通過協議的方式,將原來從某臺內網終端直接通過遠程連接對網絡設備和服務器進行操作的不可控的分散管理方式,轉變成為了用戶必須集中至堡壘主機的統一入口再對有授權的設備進行操作。而全部操作都通過協議錄制得到記錄,實現了精細化的集中操作審計。
總之,內控堡壘主機結合了傳統的4A 理念,即賬號管理、認證管理、授權管理、安全審計,與應用技術,形成了一個完善且可控的遠程接入解決方案。一方面,統一身份認證和統一訪問授權使得遠程接入用戶需要通過多種身份認證手段以及基于角色的授權管理才可以接入設備,滿足了信息安全等級保護的要求;另一方面,全面的審計功能讓管理員不但可以完整錄制會話過程,還可以實時監視遠程訪問會話并及時終止非法操作。
2 制定解決方案
2.1 信息安全等級保護要求
根據信息安全等級保護第三級[4]的相關要求制定內控堡壘主機的解決方案,可以滿足在要求中涉及到的網絡安全、主機安全、應用安全、數據安全及備份恢復五項技術方面的要求,以及安全管理機構、人員安全管理、系統運維管理三項管理方面的要求。根據要求中的內容以及內控堡壘主機針對每一項提供的解決方案,整理如下表1。
2.2 設計原則
2.2.1 整體安全和全網統一的原則
資源訪問的安全設計需要綜合考慮信息網絡的各個環節和全部實體,然后在不同層次上綜合使用多種安全手段,為內部信息網絡和安全業務提供管理和服務。
2.2.2 標準化原則
項目的安全體系設計嚴格遵循了國家標準,如《信息系統安全等級保護基本要求》。在達到標準要求的同時能夠使企業內部的信息系統在可控范圍內實現安全的互聯互通。
2.2.3 需求、風險、成本平衡原則
任何信息系統都無法做到絕對安全,所以設計時就需要明確性能要求以及側重點,然后從需求出發,在功能、風險和成本之間進行平衡和折中[5]。
2.2.4 實用、高效、可擴展原則
無論現狀如何,隨著技術發展信息系統仍將不斷變化,哪怕在系統實施過程中,系統的結構、配置也會發生變化。所以系統需要有一定的靈活性來適應這些變化,使其符合“有層次、成體系”的標準,既有利于系統安全,又有利于擴展。
2.2.5 技術、管理相結合原則
為了使內控堡壘主機可以發揮其應有的效果,管理者必須首先根據系統的功能特點來重新梳理和完善現有的運行管理機制和安全規章制度,同時對技術人員進行思想教育和技術培訓。通過合理的規定和具體培訓,才能完成系統的應用。
2.3 設計思路
2.3.1 集中管理模式
管理模式決定了管理的高度,所以明確管理模式應當是我們要確定首要因素。根據多年的運維實踐發現,我們對維護人員及其操作的管理手段并未伴隨著信息化進程的推進而得到加強,這樣導致了人為因素造成的運行故障比例居高不下,缺少有效的審計手段。因此迫使我們必須由分散的管理模式轉變為集中的管理模式。集中管理是運維管理思想的必然發展趨勢和唯一選擇[6]。通常,集中管理包括:集中的資源訪問入口、集中的賬號管理、集中的授權管理、集中的認證管理、集中的審計管理等等。
2.3.2 訪問協議
內控堡壘主機通過對各平臺所使用的協議進行來實現對操作行為的審計和監控[7]。比如SSH、TELNET、FTP、RDP、VNC等等Windows或Linux平臺上的訪問協議。
2.3.3 身份授權分離
為避免傳統方式的共享賬號、弱口令賬號等問題導致的安全漏洞,我們的解決思路是將身份和授權分離。首先建立用于身份認證的獨立賬號體系,然后保留各系統賬號但使其由堡壘主機接管并定期更新密碼,使得被管理設備本身的系統賬號僅用于系統授權而剝離其身份認證功能,有效增強了身份認證和系統授權的可靠性。
2.4 系統構架
我們部署的內控堡壘主機由展現層、核心服務層、接口管理層三層結構組成。
展現層面向用戶,集成了多種包括匙扣令牌在內的強身份認證方式,分別對系統管理員和運維用戶提供不同的訪問操作頁面。
核心服務層面向授權和協議,部署在服務器上。在核心服務層上完成賬號管理、授權管理及策略設置等操作。其中的協議包含用戶輸入模塊、命令捕獲引擎、策略控制和日志服務,所以具備對用戶行為進行監視、控制和記錄的功能。
接口管理層面向個信息系統,用于實現審計結合、賬號同步、認證結合等方面的數據接口工作。另外它還包含應用服務,以此來實現對B/S、C/S、半B/S半C/S系統的單點登錄及審計工作。
3 內控堡壘主機的實施
系統的實施過程中,我們將堡壘主機及其應用服務器的部署位置單獨剝離開劃分為管理區,把內部網絡的其他設備如服務器、網絡設備、數據庫等等劃分為業務區。在內控堡壘主機部署上架后,運維人員將集中通過內控堡壘主機對業務區的目標設備進行日常運維操作。
設備上架后,我們需要通過防火墻策略配置解除客戶端到堡壘主機及堡壘主機到目標服務器的端口限制。這樣當用戶訪問設備時,堡壘主機才可以完成對TELNET(端口23)、SSH(端口22)、RDP(端口3389)等協議的訪問具體設備,并在堡壘主機上完成對設備的單點登錄及會話的完整審計。
4 結語
在信息化水平快速發展的今天,技術發展與管理模式相輔相成。信息安全不僅需要先進的設備和嫻熟的技術,更需要完善的制度和審計手段。內控堡壘主機的實施切實有效地規范了內外部維護人員對IT基礎設施的維護行為,彌補了操作審計空白。它通過集中管理的模式,借助于協議、身份授權分離等技術,極大地減少了維護人員誤操作或惡意操作的概率,縮短了故障定位時間。這次內控堡壘主機的實施完善了筆者所在單位的信息安全保護體系,將有助于提高信息系統運行的安全性和穩定性。
參考文獻:
[1]潘玉. 新一代堡壘主機[J]. 信息安全與通信保密,2011,05:45.
[2]韓榮杰,于曉誼. 基于堡壘主機概念的運維審計系統[J]. 信息化建設,2012,01:56-59.
[3]趙瑞霞,王會平. 構建堡壘主機抵御網絡攻擊[J]. 網絡安全技術與應用,2010,08:26-27.
[4] 公安部信息安全等級保護評估中心. GB/T 22239-2008, 信息安全技術信息系統安全等級保護基本要求[S]. 北京:中國標準出版社,2008.
[5]韓海航,王久輝. 大型交通網絡系統安全保障體系研究[J]. 計算機安全,2007,10:77-80.
[6]吳國良. 面向NGB的網絡與信息管控建設[J]. 廣播與電視技術,2013,10:28+30-33.
[7]陳旭. IT運維操作管理有效降低企業風險[J]. 高科技與產業化,2010,05:116-119.
【關鍵詞】 醫院信息化建設 IT運維與安全管理
引言:
目前,隨著信息技術的日新月異和網絡信息系統應用的發展,醫院、企業網絡技術的應用層次正在從傳統的、小型業務系統逐漸向大型、關鍵業務系統擴展。面對日趨復雜的IT系統,不同背景的運維人員已給企事業信息系統安全運行帶來較大的潛在風險,如醫院信息系統是醫院日常工作的重要應用,存儲著重要的數據資源,是醫院正常運行必不可少的組成部分,所以必須加強安全保障體系的建設。于是,堡壘機在醫院中的應用,為醫院工作的應用提供了安全可靠的運行環境。
傳統的網絡安全審計系統給醫院的的運維安全問題帶來了很多風險,如:賬號管理無秩序,暗藏巨大隱患;粗放式權限管理的安全性難以保證;設備自身陳舊,無法審計運維加密協議、遠程桌面內容等,從而難以有效定位安全事件。
以上所面臨的風險嚴重破壞政府、醫院、企業等的信息系統安全,已經成為其信息系統安全運行的嚴重隱患,尤其是醫院,將影響其效益。尤其醫院信息系統是一個復雜的系統工程,涉及人、技術、操作等要素,單靠技術或單靠管理都不可能實現。
因此在考慮安全保障體系時,必須將各種安全技術與運行管理機制、人員思想教育與技術培訓、安全規章制度建設相結合。
如何有效監控業務系統訪問行為和敏感信息的傳播,準確掌握網絡系統的安全狀態,及時發現違反安全策略的事件并實時告警、記錄,同時進行安全事件定位分析,事后追查取證,滿足合規性審計要求,是企事業迫切需要解決的問題,即IT運維安全管理的變革已刻不容緩!
堡壘機提供一套先進的運維安全管控與審計解決方案,它通過網絡數據的采集、分析、識別,實時動態監測通信內容、網絡行為和網絡流量,發現和捕獲各種敏感信息、違規行為,實時報警響應,全面記錄網絡系統中的各種會話和事件,實現對網絡信息的智能關聯分析、評估及安全事件的準確全程跟蹤定位,為整體網絡安全策略的制定提供權威可靠的支持。
隨著堡壘機在醫院中的應用,其主要實現了以下功能:
1)賬號管理集中
堡壘機建立于唯一身份標識的全局實名制管理,支持統一賬號管理策略,實現與各服務器、網絡設備等無縫連接,集中管理主賬號(普通用戶)、從賬號(目標設備系統賬號)及相關屬性。
2)訪問控制集中
堡壘機通過集中對應用系統的訪問控制,通過對主機、服務器、網絡、數據庫等網絡中所有資源的統一訪問控制,確保用戶擁有的權限是完成任務所需的最小權限,實現集中有序的運維操作管理,防止非法、越權訪問事件的發生。
3)安全審計集中
基于唯一身份標識,堡壘機通過對用戶從登錄到退出的全程操作行為審計,監控用戶對被管理設備的所有敏感的關鍵操作,提供分級告警,聚焦關鍵事件,能完成對醫院內網所有網上行為的監控和對安全事件及時預警發現、準確可查的功能。
通過此體系監控到的數據能對醫院內部網絡的使用率、數據流量、應用提供比例、安全事件記錄、網絡設備的動作情況、網絡內人員的網上行為記錄、網絡整體風險情況等這些情況有較全面的了解。
信息安全是一個動態的過程,要根據網絡安全的變化不斷調整安全措施,適應新的網絡環境,M足新的網絡安全需求。
安全管理制度也有一個不斷完善的過程,經過安全事件的處理和安全風險評估,會發現原有的安全管理制定中存在的不足之處。根據安全事件處理經驗教訓和安全風險評估的結果,對信息安全管理策略進行修改,對信息安全管理范圍進行調整。
參 考 文 獻
[1]趙瑞霞.構建堡壘主機抵御網絡攻擊[J].網絡安全技術與應用,2010,08.