域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
本文主要介紹運(yùn)維體系與架構(gòu)的設(shè)計(jì)規(guī)劃,這將引導(dǎo)我們從一個(gè)高屋建瓴的角度去考慮如何組織運(yùn)維團(tuán)隊(duì),如何規(guī)劃運(yùn)維架構(gòu),用什么構(gòu)建起運(yùn)維架構(gòu),以及如何開(kāi)展運(yùn)維工作。
圖1-1本文將會(huì)引入很多簡(jiǎn)明的運(yùn)維實(shí)踐示例來(lái)形象直觀的告訴大家如何構(gòu)建起運(yùn)維體系。通過(guò)學(xué)習(xí)本文內(nèi)容將會(huì)使我們具備規(guī)劃與構(gòu)建整個(gè)IT運(yùn)維體系架構(gòu)的知識(shí)和能力。
運(yùn)維體系是運(yùn)維的基礎(chǔ)和核心。通過(guò)運(yùn)維體系的構(gòu)建及完善,使我們的運(yùn)維做到穩(wěn)定可靠,準(zhǔn)確完備,規(guī)范科學(xué)。從某種角度來(lái)看,系統(tǒng)運(yùn)維體系可以用一個(gè)四面體來(lái)描述(如圖1-1所示),包括四大方面:人、事、物、流程標(biāo)準(zhǔn)。
從人、事、物、流程這四個(gè)方面便可以很好地將運(yùn)維體系進(jìn)行解構(gòu),它們彼此互相作用,共同構(gòu)建了一個(gè)完整實(shí)用的運(yùn)維體系。下面列舉了這四個(gè)方面各自的含義及相關(guān)內(nèi)容。
人:例如完善崗位職責(zé)與職業(yè)發(fā)展、提高團(tuán)隊(duì)技術(shù)水平、完善技能分享與培訓(xùn)、完善團(tuán)隊(duì)績(jī)效考核、規(guī)范工作行為規(guī)范等。目的是要建成一支工作高效、技術(shù)水平高、團(tuán)結(jié)穩(wěn)定、有職業(yè)素養(yǎng)的運(yùn)維團(tuán)隊(duì)。
事:例如做好日?;A(chǔ)運(yùn)維工作,保障好生產(chǎn)業(yè)務(wù)運(yùn)行。不斷探索新的運(yùn)維理念與技術(shù),探索優(yōu)化系統(tǒng)架構(gòu)。具體可以分為幾大塊,例如運(yùn)維流程管理,資源架構(gòu)規(guī)劃,應(yīng)急與故障處理,監(jiān)控與優(yōu)化,安全與防護(hù),項(xiàng)目及日常工作,等等。目的是要明白運(yùn)維做什么正確的事,怎么正確地做事,做事有章法,穩(wěn)定高效能。
物:主要是如何管理好系統(tǒng)運(yùn)維所涉及的各種資源。例如機(jī)房環(huán)境、辦公設(shè)備、服務(wù)器、網(wǎng)絡(luò)設(shè)備、操作系統(tǒng)、應(yīng)用軟件、工具等各種軟硬件資源。目的要使各類(lèi)資源配置管理妥當(dāng),清楚資源屬性,知道從哪來(lái),現(xiàn)在哪,要去哪。使得物盡其用,物有所值,安置妥當(dāng)。
流程標(biāo)準(zhǔn):運(yùn)用流程標(biāo)準(zhǔn)將上述要素(人、事、物)有機(jī)地結(jié)合,有序科學(xué)地流轉(zhuǎn)、高效穩(wěn)定地運(yùn)行。例如資源規(guī)劃與采購(gòu),各種標(biāo)準(zhǔn)規(guī)范、項(xiàng)目規(guī)范、軟硬件配置部署規(guī)范、安全制度、工作交接,等等。
就上述四大方面,下文繼續(xù)展開(kāi)論述,當(dāng)然也僅是一些內(nèi)容的列舉,畢竟具體到每個(gè)企業(yè)組織,其運(yùn)維工作內(nèi)容可能會(huì)大同小異。
1.1團(tuán)隊(duì)人員規(guī)劃
1.1.1崗位職責(zé)劃分
一個(gè)優(yōu)秀企業(yè)(組織團(tuán)隊(duì))的核心競(jìng)爭(zhēng)力其實(shí)說(shuō)到底就是人。合適的人在合適崗位上正確地干正確的事情——這就是核心競(jìng)爭(zhēng)力。一個(gè)好的運(yùn)維團(tuán)隊(duì)也是如此,人在運(yùn)維體系中就是核心,好的運(yùn)維團(tuán)隊(duì)能夠有效地、高質(zhì)量地、相對(duì)低成本地發(fā)揮各個(gè)運(yùn)維元素的功效,達(dá)到更完美的運(yùn)維效能。
對(duì)于運(yùn)維崗位劃分,很多企業(yè)大同小異,一般都是以保障業(yè)務(wù)生產(chǎn)穩(wěn)定高效運(yùn)行為目的,根據(jù)自身企業(yè)發(fā)展需要?jiǎng)澐謲徫?。小微企業(yè)可能沒(méi)有專(zhuān)門(mén)的運(yùn)維人員及崗位設(shè)置,稍大的一些企業(yè)也可能由其他崗位人員(如開(kāi)發(fā)人員)兼職運(yùn)維人員,發(fā)展到中小型企業(yè)后往往就會(huì)設(shè)置專(zhuān)門(mén)的運(yùn)維崗位人員從事日常維護(hù)工作。對(duì)于中大型企業(yè)一般都會(huì)有專(zhuān)門(mén)的運(yùn)維團(tuán)隊(duì)從事專(zhuān)業(yè)的運(yùn)維工作,而且不僅僅是運(yùn)維,還包括運(yùn)維開(kāi)發(fā)。
隨著運(yùn)維的發(fā)展,運(yùn)維崗位也逐漸細(xì)分很多種,各個(gè)企業(yè)崗位設(shè)置與職責(zé)也不盡相同,但崗位工作內(nèi)容大同小異。大致有如下崗位:系統(tǒng)管理員、數(shù)據(jù)庫(kù)管理員、網(wǎng)絡(luò)管理員、機(jī)房環(huán)境管理員、運(yùn)維開(kāi)發(fā)工程師、應(yīng)用運(yùn)維工程師、服務(wù)管理工程師、安全審計(jì)工程師、架構(gòu)師等。
有了崗位設(shè)置及專(zhuān)職人員,然后就會(huì)產(chǎn)生人力職業(yè)發(fā)展、技能培訓(xùn)、績(jī)效考核等一系列問(wèn)題,這些問(wèn)題往往即相互聯(lián)系又各成一體。
如下是某企業(yè)的崗位職責(zé)劃分示例:
- 崗位(一級(jí)分類(lèi))通用職責(zé)要求是系統(tǒng)管理每個(gè)崗位都應(yīng)履行的職責(zé)。
- 崗位(二級(jí)分類(lèi))專(zhuān)項(xiàng)職責(zé)是針對(duì)每一項(xiàng)工作崗位的職責(zé)要求。
- 崗位(三級(jí)分類(lèi))專(zhuān)人職責(zé)是針對(duì)每一個(gè)人設(shè)置的各自不同的具體職責(zé)。每個(gè)人在執(zhí)行通用職責(zé)的基礎(chǔ)上同時(shí)履行各自的專(zhuān)項(xiàng)專(zhuān)人職責(zé)。
崗位(一級(jí)分類(lèi))通用職責(zé)示例通用職責(zé)如表1-1所示。
表1-1
續(xù)表
崗位(二級(jí)分類(lèi))專(zhuān)項(xiàng)職責(zé)示例如下是系統(tǒng)管理崗位工作示例:
表1-2
續(xù)表
1.1.2崗位交接示例
因人員的短期離崗(以及離職)會(huì)給運(yùn)維的穩(wěn)定性、安全性、經(jīng)驗(yàn)傳承、資料留存、以及團(tuán)隊(duì)穩(wěn)定等眾多方面產(chǎn)生一系列影響,運(yùn)維工作中的故障隱患很大比例來(lái)自于崗位交接。因此運(yùn)維工作的崗位交接是個(gè)重要的事情,表1-3是崗位交接制度示例。
表1-3
續(xù)表
1.1.4技能培訓(xùn)
不同的企業(yè),對(duì)人力的培訓(xùn)也各有方式,輕重不同,內(nèi)容有別。有的企業(yè)注重以老帶新,有的企業(yè)注重個(gè)人自學(xué),有的企業(yè)注重內(nèi)部交流,有的企業(yè)注重外部培訓(xùn)。培訓(xùn)往往也與崗位發(fā)展、財(cái)務(wù)狀況、績(jī)效考核、獎(jiǎng)懲福利等相互關(guān)聯(lián)。
從培訓(xùn)的途徑來(lái)看,培訓(xùn)主要分為內(nèi)訓(xùn)和外訓(xùn)兩種方式。
內(nèi)訓(xùn):
由公司人力部門(mén)(或其他某部門(mén))組織的培訓(xùn),包括外請(qǐng)其他公司專(zhuān)家、公司內(nèi)部講師(一般都是有經(jīng)驗(yàn)特長(zhǎng)的內(nèi)部員工)。
外訓(xùn):
(1)由公司出資金為員工提供外部的培訓(xùn)(員工個(gè)人申請(qǐng)培訓(xùn)內(nèi)容、培訓(xùn)機(jī)構(gòu)、價(jià)格。經(jīng)公司審批后即可外訓(xùn))。
(2)公司簽訂的部分合同中附帶有一些培訓(xùn)。
(3)由公司組織聯(lián)系到其他單位參觀交流。
(4)由其他廠商邀請(qǐng)的技術(shù)大會(huì)、峰會(huì)等。
(5)由公司組織選拔資助少量員工直接到其他單位實(shí)地鍛煉學(xué)習(xí)。
(6)由公司選拔資助少量員工參加一些脫產(chǎn)或不脫產(chǎn)的繼續(xù)教育學(xué)習(xí)。
1.1.5績(jī)效考核示例
有人對(duì)應(yīng)崗位做相應(yīng)的工作,自然而然會(huì)有績(jī)效問(wèn)題,也因此也會(huì)產(chǎn)生績(jī)效考核相關(guān)制度。
運(yùn)維考核的難度在于如何定義KPI關(guān)鍵業(yè)績(jī)指標(biāo)、如何定性與量化,每個(gè)企業(yè)單位內(nèi)部都不一樣,需要根據(jù)自身環(huán)境定制基線(xiàn)。
考核的方式多種多樣??梢园凑諘r(shí)間分為周考核、月考核、季度考核、年終考核。也可以按照KPI等關(guān)鍵因素進(jìn)行考核。也可以從上下級(jí)人為主觀考核。也可以由評(píng)審委員會(huì)考核。
表1-6是某運(yùn)維部門(mén)考核標(biāo)準(zhǔn)示例。
1.2體系架構(gòu)相關(guān)事宜規(guī)劃
運(yùn)維要做的事情,實(shí)在太多了。說(shuō)復(fù)雜,復(fù)雜得沒(méi)有人能說(shuō)明白,列舉全面。說(shuō)簡(jiǎn)單,倒也簡(jiǎn)單:運(yùn)維工作就是支持生產(chǎn)運(yùn)行,是成本中心,一般不直接產(chǎn)生利潤(rùn)。目的就是運(yùn)行保障生產(chǎn)設(shè)備軟硬件正常運(yùn)行,讓內(nèi)外部用戶(hù)滿(mǎn)意度。
運(yùn)維要做的事情與崗位職責(zé)內(nèi)容密切聯(lián)系,可能有了運(yùn)維要做的事情需求,因此設(shè)置了崗位和人員,但也有因?yàn)橛辛诉@個(gè)崗位的人,因此創(chuàng)造了一些運(yùn)維事情。這有點(diǎn)“雞生蛋、蛋生雞”的邏輯。
1.2.1 運(yùn)維系統(tǒng)架構(gòu)
每個(gè)公司的IT環(huán)境,不論大小復(fù)雜度,總會(huì)有個(gè)系統(tǒng)架構(gòu)層次。有了這個(gè)架構(gòu)體系,那所有的運(yùn)維事情大體都圍繞著這個(gè)系統(tǒng)架構(gòu)上的每個(gè)元素及整體進(jìn)行運(yùn)維保障工作。運(yùn)維架構(gòu)從某種角度可以劃分為如下兩種:商業(yè)封閉式系統(tǒng)架構(gòu)(IOE架構(gòu))與開(kāi)源系統(tǒng)架構(gòu)。
1. 商業(yè)封閉式系統(tǒng)架構(gòu)(IOE架構(gòu))
典型的即以使用IOE(IBM、Oracle、EMC)產(chǎn)品軟硬件為主要元素的系統(tǒng)架構(gòu)。IOE架構(gòu)以縱向擴(kuò)展為特點(diǎn),通過(guò)增加CPU、內(nèi)存、擴(kuò)展柜、冗余備件等方式來(lái)提高處理能力及穩(wěn)定性。該架構(gòu)的處理能力主要取決于單臺(tái)(套)設(shè)備(系統(tǒng))的最大擴(kuò)展能力,很難通過(guò)增加設(shè)備(系統(tǒng))數(shù)量來(lái)增加處理能力,換句話(huà)說(shuō)該架構(gòu)很難通過(guò)擴(kuò)大集群規(guī)模的方式來(lái)解決問(wèn)題。隨著縱向擴(kuò)展的規(guī)模增大,其實(shí)施技術(shù)難度、管理復(fù)雜度以及隱患風(fēng)險(xiǎn)都會(huì)正比例大幅上升?;贗OE架構(gòu)的典型企業(yè)如:金融業(yè)、電信業(yè),交通運(yùn)輸業(yè)。IOE典型的系統(tǒng)架構(gòu)如圖1-2所示。
圖1-2
上述IOE型系統(tǒng)架構(gòu)。其服務(wù)器多使用小型機(jī)、大型機(jī)(還有以往的中型機(jī)),數(shù)據(jù)庫(kù)系統(tǒng)往往會(huì)使用Oracle,存儲(chǔ)則多使用知名品牌的中高端存儲(chǔ)陣列、帶庫(kù)等設(shè)備。服務(wù)器與存儲(chǔ)之間多使用SAN存儲(chǔ)網(wǎng)絡(luò)。這些服務(wù)器、存儲(chǔ)等硬件本身往往就是雙冗余的,線(xiàn)路連線(xiàn)也都是雙冗余的,而且設(shè)備性能指標(biāo)往往非常好,例如一臺(tái)普通中端的Power 7系列服務(wù)器可以輕松劃分出若干個(gè)系統(tǒng)分區(qū)或者一二十個(gè)虛擬機(jī)系統(tǒng)。
2. 開(kāi)源系統(tǒng)架構(gòu)
典型的即以使用廉價(jià)PC服務(wù)器,開(kāi)源產(chǎn)品技術(shù)為主要元素的系統(tǒng)架構(gòu)。開(kāi)源系統(tǒng)架構(gòu)以橫向擴(kuò)展,分布式部署為特點(diǎn)。通常通過(guò)往集群中增加單機(jī)設(shè)備資源解決存儲(chǔ)空間、性能以及穩(wěn)定性問(wèn)題,其集群規(guī)??梢孕〉絻扇_(tái)PC服務(wù)器組成,也可以大到上萬(wàn)臺(tái)PC服務(wù)器集群。對(duì)于數(shù)據(jù)庫(kù),可以通過(guò)分布式集群方式解決數(shù)據(jù)庫(kù)擴(kuò)展性的問(wèn)題。另外非結(jié)構(gòu)化數(shù)據(jù)庫(kù)及分布式文件系統(tǒng)在處理非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)與使用方面也很靈活方便。基于開(kāi)源系統(tǒng)架構(gòu)的典型企業(yè)如:以BAT(百度、阿里、騰訊)為代表的眾多互聯(lián)網(wǎng)企業(yè),開(kāi)源系統(tǒng)架構(gòu)如圖1-3所示。
圖1-3
上述開(kāi)源系統(tǒng)架構(gòu)中使用了CDN和反向代理以提高網(wǎng)站性能。例如我們的服務(wù)器可能部署在北京,對(duì)于北京及周邊用戶(hù)來(lái)說(shuō)訪(fǎng)問(wèn)是較快的,而對(duì)于遠(yuǎn)離北京的用戶(hù)訪(fǎng)問(wèn)則感覺(jué)較慢,因?yàn)閿?shù)據(jù)傳輸時(shí)間比較長(zhǎng)。對(duì)于這種情況,常常使用CDN解決,CDN將數(shù)據(jù)內(nèi)容緩存到運(yùn)營(yíng)商(或自建CDN)的機(jī)房,用戶(hù)訪(fǎng)問(wèn)時(shí)先從最近的CDN機(jī)房獲取數(shù)據(jù),這樣大大減少了網(wǎng)絡(luò)訪(fǎng)問(wèn)的路徑。
對(duì)于反向代理,當(dāng)用戶(hù)請(qǐng)求達(dá)到時(shí)首先訪(fǎng)問(wèn)反向代理,反向代理服務(wù)器將(Varnish)緩存的數(shù)據(jù)返回給用戶(hù),如果沒(méi)有沒(méi)有緩存數(shù)據(jù)才會(huì)繼續(xù)走應(yīng)用服務(wù)器獲取,這也減少了獲取數(shù)據(jù)的成本。當(dāng)然對(duì)于海量訪(fǎng)問(wèn)請(qǐng)求,或者龐大集群架構(gòu),則就需要分多層、綜合運(yùn)用上述負(fù)載均衡以及代理(反代理),同時(shí)可能需要引入zookeeper等功能以協(xié)調(diào)(服務(wù))任務(wù)調(diào)度。
關(guān)于去IOE問(wèn)題,本文簡(jiǎn)單闡述如下。
近年來(lái)開(kāi)源技術(shù)的迅猛發(fā)展,以及國(guó)內(nèi)外政策環(huán)境共同作用,引發(fā)了一場(chǎng)去IOE的風(fēng)潮。他們使用低廉的軟硬件產(chǎn)品代替昂貴高門(mén)檻的IOE產(chǎn)品,搭建起自主開(kāi)放的開(kāi)源系統(tǒng)架構(gòu)。之所以出現(xiàn)“去IOE”運(yùn)動(dòng),其中原因總結(jié)概述如下幾條:
(1)自“棱鏡門(mén)事件”之后,國(guó)家強(qiáng)烈意識(shí)到數(shù)據(jù)安全的重要性,大力提倡產(chǎn)品設(shè)備國(guó)產(chǎn)化與自主研發(fā),這正與“去IOE”觀點(diǎn)不謀而合,上下一致。
(2)近年來(lái),云計(jì)算、大數(shù)據(jù)等新興IT技術(shù)的蓬勃發(fā)展,促使眾多行業(yè)開(kāi)始往更加開(kāi)放靈活的開(kāi)放系統(tǒng)架構(gòu)轉(zhuǎn)型。這對(duì)于傳統(tǒng)的IOE架構(gòu)而言,其定制與擴(kuò)展靈活性有限,往往是擅長(zhǎng)于集中式架構(gòu)的管理,而很難應(yīng)對(duì)大規(guī)模集群,分布式存儲(chǔ)計(jì)算。
(3)在購(gòu)買(mǎi)成本方面,以IOE為代表的商業(yè)產(chǎn)品價(jià)格昂貴(動(dòng)輒上百萬(wàn)元),PC服務(wù)器相對(duì)廉價(jià)(通常幾萬(wàn)元)。在部署與管理方面,IOE產(chǎn)品的學(xué)習(xí)掌握門(mén)檻偏高,而開(kāi)源系統(tǒng)環(huán)境相對(duì)容易搭建與管理。另外IOE產(chǎn)品技術(shù)相對(duì)商業(yè)封閉,不易掌握。
基于上述一些原因,去IOE應(yīng)時(shí)而生。當(dāng)然具體到自身企業(yè)是否要去IOE,這需要慎重考慮,適合自身發(fā)展需要的系統(tǒng)架構(gòu)就是好的架構(gòu)。去IOE過(guò)程,其實(shí)是系統(tǒng)架構(gòu)的更新?lián)Q代,產(chǎn)品的更新?lián)Q代,運(yùn)維理念的更新?lián)Q代,運(yùn)維人員的更新?lián)Q代,知識(shí)體系的更新?lián)Q代,等等。因此如果冒然去IOE,可能既不會(huì)降低成本,也不會(huì)提高效率,更不會(huì)穩(wěn)定架構(gòu)。如下列舉幾點(diǎn)“去IOE”要考慮的因素:
- 自身業(yè)務(wù)是否真正需要大數(shù)據(jù)、云計(jì)算以及分布式這種海量運(yùn)維體系。
- 是否已經(jīng)考慮好系統(tǒng)架構(gòu)、運(yùn)維理念、人員、知識(shí)更新?lián)Q代的方案。
- 自身的研發(fā)實(shí)力儲(chǔ)備是否夠解決大量開(kāi)源產(chǎn)品的坑坑洼洼,并有實(shí)力搭建開(kāi)源系統(tǒng)架構(gòu)。
- 是否有足夠的資金應(yīng)對(duì)“去IOE”轉(zhuǎn)型中的成本,例如從硬件高成本轉(zhuǎn)向人力技術(shù)高成本。
去IOE只是給予我們一些最佳實(shí)踐與選擇路子,但去IOE技術(shù)門(mén)檻較高,一般企業(yè)很難復(fù)制。從目前發(fā)展來(lái)看,IOE架構(gòu)與非IOE架構(gòu)仍將長(zhǎng)期并存。一時(shí)間很難找到一些能夠完美替代以IOE為代表的成熟(且普適)產(chǎn)品方案。
1.2.2運(yùn)維工作層次分類(lèi)示例
例如《海量運(yùn)維、運(yùn)營(yíng)規(guī)劃》(作者:唐文)一書(shū),作者很有觀點(diǎn)地概括了運(yùn)維要做的事情,他以質(zhì)量、效率、成本為核心,從運(yùn)營(yíng)規(guī)劃、管理、流程/規(guī)范、系統(tǒng)/平臺(tái)、監(jiān)控、告警、安全、優(yōu)化、考核等幾個(gè)維度來(lái)闡述運(yùn)維工作,如圖1-4所示。
圖1-4
另外也可以從邏輯框架的層次來(lái)分類(lèi)運(yùn)維工作要做的事情。如下借鑒美團(tuán)的分享者(唐君毅、邱劍、朱晏)關(guān)于企業(yè)運(yùn)維的觀點(diǎn),運(yùn)維框架可以概括為五橫三縱。
從橫向來(lái)看,自底向上分為五個(gè)層次:
- 物理層:包括機(jī)房網(wǎng)絡(luò)、硬件設(shè)施相關(guān)工作。如采購(gòu)招投標(biāo)工作、機(jī)房實(shí)施工作、機(jī)房環(huán)境(強(qiáng)弱電、照明、通風(fēng)、網(wǎng)絡(luò)布線(xiàn)、溫濕度等),各種設(shè)備上下電與維修工作等。
- 系統(tǒng)層:包括操作系統(tǒng)、虛擬化、云計(jì)算等一系列系統(tǒng)環(huán)境所涉及的部署、配置、優(yōu)化等工作。
- 服務(wù)層:包括Webserver、緩存、代理、數(shù)據(jù)庫(kù)等所涉及的軟件應(yīng)用的部署、配置、優(yōu)化等工作。
- 邏輯層:包括業(yè)務(wù)邏輯、數(shù)據(jù)流。這一層的主要工作是發(fā)布和變更。
- 應(yīng)用層:包括用戶(hù)可見(jiàn)部分。所有前端平臺(tái),主要涉及與前端用戶(hù)交互或提供信息(服務(wù))的平臺(tái)。比如前端網(wǎng)站、各種新媒體平臺(tái)的維護(hù)與監(jiān)控。
從縱向來(lái)看,有三部分工作,對(duì)上述五個(gè)層次是通用的:
- 監(jiān)控:從物理層到服務(wù)層的監(jiān)控和報(bào)警都是運(yùn)維來(lái)跟進(jìn)、響應(yīng)的。對(duì)于邏輯層和應(yīng)用層,一般由運(yùn)維提供監(jiān)控API的規(guī)范,開(kāi)發(fā)人員自己創(chuàng)建監(jiān)控項(xiàng)、設(shè)定報(bào)警規(guī)則、進(jìn)行增刪改查。
- 安全:建立部署統(tǒng)一的安全接入平臺(tái),所有線(xiàn)上的人工操作都需要登陸跳板機(jī),每個(gè)人有獨(dú)立的登陸帳號(hào),所有線(xiàn)上操作都有審計(jì)日志。更多的安全工作由專(zhuān)門(mén)的信息安全組負(fù)責(zé)。
- 流程:早期基于Jira做了一些簡(jiǎn)單的流程,但需要改進(jìn)?,F(xiàn)在正在針對(duì)比較集中的需求,開(kāi)發(fā)相應(yīng)的流程控制系統(tǒng),方向也是自動(dòng)化、自助化。從業(yè)務(wù)部門(mén)申請(qǐng)VM資源,到業(yè)務(wù)擴(kuò)容的整個(gè)流程,未來(lái)可以在Web界面上通過(guò)很簡(jiǎn)單的操作實(shí)現(xiàn),也提供服務(wù)化的API,方便其他業(yè)務(wù)平臺(tái)進(jìn)行集成。以期實(shí)現(xiàn)虛擬化覆蓋全業(yè)務(wù)線(xiàn)。
1.3基礎(chǔ)設(shè)施相關(guān)物資規(guī)劃
做飯要有材米油鹽,打仗要有彈藥武器。干運(yùn)維,也要有一系列軟硬工具。什么算是運(yùn)維工作的工具,恐怕這個(gè)也沒(méi)有明確定義。運(yùn)維所涉及的工具物品,有看的見(jiàn)的,也有看不見(jiàn)的;有摸得著的,也有摸不著的。這里簡(jiǎn)單概括一下運(yùn)維工作會(huì)用到的各種軟硬件、工具、設(shè)施。
1.3.1機(jī)房基礎(chǔ)設(shè)施環(huán)境示例
如下列舉的是機(jī)房基礎(chǔ)設(shè)施環(huán)境相關(guān)要素,如表1-7所示。機(jī)房不論大小,基本上都會(huì)涉及到如下幾大主要工程(系統(tǒng))。
續(xù)表
1.3.2服務(wù)器產(chǎn)品示例
對(duì)于大多數(shù)企業(yè)通常是采購(gòu)現(xiàn)有品牌(也有些企業(yè)是定制設(shè)備),產(chǎn)品示例如表1-8所示。
1.3.3 存儲(chǔ)設(shè)備示例
存儲(chǔ)設(shè)備示例如表1-9所示。
1.3.4 操作系統(tǒng)示例
操作系統(tǒng)示例如表1-10所示。
1.3.5 常用軟件示例
常用軟件示例如表1-11所示。
續(xù)表
1.4運(yùn)維流程標(biāo)準(zhǔn)規(guī)劃
將上述要素(人、事、物)有機(jī)地結(jié)合,有序科學(xué)地流轉(zhuǎn)、高效穩(wěn)定地運(yùn)行,就得靠科學(xué)合理的流程,如各種規(guī)章制度、流程標(biāo)準(zhǔn)。
流程就好比珠寶上的穿繩,就好比一個(gè)人的思想,就好比社會(huì)法律規(guī)范。流程是一個(gè)企業(yè)的流水線(xiàn),是企業(yè)的行為規(guī)范,是企業(yè)制度與文化的組成部分。合理的流程規(guī)范像血液,能讓部門(mén)穩(wěn)定高效地運(yùn)轉(zhuǎn),這是企業(yè)專(zhuān)業(yè)與否的重要組成部分。
運(yùn)維工作到底有多少流程,這個(gè)無(wú)法窮舉,就好比一個(gè)人的思想到底有多少,因人而異,因時(shí)而異。關(guān)于IT服務(wù)運(yùn)營(yíng)流程,ITIL流程在全球享有盛名,ITIL為企業(yè)的IT服務(wù)管理實(shí)踐提供了一個(gè)客觀、嚴(yán)謹(jǐn)、可量化的標(biāo)準(zhǔn)和規(guī)范,這在后續(xù)章節(jié)做專(zhuān)題介紹。本文主要列舉運(yùn)維工作中一些常見(jiàn)流程規(guī)范。
1.4.1商務(wù)流程
商務(wù)公開(kāi)招標(biāo)流程示例:
商務(wù)公開(kāi)招投標(biāo)大致流程如下所示:
采購(gòu)啟動(dòng) → 需求確認(rèn) → 委托招標(biāo)上報(bào) → 簽訂委托協(xié)議 → 標(biāo)書(shū)準(zhǔn)備(采購(gòu)部門(mén)技術(shù)標(biāo)書(shū)準(zhǔn)備,商務(wù)部門(mén)組織商務(wù)標(biāo)書(shū)準(zhǔn)備,標(biāo)書(shū)合并)→ 提交標(biāo)書(shū) → 專(zhuān)家評(píng)審意見(jiàn)反饋 → 公開(kāi)招標(biāo)上報(bào) → 公開(kāi)招標(biāo) → 招標(biāo)結(jié)果上報(bào) → 商務(wù)談判 → 合同簽訂上報(bào) → 簽訂采購(gòu)合同
1.4.2運(yùn)維制度流程
一、項(xiàng)目管理制度示例:
以下簡(jiǎn)要介紹項(xiàng)目開(kāi)展與實(shí)施相關(guān)制度流程
1、 執(zhí)行集團(tuán)和公司的項(xiàng)目管理規(guī)定。
2、 項(xiàng)目范圍為公司和部門(mén)下達(dá)的各類(lèi)項(xiàng)目。
3、 每年10月底之前,部門(mén)結(jié)合公司下達(dá)的任務(wù)和部門(mén)的生產(chǎn)需求,研究討論制定部門(mén)下一年度的項(xiàng)目計(jì)劃,完成項(xiàng)目建議書(shū)(含目標(biāo)、范圍、完成時(shí)間、費(fèi)用估算等)
4、 每年12月底之前,針對(duì)部門(mén)下一年度的項(xiàng)目計(jì)劃,通過(guò)任命和競(jìng)聘相結(jié)合的方式產(chǎn)生各項(xiàng)目經(jīng)理。部門(mén)和項(xiàng)目經(jīng)理應(yīng)根據(jù)項(xiàng)目建議書(shū)中項(xiàng)目目標(biāo)、范圍、時(shí)間要求等內(nèi)容,并根據(jù)人員的實(shí)際情況,在10個(gè)工作日內(nèi),組建項(xiàng)目團(tuán)隊(duì),提交可行的驗(yàn)收標(biāo)準(zhǔn)、項(xiàng)目計(jì)劃、管理章程
5、 項(xiàng)目的實(shí)施流程主要分為一、啟動(dòng)項(xiàng)目呈批件;二、可行性分析和技術(shù)方案形成階段;三、方案完善階段;四、提交啟動(dòng)商務(wù)呈批件;五、提交商務(wù)談判說(shuō)明和啟動(dòng)商務(wù)呈批件;六、商務(wù)談判過(guò)程;七、提交合同簽訂呈批件階段;八、到貨驗(yàn)收階段;九、試運(yùn)行階段;十、項(xiàng)目驗(yàn)收階段。
6、 原則上產(chǎn)品供應(yīng)商的選擇不少于3家,如果產(chǎn)品唯一那么集成商或代理商選擇不少于3家。
二、需求處理流程規(guī)定示例
需求提出者在ITSM系統(tǒng)流程中向職責(zé)對(duì)應(yīng)團(tuán)隊(duì)小組提出需求,承接團(tuán)隊(duì)對(duì)需求進(jìn)行分析處理,處理流程示例如下圖1-5。
圖1-5
三、故障處理制度流程示例:
1. 故障來(lái)源于客戶(hù)報(bào)告、值班人員巡查、監(jiān)控系統(tǒng)監(jiān)控、日常例行檢查等。
2. 根據(jù)故障對(duì)用戶(hù)的影響程度,對(duì)故障進(jìn)行如下分類(lèi):
嚴(yán)重故障:生產(chǎn)系統(tǒng)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)性能?chē)?yán)重降低,應(yīng)用系統(tǒng)運(yùn)行緩慢,工具軟件不可用,機(jī)房供配電系統(tǒng)發(fā)生故障等對(duì)生產(chǎn)安全運(yùn)行存在嚴(yán)重隱患,開(kāi)發(fā)、測(cè)試、災(zāi)備、應(yīng)急系統(tǒng)不可用,或?qū)τ脩?hù)使用產(chǎn)生嚴(yán)重影響的故障。
重大故障:生產(chǎn)系統(tǒng)(含子系統(tǒng))、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)不可用、網(wǎng)絡(luò)中斷、機(jī)房供配電系統(tǒng)停止運(yùn)行等影響生產(chǎn)安全、無(wú)法保障用戶(hù)使用的故障。
一般故障:生產(chǎn)系統(tǒng)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、機(jī)房供配電系統(tǒng)、工具軟件等告警或運(yùn)行狀態(tài)不正常,開(kāi)發(fā)、測(cè)試、災(zāi)備、應(yīng)急系統(tǒng)發(fā)生問(wèn)題,且不影響用戶(hù)正常使用的故障。
故障癥候:生產(chǎn)系統(tǒng)(含子系統(tǒng))、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)有故障癥候,報(bào)故障代碼或故障消息,或者對(duì)生產(chǎn)正常運(yùn)行存在易患, 并可在一定時(shí)限內(nèi)解決的故障。
3. 當(dāng)故障發(fā)生在工作時(shí)間內(nèi),由故障發(fā)現(xiàn)者通知崗位工程師,崗位工程師依據(jù)《工作上報(bào)批準(zhǔn)規(guī)范》進(jìn)行信息通報(bào)上級(jí)經(jīng)理,將故障記錄填寫(xiě)到ITSM的事件流程中,并負(fù)責(zé)故障處理。各級(jí)經(jīng)理決定通知相關(guān)崗位和客戶(hù)的范圍和方式。當(dāng)故障發(fā)生在非工作時(shí)間,由值班人員按照《電話(huà)值班管理規(guī)定》通知電話(huà)值班工程師處理,并在隨后的一個(gè)工作日內(nèi)記錄在ITSM服務(wù)管理系統(tǒng)中,電話(huà)值班工程師依據(jù)《工作上報(bào)批準(zhǔn)規(guī)范》進(jìn)行上報(bào)上級(jí)經(jīng)理,由科室經(jīng)理決定通知相關(guān)崗位和客戶(hù)的范圍和方式。
4. 故障受理人負(fù)責(zé)故障處理,當(dāng)需要服務(wù)商工程師到現(xiàn)場(chǎng)時(shí),故障受理人聯(lián)系服務(wù)商工程師,并陪同服務(wù)商工程師進(jìn)行故障處理。當(dāng)故障持續(xù)時(shí)間較長(zhǎng)需要輪換故障處理人員時(shí),要做好故障處理交接工作,并將前期處理情況和過(guò)程以文字形式交接給接續(xù)人員,并通報(bào)科室經(jīng)理,接續(xù)人員繼續(xù)承擔(dān)處理故障職責(zé)。
5. 上級(jí)經(jīng)理跟蹤下級(jí)故障處理過(guò)程。
6. 故障處理完畢后,由故障處理人員通知上級(jí)經(jīng)理,告知故障已經(jīng)解決,并由經(jīng)理決定通知相關(guān)崗位和客戶(hù)的范圍和方式,最后故障處理人員或運(yùn)維主管將ITSM中的事件流程中的故障記錄填寫(xiě)完整。
7. 需要升級(jí)到問(wèn)題的故障轉(zhuǎn)入問(wèn)題流程,后續(xù)按照《問(wèn)題管理規(guī)定》處理。
四、應(yīng)急(演練)管理流程示例:
制定應(yīng)急管理流程的目的是為了在發(fā)生應(yīng)急事件時(shí),各相關(guān)生產(chǎn)部門(mén)能根據(jù)流程對(duì)應(yīng)急事件進(jìn)行通報(bào)、指揮、處理和協(xié)調(diào),最大限度地降低事件所帶來(lái)的不利影響,使得應(yīng)急事件能夠得到有效的管理應(yīng)急管理流程示例如下圖1-6:
圖1-6
1.4.3安裝配置標(biāo)準(zhǔn)
1.4.4 安全制度
隨著物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、移動(dòng)網(wǎng)絡(luò)等高新技術(shù)引領(lǐng)信息發(fā)展的新高潮,政治經(jīng)濟(jì)的復(fù)雜性,使得現(xiàn)在及未來(lái)信息安全愈發(fā)至關(guān)重要。也因此信息安全運(yùn)維也至關(guān)重要。本小結(jié)僅作示例,后續(xù)章節(jié)將再單獨(dú)介紹信息安全。
1.5運(yùn)維知識(shí)體系規(guī)劃
綜上所述,不論是傳統(tǒng)的運(yùn)維體系還是互聯(lián)網(wǎng)運(yùn)維體系,兩者之間并非涇渭分明,而是難分難解。不同行業(yè)背景的運(yùn)維,雖有各自的差異,但運(yùn)維大環(huán)境與趨勢(shì)是一致的??梢灶A(yù)想未來(lái)一段時(shí)間,運(yùn)維趨勢(shì)具有如下特點(diǎn):
- 傳統(tǒng)IT運(yùn)維與互聯(lián)網(wǎng)IT運(yùn)維仍將長(zhǎng)期并存。
- 傳統(tǒng)運(yùn)維方式與基于云計(jì)算的運(yùn)維方式將長(zhǎng)期并存。
- 公有云與私有云及混合云運(yùn)維局面將長(zhǎng)期并存。
- 基于業(yè)務(wù)場(chǎng)景的運(yùn)維仍將是運(yùn)維價(jià)值觀方向。
- 完全閉源的生態(tài)環(huán)境和完全開(kāi)源的生態(tài)環(huán)境是兩個(gè)極端,更多的IT生態(tài)是混合狀態(tài)。
- 運(yùn)維部門(mén)將由傳統(tǒng)的IT成本中心向IT服務(wù)中心、價(jià)值輸出中心、利潤(rùn)輸出中心轉(zhuǎn)變。
- 研發(fā)、運(yùn)維及業(yè)務(wù)之間的邊界也并非黑白分明,DevOps的理念逐步深入各行業(yè)。
這里從一個(gè)架構(gòu)高度看待和規(guī)劃運(yùn)維。正如前文所述,我們從人、事、物、流程這四個(gè)方面共同構(gòu)建了一個(gè)完整實(shí)用的運(yùn)維體系。如下將基于上述理論給出一套整體示例。
人員事情軟硬件物資流程規(guī)范產(chǎn)品技能知識(shí)點(diǎn)舉例
【本文為51CTO專(zhuān)欄作者“韓曉光”的原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)通過(guò)51CTO聯(lián)系作者獲取授權(quán)】
戳這里,看該作者更多好文
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!