仗技術(shù)人員的應(yīng)變能力。技術(shù)人員不得不頻繁面對(duì)同樣的變更和問題,而無心力進(jìn)行進(jìn)一步的能力挖掘。
如果一個(gè)熟練運(yùn)維人員的崗位發(fā)生變更,當(dāng)問題再出現(xiàn)時(shí),就很難得到迅速處理。即使會(huì)有新人繼續(xù)前人的工作,但他卻無法繼承前人的運(yùn)維經(jīng)驗(yàn),這成為企業(yè)運(yùn)維成本增加、重復(fù)投資的重要原因。
以上5點(diǎn)都是導(dǎo)致IT運(yùn)維成本無法下降的因素,接下來我們就要討論該如何降低IT運(yùn)維成本。
4 如何保障高可用性和降低IT運(yùn)維成本
(1)根據(jù)企業(yè)發(fā)展戰(zhàn)略,定制合理的運(yùn)維目標(biāo)和SLA。傳統(tǒng)IT運(yùn)維管理方式往往更注重IT技術(shù)指標(biāo),而這些指標(biāo)的提升是否對(duì)企業(yè)發(fā)展有利,卻無人問津。不同的運(yùn)維模式對(duì)成本的要求也不同,對(duì)能滿足的SLA也不盡相同。
所以,IT運(yùn)維必須從后臺(tái)走向前臺(tái),根據(jù)業(yè)務(wù)需求定制更明確的IT運(yùn)維目標(biāo)和技術(shù)指標(biāo),并以此來選擇更適合企業(yè)當(dāng)前階段的運(yùn)維模式,使運(yùn)維成本最大可能發(fā)揮作用。
(2)引入戴明質(zhì)量環(huán)質(zhì)量控制模型,推行流程標(biāo)準(zhǔn)化控制。人員操作失誤導(dǎo)致IT運(yùn)維故障的比例遠(yuǎn)遠(yuǎn)高于硬件故障造成的事故,約占全部事故的80%。推行操作流程標(biāo)準(zhǔn)化,引入戴明質(zhì)量環(huán),每個(gè)變更操作依照計(jì)劃—實(shí)施—檢查—改進(jìn)的步驟進(jìn)行。計(jì)劃階段則對(duì)變更操作每個(gè)步驟制定明確、詳細(xì)的執(zhí)行操作手冊(cè);
實(shí)施階段則嚴(yán)格依照?qǐng)?zhí)行操作手冊(cè)進(jìn)行變更;檢查階段則由非實(shí)施者對(duì)實(shí)施者的步驟進(jìn)行復(fù)核;改進(jìn)階段則是根據(jù)實(shí)施實(shí)際情況對(duì)計(jì)劃中制定的操作手冊(cè)進(jìn)行優(yōu)化、改進(jìn)。由這種方式來進(jìn)行變更操作控制,將由于人為操作失誤導(dǎo)致的隱形IT運(yùn)維成本降到最低。
(3)IT運(yùn)維規(guī)范化,減少運(yùn)維隨意性的浪費(fèi)。運(yùn)維管理包含人員、崗位、角色等信息,但如果這些信息沒有統(tǒng)一規(guī)劃,就無法進(jìn)行統(tǒng)一管理。標(biāo)準(zhǔn)化運(yùn)維流程是把運(yùn)維各種事情(包括人員,資源,突發(fā)事故)分成不同級(jí)別,規(guī)范運(yùn)維操作,以便有效的控制運(yùn)維成本。因此,對(duì)于企業(yè)而言,IT系統(tǒng)的規(guī)范化運(yùn)維是降低IT運(yùn)維成本支出的重要因素。
(4)建立知識(shí)庫平臺(tái),最大程度節(jié)省人力成本。知識(shí)庫平臺(tái)是指對(duì)IT運(yùn)維中的出現(xiàn)的故障事件和問題解答統(tǒng)一存放并建立對(duì)外問題查詢系統(tǒng)的平臺(tái)。用先通過該平臺(tái)尋找解決方法。如果問題沒有得到解決,則用戶在該平臺(tái)進(jìn)行問題申請(qǐng)維護(hù),運(yùn)維中心為用戶每次維護(hù)申請(qǐng)都將在該平臺(tái)中建立服務(wù)檔案,并一直實(shí)時(shí)監(jiān)控,直到問題得到圓滿的解決,成功解決的問
題自動(dòng)歸檔入知識(shí)庫,為之后的用戶提供自助服務(wù)。因此,知識(shí)庫平臺(tái)能幫助運(yùn)維人員節(jié)省大量的時(shí)間,從而節(jié)省人力成本支出。
(5)加大監(jiān)控力度,提高運(yùn)維反應(yīng)速度。之前闡述了來電響應(yīng)式運(yùn)維的不足之處,要化被動(dòng)為主動(dòng),首先要做的就是加大監(jiān)控力度。這里所說的監(jiān)控包括兩方面:一方面,對(duì)問題進(jìn)度跟蹤和監(jiān)控。需對(duì)問題處理狀態(tài)和時(shí)間進(jìn)行實(shí)時(shí)監(jiān)控,若發(fā)現(xiàn)無法及時(shí)解決該問題,應(yīng)立即升級(jí)或轉(zhuǎn)交問題至其他部門或二線,以防止問題惡化;另一方面是對(duì)IT系統(tǒng)的監(jiān)控,采用預(yù)警機(jī)制,在問題未發(fā)生前向相關(guān)運(yùn)維人員報(bào)警。同時(shí),要對(duì)監(jiān)控?cái)?shù)據(jù)進(jìn)行定期分析,找到問題的根源和影響運(yùn)維速度的因素,針對(duì)性地進(jìn)行改進(jìn),將救火式的被動(dòng)運(yùn)維改變成可控式的主動(dòng)運(yùn)維。
(6)IT運(yùn)維半自動(dòng)化,提高人力成本使用效率。IT運(yùn)維中有很多時(shí)間和精力要花費(fèi)在重復(fù)的事情上,若采用純?nèi)斯し绞降脑?需要大量IT運(yùn)維人員和時(shí)間來完成這些工作。但是,隨著IT技術(shù)的發(fā)展,已經(jīng)有很多自動(dòng)化工具誕生,可以幫助IT運(yùn)維將重復(fù)又簡(jiǎn)單的工作化繁為簡(jiǎn),將運(yùn)維人員從中解脫出來,從事更專業(yè)的運(yùn)維研究,形成良性循環(huán)。
(7)采用IT資源動(dòng)態(tài)共享化,降低固定資產(chǎn)成本??梢圆捎肐T資源動(dòng)態(tài)共享化,通過虛擬系統(tǒng)、共享存儲(chǔ)等方法來提高資源利用率,規(guī)避IT資源出現(xiàn)東邊不足,西邊過剩的情況。