誰都希望我們所做的項目能夠一帆風(fēng)順地完成,但還多時候,現(xiàn)實往往不像我們期待的那樣完美。在軟件工程實施的過程中,我們的團隊除了會遇到軟件工程技術(shù)方面的問題還會遇到很多跨學(xué)科的問題,如:團隊建設(shè)的問題,如何提高團隊績效?干系人的問題,如何獲得客戶的理解,我們又是否已經(jīng)理解我們的客戶?如何控制我們的工作范圍的問題?如何控制我們的成本的問題等等。我們也許正是經(jīng)歷坎坷、挑戰(zhàn)、甚至意外后才得以歷練與成長。下面根據(jù)我個人的項目經(jīng)歷,談?wù)勛约旱?/span>看法。
1、暗藏風(fēng)險的開局
作為A市政府十二項惠民工程之一,“E-Study”是本年度A市為促進教育資源共享最為重要的一個信息化實施項目,投資規(guī)模近2億元。我司教育事業(yè)部有幸參與項目的前期設(shè)計中,承擔(dān)了整個系統(tǒng)軟件平臺的搭建工作。由于項目龐大,總共有十家分包商,此前,主管單位也沒有做過類似規(guī)模的項目。并且,該項目是當(dāng)年預(yù)算、當(dāng)年審批、當(dāng)年收效的項目,整體回顧起來項目中的很大決策從現(xiàn)在看來均顯得倉促,在立項階段,很多工作做的不夠扎實,前期的調(diào)研,可行研究工作等做的不夠充分。
2、泰山壓頂?shù)木置?/span>
由于本項目是一個面向公網(wǎng)的公共系統(tǒng),最終用戶又是整個A市的中小學(xué)生,因此系統(tǒng)崩潰后,項目組面臨的巨大壓力,盡管教委下發(fā)的只是修改密碼的任務(wù),但社會上傳出了很不好的聲音。教委的座機幾乎被打爆了,每個人都能感受到學(xué)生和家長的抱怨,甚至惱怒。我司高層領(lǐng)導(dǎo)緊急抽調(diào)精干力量及時趕赴現(xiàn)場,制定排查計劃,開展問題的排查工作。
3、突入起來的危機
經(jīng)過大半年的努力,9月項目一期交付上線。但部分硬件還沒到位,只好協(xié)調(diào)市委其他硬件。另一方面,客戶對全市中小學(xué)前期宣傳不多,系統(tǒng)自9月到10月試用期間一直運行穩(wěn)定,每天5承載千人的訪問量。11月硬件到位,二期上線,就在上線前2小時,項目組得到客戶發(fā)出的一條重要信息:市委已下發(fā)文全市中小學(xué),要求在本周登陸系統(tǒng),完成用戶初始密碼修改任務(wù)。這個消息意味著系統(tǒng)將面臨100萬的數(shù)據(jù)訪問高峰,無疑為2小時后的系統(tǒng)埋下一顆“定時炸彈”。時間一分分過去,整個項目組異常緊張,晚上6點訪問量陡然上升到80萬,系統(tǒng)崩潰了!
4、一波三折的排查
系統(tǒng)出現(xiàn)問題項目組先后對項目架構(gòu)進行調(diào)整,并逐一解決代碼上的問題。但即使是架構(gòu)調(diào)整以后,問題依然沒有得到解決,通過進一步的排查發(fā)現(xiàn),當(dāng)時客戶采購的硬件存在著一定的問題。通過客戶向硬件廠商的實壓,IBM、EMC也指定了服務(wù)人員來到現(xiàn)場予以排查,經(jīng)進一步排查,一臺IBM小型機的內(nèi)存確實存在問題,但是該問題排除之后,系統(tǒng)還是有問題,通過日志分析發(fā)現(xiàn)存儲也可能存在問題,現(xiàn)場服務(wù)文員也不停向美國總部反映情況,但依然找不到原因,最后,通過逐一試錯的方式,發(fā)現(xiàn)來連接存儲的光纖似乎不夠穩(wěn)定,更換光纖后,問題成功解決,其原因主要是在項目的一個分包商在采購時為了節(jié)約成本使用了低價劣質(zhì)光纖。
5、患難與共的信任
盡管這次意外的發(fā)生,在一定程度上,為客戶和最終用戶帶來了諸多不便,但我司清晰的處理危機的方案和態(tài)度給客戶留下了非常深刻的印象。領(lǐng)導(dǎo)層保持與客戶的良好溝通和交流,并在事故后項教委高層進行了匯報,還順勢將新的信息化規(guī)劃介紹給客戶,獲得了客戶極大的認可,將一次不利的危機轉(zhuǎn)換為新的合作契機。由于我司在危機中表現(xiàn)的與客戶患難與共的積極姿態(tài),客戶講我司列為市教育信息化建設(shè)的頂級合作商。
6、危機過后的反思
反思整個項目,由于整合多大十幾
個廠商的接口與軟件架構(gòu)難度較大,同時,前期準備倉促,在硬件規(guī)劃,審查等方面,沒有一個良好的機制進行督查,也導(dǎo)致了后期問題的發(fā)生。盡管在各方的共同努力下我們度過了這次危機,但此次教訓(xùn)足以為我們身邊每個進行中的項目敲響了警鐘,只有充分關(guān)注項目中的其他廠商,以客戶為中心,建立良好的監(jiān)督機制,并切實加強與客戶接口部門的溝通,積極關(guān)注測試中的每一個細節(jié),才能做大程度的避免將來可能發(fā)生的潛在危機。
此外,在與教委信息中心的溝通方面,指導(dǎo)系統(tǒng)快要上線的時候,項目組才獲知即將面臨的訪問高峰,此時已經(jīng)基本上沒有反應(yīng)時間。在技術(shù)細節(jié)上,雖然客戶所采購的存儲器屬于相對高端的設(shè)備,但在交付前的測試階段,項目組還是發(fā)現(xiàn)數(shù)據(jù)不能達到很到的交互量的問題,由于當(dāng)時客戶方認為問題不大,項目組也就沒有在系統(tǒng)上線前予以徹底排查。