管理應(yīng)用的可用性和性能。
早期的識別和解決方式的關(guān)鍵是減少應(yīng)用問題的影響。通過正確的監(jiān)測,很多應(yīng)用問題可以在停機前被發(fā)現(xiàn)和解決。
最終用戶的體驗監(jiān)測是應(yīng)用監(jiān)測的重要部分。最終用戶的響應(yīng)時間應(yīng)該一直被測量,并與現(xiàn)有的服務(wù)等級協(xié)議比較,在問題變得嚴重之前,能幫助識別和解決性能變化趨勢。
現(xiàn)在我們可以采用先進的技術(shù)幫助組織捕獲,分析和回放完整地最終用戶會話。這樣的數(shù)據(jù)對于再現(xiàn)和診斷與應(yīng)用功能相關(guān)的問題而言是非常重要的。這些技術(shù)可以被用來分析電子商務(wù)和其他自助服務(wù)Web應(yīng)用的可用性問題。
除最終用戶的體驗數(shù)據(jù)外,資源利用情況和性能數(shù)據(jù)應(yīng)該根據(jù)應(yīng)用技術(shù)棧的層次進行采集,包括Web Server,應(yīng)用服務(wù)器,數(shù)據(jù)庫和網(wǎng)絡(luò)。這些數(shù)據(jù)可以在情況變得嚴重前提供有關(guān)問題的重要信息。例如,缺少一個索引導(dǎo)致的性能問題,只有在過量的表掃描時才能采集到特征數(shù)據(jù)。在對最終用戶產(chǎn)生嚴重影響之前,表掃描監(jiān)測應(yīng)該很早就可以發(fā)現(xiàn)這個問題。與此類似,Java應(yīng)用中的內(nèi)存泄露問題往往很長時間都不會被發(fā)現(xiàn),通過監(jiān)測內(nèi)存使用就可以在災(zāi)難之前發(fā)現(xiàn)這種問題。對相關(guān)組件(包括網(wǎng)絡(luò),操作系統(tǒng),應(yīng)用服務(wù)器,數(shù)據(jù)庫和應(yīng)用等)的細粒度監(jiān)測和報警,通常可以在停機前發(fā)現(xiàn)應(yīng)用的問題。
即使采用最好的,能夠盡早報警的系統(tǒng),有時應(yīng)用也會很快出現(xiàn)問題,導(dǎo)致嚴重的性能下降甚至停機。這時,公司才會切實感覺到銷售額的下降或成本的顯著上升。不幸的是,在這種情況下,診斷問題是很困難的。在當前的復(fù)雜應(yīng)用環(huán)境中,一個問題可能與很多變化的因素有關(guān)。下面是一些造成應(yīng)用響應(yīng)時間突然下降的可能原因:
更改應(yīng)用代碼后未經(jīng)優(yōu)化
未經(jīng)優(yōu)化的SQL語句
意外刪除的索引
意外的數(shù)據(jù)庫資源競爭
Java內(nèi)存泄露
Web服務(wù)器進程數(shù)量過多
網(wǎng)絡(luò)性能問題
識別像上面的這些困難問題可能需要多種IT技術(shù)。重要的是技術(shù)人員應(yīng)該方便地掌握恰當?shù)臄?shù)據(jù)以便快速縮小問題的可能性。技術(shù)人員應(yīng)該能夠快速察看應(yīng)用,應(yīng)用服務(wù)器,數(shù)據(jù)庫,Web服務(wù)器,操作系統(tǒng)和網(wǎng)絡(luò)的性能和資源特征,并可將這些數(shù)據(jù)與具體的交易響應(yīng)時間的下降相關(guān)聯(lián)進行綜合分析。擁有合適的工具以簡明的方式提供數(shù)據(jù)時快速解決問題的關(guān)鍵。
3.結(jié)論
商業(yè)組織必須不斷地適應(yīng)變化的市場環(huán)境。這給IT部門帶來很大壓力,必須保證公司的應(yīng)用系統(tǒng)可以支持全面的戰(zhàn)略方向。因此,將面對更為復(fù)雜的一個用環(huán)境。沒有正確的控制和管理,應(yīng)用環(huán)境的持續(xù)改變將導(dǎo)致糟糕的應(yīng)用性能和停機。對于一個組織來說,這些問題意味著銷售額和生產(chǎn)效率的大幅降低。Gartner估計任務(wù)關(guān)鍵應(yīng)用的每小時停機成本是42,000美元。而通過在應(yīng)用的整個生命周期(從開發(fā)到生產(chǎn))中采用嚴格的方法,可以避免大量的損失。采用適當?shù)墓ぞ?,謹慎地控制工作流程可以俄日大多?shù)IT部門節(jié)省巨額成本。
轉(zhuǎn)貼于:http://www.vanceur.cn