國華電力早在許久之前就使用北塔網(wǎng)絡監(jiān)控產(chǎn)品,但由于當前國華電力信息中心的網(wǎng)絡管理系統(tǒng)呈分散狀態(tài),其范圍也非常有限,對網(wǎng)絡資源配置及網(wǎng)絡流量分布也無法進行有效監(jiān)控,同時,由于無法實現(xiàn)運維流程與事故報警的聯(lián)動,國華電力客戶的各項業(yè)務系統(tǒng)對計算機網(wǎng)絡和it基礎平臺的依賴性越來越高,對系統(tǒng)與網(wǎng)絡的可用性、可靠性和穩(wěn)定性也提出了更高的要求。因此,對全局的計算機及網(wǎng)絡系統(tǒng)進行高效、統(tǒng)一、集中的監(jiān)控和管理是保證國華電力客戶及各項業(yè)務系統(tǒng)正常運行的重要條件。 作為網(wǎng)絡管理員,必須有效地了解網(wǎng)絡中數(shù)據(jù)傳輸是否正常、服務器以及網(wǎng)絡設備是否過載運行、局域網(wǎng)內(nèi)部以及局域網(wǎng)與互聯(lián)網(wǎng)的連接是否正常、局域網(wǎng)是否受到非法者的攻擊、用戶之間的數(shù)據(jù)傳輸是否正常等等。由于網(wǎng)絡之間的數(shù)據(jù)傳輸?shù)牟煌该餍浴]有統(tǒng)一的網(wǎng)絡管理平臺、管理手段落后等問題,網(wǎng)絡管理人員很難及時準確的完成上述要求。 由于沒有網(wǎng)絡性能方面的管理工具,網(wǎng)管人員不能對網(wǎng)絡進行有效的調(diào)整和優(yōu)化。如果沒有一個有效而集中的工具進行管理和分析網(wǎng)絡的運行趨勢,找到隱藏的性能瓶頸,將難以保證網(wǎng)絡及各項業(yè)務應用的順利運行。 面對以上挑戰(zhàn),國華電力特別聯(lián)合中國領袖級的it綜合服務提供商華勝天成為其打造業(yè)務服務管理平臺。 解決方案 產(chǎn)品概述 摩卡業(yè)務服務管理(mochabusinessservicemanagement),簡稱mochabsm,整合了系統(tǒng)管理、監(jiān)控、服務、統(tǒng)計分析和門戶等多種技術,它是對itil的it服務管理核心流程的實現(xiàn),是一個實用、可擴展的技術解決方案。 mochabsm應用監(jiān)控也對oracle和lotusdomino的平臺系統(tǒng)提供可視化監(jiān)控、故障定位、統(tǒng)計報告等功能的組件。 產(chǎn)品主要具有以下功能: 提供面向“服務”的,整合網(wǎng)絡、主機、應用、服務等各層面it資源的、統(tǒng)一的it服務管理信息視圖; 自動的網(wǎng)絡拓撲可以從全局監(jiān)控整個網(wǎng)絡架構的健康狀態(tài),自定義的網(wǎng)絡拓撲可以清晰的按照邏輯結構定義拓撲子map,并且通過子map來快速定位網(wǎng)絡問題; 告知事件對企業(yè)影響的嚴重程度; 準確、快速地定位故障產(chǎn)生的根本原因; 提供統(tǒng)計報告和分析圖表,為領導層提供決策依據(jù)。 功能描述 在國華電力的項目中,我們實現(xiàn)了以下功能。 從業(yè)務視角管理it 國華電力的業(yè)務系統(tǒng)通常由以下四個組件組成: -網(wǎng)絡; -主機; -應用; -用戶; 當某個組件出現(xiàn)問題,問題就會反映在業(yè)務服務儀表盤上。用戶(包括業(yè)務部門)只關心提供給他們所使用的業(yè)務服務的狀態(tài)與性能,而不關心技術細節(jié)。 以用戶的身份感受it服務 國華電力信息化建設為遍布全國的二十多個電廠業(yè)務支撐體系提供了大量的業(yè)務系統(tǒng)。從用戶體驗的角度出發(fā),需嚴格審查業(yè)務系統(tǒng)的可用成都。通過模擬用戶行為,對業(yè)務支撐系統(tǒng)的業(yè)務流程進行監(jiān)測,并且從應用的層面監(jiān)控業(yè)務支撐系統(tǒng)的可用性。 三步走式的故障分析策略 國華電力目前針對全國二十個復雜度相對較高的電廠提供了業(yè)務支撐系統(tǒng),在出現(xiàn)異常情況時往往在初步的故障分析中就浪費了大量的時間,為此,國華電力信息管理中心提出了“三步走”式的監(jiān)控機制,當出現(xiàn)故障時通過圖形化的展示界面即可快速定位到故障點。 第一步:排除周邊影響因素。即當故障出現(xiàn)時首先通過自動監(jiān)控機制判斷該業(yè)務系統(tǒng)主機的網(wǎng)絡連接情況、業(yè)務系統(tǒng)首頁打開情況、web訪問的端口情況等,將網(wǎng)絡、主機、業(yè)務表現(xiàn)等三個因素綜合進行初步故障分析。 第二步:查清平臺級影響因素。即在周邊條件均正常時,通過自動監(jiān)控機制提供各個應用平臺級底層指標的性能負載及資源消耗情況。主要體現(xiàn)在一些中間件、數(shù)據(jù)庫、j2ee應用平臺等it資源中,從而實現(xiàn)業(yè)務應用平臺級的故障分析。 第三步:由于在國華電力業(yè)務支撐體系中存在大量自行開發(fā)的應用程序,對這些程序的執(zhí)行效率監(jiān)控就形成了故障分析的法寶,通過自動化的日志監(jiān)控機制將程序執(zhí)行過程中的異常拋出按照關鍵字以及日志級別等方式進行過濾,使運維人員不再因錯失日志而無法解決問題。 網(wǎng)絡設備監(jiān)控及拓撲展現(xiàn) 實現(xiàn)對骨干網(wǎng)絡的可用性和性能監(jiān)控,監(jiān)控范圍包含cisco、華為3com等90余臺設備。通過對網(wǎng)絡設備的監(jiān)控,管理員可以實時掌握設備的cpu利用率、內(nèi)存利用率、吞吐量等關鍵性能指標,以及設備的每個網(wǎng)絡接口的流量信息。 通過自動發(fā)現(xiàn)以及自定義的網(wǎng)絡拓撲圖,管理員可以實時的查看到全網(wǎng)所有網(wǎng)絡設備的當前狀態(tài)以及各骨干線路的流量情況。一旦某臺設備出現(xiàn)了問題,都會及時的通過狀態(tài)燈顏色的變化展現(xiàn)出來。 同時,為國華電力提供了分布全國二十個電廠的機房健康狀態(tài)監(jiān)控,以拓撲下鉆的機制,實現(xiàn)從面到點的監(jiān)控手段。 當出現(xiàn)網(wǎng)絡故障后,可以更直觀的以flash的方式將設備背板進行展現(xiàn),方便管理員的操作。 主機系統(tǒng)監(jiān)控 對全國范圍內(nèi)主要信息系統(tǒng)所在主機進行監(jiān)控,包括aix、suselinux、windows等150余臺設備,每臺主機均提供了vm可視化監(jiān)控方式。 應用環(huán)境健康狀態(tài)監(jiān)控 對全國范圍內(nèi)主要應用平臺進行監(jiān)控,包括domino、oracle、sybase、informix等在內(nèi)的200余套應用平臺。mochabsm集成了摩卡軟件十年系統(tǒng)管理、開發(fā)、維護經(jīng)驗,提供最具管理價值的指標,細化到每一個應用元素的監(jiān)控。其中,每一個domino平臺提供系統(tǒng)平臺級指標10余個、domino平臺級指標20余個、數(shù)據(jù)庫級指標30余個,可以代替管理員處理繁雜的日常維護和檢查工作,并且以自動化的方式將應用進行監(jiān)管,實現(xiàn)應用平臺級故障預警、性能預警、配置變更預警等功能。 it資產(chǎn)管理 實現(xiàn)了對國華電力大樓內(nèi)700余臺個人電腦、90余臺打印機等it資產(chǎn)的生命周期管理。管理員可以在線對資產(chǎn)進行查詢和管理,此外還提供對其他離線資產(chǎn)的監(jiān)管,例如掃描儀、ups電源、系統(tǒng)軟件、應用軟件等。系統(tǒng)提供按照時間、生命周期狀態(tài)、關鍵字等查詢后即刻生成報表,可以為管理員的采購計劃提供指導性數(shù)據(jù)。 資產(chǎn)管理還提供了設備服務到期提醒功能,當某臺設備的服務合同將要到期時,管理員可以接收到報警信息,通知管理人員及時簽訂新的服務合同。 針對該行業(yè)的特殊需求,通常設備在購進五年后即報廢,系統(tǒng)還可提供多種可定制的提醒功能,避免大量設備在送修或進入報廢階段不易管理等問題的出現(xiàn),從而提供人性化的定制和提醒功能。 流量分析 對網(wǎng)絡的核心設備進行流量監(jiān)控,可以清楚的了解到全網(wǎng)的流量情況。網(wǎng)絡管理者可以第一時間獲得用戶利用網(wǎng)絡和應用資源的詳細情況,進而高效地規(guī)劃和分配資源,保證網(wǎng)絡的暢通。幫助國華電力解決“到底是誰或者應用在使用網(wǎng)絡帶寬?什么樣的業(yè)務和應用占據(jù)了企業(yè)的大部分帶寬?到底是什么樣的網(wǎng)絡協(xié)議在網(wǎng)絡中運行?在什么樣的時段,企業(yè)的業(yè)務是處于最高峰的?整個網(wǎng)絡是否能承載現(xiàn)有的業(yè)務?如果網(wǎng)絡出現(xiàn)問題,到底是哪里出現(xiàn)了問題?什么樣的業(yè)務受到的危害最大?”等諸多問題,提升網(wǎng)管人員對網(wǎng)絡狀態(tài)的控制程度。下圖為應用資源占網(wǎng)絡流量最近1小時的排行情況: 配置變更管理 提供了主機、網(wǎng)絡設備、應用配置的變更管理。一旦it組件發(fā)生了配置變更,通過設定基線,管理員可以收到告警信息,并對每一項變更進行風險評估,以確保所有的配置變更都是在可控范圍之內(nèi)。 mochabsm配置變更事件全面記錄已經(jīng)發(fā)生的配置變更,用戶只需定制相應的事件視圖,即可按資源、時間段等條件過濾出所需查看的配置變更。資源狀態(tài)可將配置變更清晰的標明在每個資源名稱前,所有的配置變更盡收用戶眼底。同時,用戶可靈活定制接收配置變更報警的角色與人員,并可通過郵件、短信、語音(通過自動撥打用戶電話報警)、mochaalert(可即時接收mochabsm報警的桌面軟件,簡單易用并可設置接收報警的種類,報警音樂等,以幫助客戶快速響應)等多種報警方式,確保配置變更自動通知到所有相關人員。 除此之外,用戶還可對一組配置變更記錄打上基線,用來表示這組變更后達到了一個穩(wěn)定狀態(tài)或里程碑(例如,完成了某服務器的全面升級)。配置變更記錄不再是單純以時間做簡單排序,而是以基線為組織,使用戶可以更條理化的管理變更。 報警管理 -靈活的報警定義,滿足各種業(yè)務需求; -多種報警方式; -支持報警升級; -報表和報告管理; -可定制報表模板; -“所見即所得”的報告; -多種專家級的報告模板; -報表和報告訂閱; -it運維管理。 mochabsm的it運維管理是基于itil的流程框架,幫助國華電力從人員、技術和流程三個方 面提高了it運維能力,逐步建立并完善、達到以下目標: -標準化——通過itil的流程框架,構建最佳實踐經(jīng)驗的it運維流程; -流程化——把大部分的it運維工作流程化,確保這些工作都可重復,確保這些工作都能有質(zhì)量完成; -自動化——替企業(yè)有效無誤地完成一些日常工作,比如備份,殺毒等。 方案亮點 國華電力采用摩卡業(yè)務服務管理(mochabsm)產(chǎn)品作為it資源監(jiān)控的解決方案。該方案解決了客戶在實際工作中所面對的it服務問題,該系統(tǒng)主要亮點如下: -打破傳統(tǒng)監(jiān)控瓶頸,采用從業(yè)務入手的監(jiān)控機制; -從用戶的角度體驗it服務; -形成“三步走”式的故障分析機制; -實時監(jiān)控網(wǎng)絡設備、主機、應用等it資源的運行狀態(tài)、性能和可用性; -當監(jiān)測到系統(tǒng)故障時,可快速定位故障的主要原因,估算系統(tǒng)事件對業(yè)務的影響及其嚴重程度,并觸發(fā)相應的故障處理流程。mochabsm系統(tǒng)使組織能夠快速地、積極地響應客戶要求,獲得更高的客戶滿意度; -由于系統(tǒng)監(jiān)控與流程處理與it資產(chǎn)管理的整合,當監(jiān)控到資源出現(xiàn)硬件配置變更后可經(jīng)過管理員的手工復位同步到資產(chǎn)管理中。此外也可通過流程進行設備的申購、領用等同步到資產(chǎn)管理中,自動改變資產(chǎn)生命周期狀態(tài)。對于it資產(chǎn)的人性化定制提醒功能,可以在大量設備送修或維保即將到期或設備即將報廢時以多種方式對管理員進行提醒; -簡單操作的系統(tǒng)管理配置,方便地配置所監(jiān)控服務器的信息,應用數(shù)據(jù)可自動獲取; -通過門戶系統(tǒng)可以進行統(tǒng)一整合,實現(xiàn)單點登錄sso、統(tǒng)一授權和訪問控制、集成展現(xiàn)和個性化等功能,使系統(tǒng)各模塊之間實現(xiàn)無縫的協(xié)同工作,給it服務經(jīng)理、系統(tǒng)管理員、應用管理員等不同的用戶群體和角色提供了可視化的工作平臺; -提供了豐富的報表,提供了統(tǒng)計報告,提供了資源或指標走勢,用以輔助分析和決策,并可以通過日報、周報、月報等方式定期發(fā)送用戶所關注的資源歷史信息報告。 客戶受益 目前mochabsm系統(tǒng)已經(jīng)在中國青年報社正式上線使用,且運行穩(wěn)定,提高了網(wǎng)絡和應用系統(tǒng)的監(jiān)控維護水平。通過對mochabsm的實施和使用,獲得如下益處: -流量分析,確保網(wǎng)絡暢通,快速定位故障 -通過mochanta幫助企業(yè)分析網(wǎng)絡中的異常流量,快速定位網(wǎng)絡中出現(xiàn)的問題,實現(xiàn)高效運維,為網(wǎng)絡運維人員解決網(wǎng)絡慢和不穩(wěn)定的問題。 -從業(yè)務角度出發(fā),切實為用戶解決實際問題 -打破傳統(tǒng)網(wǎng)管軟件監(jiān)控方式,以全新的業(yè)務視角進行監(jiān)控,方便業(yè)務與維護人員快速定位問題, -梳理錯綜復雜的網(wǎng)絡與業(yè)務之間的關系,從根本解決it部門內(nèi)部責任矛盾,杜絕推諉的事件發(fā)生。 -24小時無人職守,不漏掉任何蛛絲馬跡 mochabsm通過網(wǎng)絡拓撲幫助用戶梳理網(wǎng)絡環(huán)境,準確掌握局域網(wǎng)和廣域網(wǎng)的互聯(lián)情況,當鏈路不通或者發(fā)生切換時,可迅速找出網(wǎng)絡中存在問題的網(wǎng)絡設備,觸發(fā)告警,并通過網(wǎng)絡拓撲圖展現(xiàn)。 -符合itu-x.733規(guī)范,靈活的告警策略,保證任何微小的事件不會被錯過,能夠及時通知網(wǎng)管員,對問題進行處理。 -提高管理員工作效率,減輕管理員工作壓力 mochabsm通過自動發(fā)現(xiàn)網(wǎng)絡設備,簡化網(wǎng)絡監(jiān)控部署工作量;基于策略的管理機制,幫助管理員快速部署網(wǎng)絡設備監(jiān)控;通過分析根本原因,幫助管理員快速定位故障根源。 -打破傳統(tǒng)的分工,it運維人員與業(yè)務人員聯(lián)系更加緊密,始終以保證業(yè)務的穩(wěn)定運行為目標,保障了業(yè)務的連續(xù)穩(wěn)定運轉(zhuǎn),為企業(yè)減少不必要的損失。 |
煤炭人網(wǎng)版權及免責聲明: 1.凡本網(wǎng)注明“來源:煤炭人網(wǎng)” 的所有作品,版權均屬于煤炭人網(wǎng),未經(jīng)本網(wǎng)授權,任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的,應在授權范圍 內(nèi)使用,并注明“來源:煤炭人網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關法律責任。 2.凡本網(wǎng)注明 “來源:XXX(非煤炭人網(wǎng))” 的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。 3.如因作品內(nèi)容、版權和其它問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。 |
上一篇:國內(nèi)火電檢修運用相控陣超聲檢測.. | 下一篇:燃煤鍋爐綜合技術需上臺階 |