1.業(yè)務(wù)背景
隨著IT技術(shù)發(fā)展的時(shí)代,用戶越來(lái)越倚重IT作為生產(chǎn)平臺(tái),各個(gè)新技術(shù)運(yùn)用使業(yè)務(wù)運(yùn)行更便捷的同時(shí),給業(yè)務(wù)IT系統(tǒng)的運(yùn)維部門帶來(lái)的巨大挑戰(zhàn)。IT系統(tǒng)涉及的設(shè)備種類繁多、IT服務(wù)水平遠(yuǎn)遠(yuǎn)跟不上設(shè)備規(guī)模的擴(kuò)大,運(yùn)維管理人員的日常維護(hù)和管理工作日漸繁重,工作壓力也急劇增加,直接關(guān)系到網(wǎng)絡(luò)或業(yè)務(wù)是否能夠正常運(yùn)行。
2.方案介紹
IT運(yùn)維管理系統(tǒng)是我國(guó)自主研發(fā)的跨平臺(tái)、跨廠商的IT基礎(chǔ)組件監(jiān)控平臺(tái),可以實(shí)現(xiàn)對(duì)路由器、交換機(jī)、防火墻、服務(wù)器、中間件、數(shù)據(jù)庫(kù)、存儲(chǔ)、虛擬化平臺(tái)等上千種產(chǎn)品的數(shù)十萬(wàn)關(guān)鍵指標(biāo)進(jìn)行深入監(jiān)控,并進(jìn)行集中統(tǒng)一的可視化管理,能夠有效預(yù)防問題的產(chǎn)生及快速幫助用戶定位故障,降低運(yùn)維成本。同時(shí)采用豐富的多維度報(bào)表為用戶決策提供數(shù)據(jù)支撐。
系統(tǒng)支持對(duì)IT基礎(chǔ)設(shè)施做性能監(jiān)控,通過部署系統(tǒng)后,會(huì)對(duì)整個(gè)IT基礎(chǔ)環(huán)境進(jìn)行深度掃描,將各類型應(yīng)用組件自動(dòng)發(fā)現(xiàn),并通過配置一些屬性如路徑、端口、URL等實(shí)現(xiàn)整體監(jiān)控,并將可監(jiān)測(cè)資源在管理面板中統(tǒng)一展示。
系統(tǒng)支持多種設(shè)備發(fā)現(xiàn)方式,通過SNMP或其他支持的協(xié)議發(fā)現(xiàn)并管理設(shè)備,能夠做到精細(xì)化管理和靈活化管理,可監(jiān)控每個(gè)CPU、內(nèi)存、接口等的使用率,可自定義指標(biāo)項(xiàng)是否采集、是否記錄、是否監(jiān)控,采集與記錄分開控制,協(xié)助運(yùn)維人員排查故障問題,協(xié)助審計(jì)人員完成審計(jì)工作。
3.系統(tǒng)設(shè)計(jì)
3.1系統(tǒng)架構(gòu)
3.2系統(tǒng)管理對(duì)象
系統(tǒng)管理對(duì)象:幾乎支持所有市面上常規(guī)的網(wǎng)絡(luò)設(shè)備和資源
3.3網(wǎng)絡(luò)設(shè)備管理
系統(tǒng)能夠?qū)Ψ蟂NMP標(biāo)準(zhǔn)協(xié)議的交換機(jī)、路由器、安全設(shè)備、負(fù)載均衡等網(wǎng)絡(luò)設(shè)備進(jìn)行監(jiān)控。網(wǎng)管系統(tǒng)內(nèi)置了豐富的模板,支持CPU利用率、MEM利用率、端口狀態(tài)能夠自動(dòng)發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備間的鏈路和網(wǎng)絡(luò)設(shè)備與計(jì)算機(jī)間的鏈路,能監(jiān)測(cè)鏈路的上行、下行帶寬利用率和速率、上行和下行的丟包率、錯(cuò)包率;鏈路連通狀況;并能在首頁(yè)模塊實(shí)時(shí)進(jìn)行TopN排序。
可以分類查看被管理設(shè)備的名稱、系統(tǒng)名稱、管理IP、MAC地址、管理的狀態(tài)、關(guān)鍵性、地域、管理人、特性、添加、刪除等,一目了然的掌握當(dāng)前設(shè)備的管理信息,同時(shí)支持設(shè)備指標(biāo)的批量配置和導(dǎo)出設(shè)備信息的功能。
過實(shí)時(shí)一覽網(wǎng)絡(luò)運(yùn)維人員可以及時(shí)的了解各個(gè)管理資源的實(shí)時(shí)信息。通過列表的形式把對(duì)應(yīng)的設(shè)備名稱對(duì)應(yīng)的IP地址、健康狀態(tài)、響應(yīng)時(shí)間、CPU、內(nèi)存、健康度、可用率、及查看接口等功能。并可直接導(dǎo)出EXCEL格式和資源配置。
支持的部分設(shè)備廠家如下:
監(jiān)控指標(biāo)
系統(tǒng)能對(duì)某用戶的核心業(yè)務(wù)系統(tǒng),包括運(yùn)行在各種設(shè)備進(jìn)行有效的監(jiān)控和管理,而且系統(tǒng)具有良好的可擴(kuò)展性,能方便的支持其他設(shè)備的管理,可以監(jiān)控到設(shè)備的詳細(xì)信息(名稱、管理IP、Mac地址、子網(wǎng)掩碼、管理狀態(tài)、管理方式、關(guān)鍵性、廠商、型號(hào)、操作系統(tǒng)、流量等),指標(biāo)(健康率、可用率、CPU狀態(tài)、MEM狀態(tài)、ICMP響應(yīng)時(shí)間等),及所承載的業(yè)務(wù)。
體驗(yàn)化背板
通過真實(shí)的設(shè)備背板圖可以對(duì)設(shè)備的各個(gè)端口進(jìn)行實(shí)時(shí)查看、打開和關(guān)閉等操作,當(dāng)單擊某個(gè)端口時(shí)則可以查看到該端口的基本信息、監(jiān)控指標(biāo)當(dāng)前值等信息。同時(shí),通過多指標(biāo)分析圖還可以直觀了解到某幾個(gè)指標(biāo)于不同時(shí)間段的對(duì)比分析情況。
接口管理
通過snmp協(xié)議,獲取接口狀態(tài),按照接口狀態(tài)將接口分為閑置和輪詢兩類模版,通過模版設(shè)置接口的指標(biāo)。接口指標(biāo)監(jiān)控主要為接口名稱、所屬VLAN、接口別名、MAC地址、連接設(shè)備、接口類型、容量、異常等級(jí)、接口狀態(tài)、接口輸入/輸出速率、輸入/輸出利用率、地域、模板、特性等。
3.4服務(wù)器管理
系統(tǒng)能夠支持監(jiān)控多種主流操作系統(tǒng),劃分Windows、Linux、Unix、等主流操作系統(tǒng),包括Windows2000/2003/2008的32位/64位(中英文各版本)、RedHatLinuxAS、AIX、Solaris、HP-UX等。服務(wù)器操作系統(tǒng)各種詳細(xì)信息,如文件系統(tǒng)信息、系統(tǒng)日志信息、系統(tǒng)版本信息;服務(wù)器運(yùn)行指標(biāo)包括多個(gè)CPU中每個(gè)CPU的實(shí)時(shí)負(fù)載情況;物理內(nèi)存、虛擬內(nèi)存及頁(yè)面文件的實(shí)時(shí)使用率;磁盤每個(gè)邏輯分區(qū)的分區(qū)容量;進(jìn)程運(yùn)行狀態(tài)等;網(wǎng)卡實(shí)時(shí)連接及流量、網(wǎng)絡(luò)端口的丟包率、利用率、發(fā)送速率等指標(biāo);安裝軟件的情況等自定義指標(biāo)項(xiàng):系統(tǒng)能夠支持通過自定義SNMPOID腳本,采集特殊的服務(wù)器特殊指標(biāo)項(xiàng)。
所支持的部分服務(wù)器品牌如下:
系統(tǒng)采用圖表方式實(shí)時(shí)顯示主機(jī)服務(wù)器的cpu利用率、cpu使用情況、內(nèi)存利用率、磁盤信息、進(jìn)程信息的情況。提供對(duì)當(dāng)前主機(jī)服務(wù)器性能的監(jiān)控,能夠根據(jù)當(dāng)前系統(tǒng)平臺(tái)的運(yùn)行情況,提供深入的性能分析。服務(wù)器操作系統(tǒng)運(yùn)行的監(jiān)控、分析。同時(shí)可以監(jiān)控服務(wù)器的已安裝的軟件、ICMP響應(yīng)時(shí)間、磁盤隊(duì)列、指定進(jìn)程、連接數(shù)等具體指標(biāo)。
硬件監(jiān)控
支持標(biāo)準(zhǔn)硬件管理接口IPMI,監(jiān)視服務(wù)器的物理健康特征,如溫度、電壓、風(fēng)扇工作狀態(tài)、電源狀態(tài)等;同時(shí)也支持惠普iLO等非通用硬件管理接口。
3.5應(yīng)用資源管理
應(yīng)用監(jiān)控包括:數(shù)據(jù)庫(kù)和中間件,如Mysql、Sqlserver、Oracle、Sybase、Weblogic、Websphere、Lotus、Tomcat、DB2、Apache、JBoss、Websphere MQ、Tuxedo、Informix、Exchange、IIS、TongWeb、Apusic、Nginx、Squid、Lvs、Resin、Redis、MongoDB、DM、KingbaseES、gbase、RabbitMQ等
支持常用企業(yè)級(jí)應(yīng)用,全面監(jiān)控管理可用性和性能等關(guān)鍵指標(biāo)
數(shù)據(jù)庫(kù)管理
對(duì)數(shù)據(jù)庫(kù)的管理是通過模擬監(jiān)視和性能指標(biāo)兩種方式進(jìn)行的。以監(jiān)視器的形式加載在平臺(tái)上的。在系統(tǒng)不斷地發(fā)展中,可以根據(jù)用戶的具體需求定制、動(dòng)態(tài)加載,保證數(shù)據(jù)庫(kù)的安全,優(yōu)化數(shù)據(jù)庫(kù)的性能。
所支持的部分?jǐn)?shù)據(jù)庫(kù)品牌如下:
全面智能的監(jiān)測(cè)各種主流數(shù)據(jù)庫(kù)及各種與數(shù)據(jù)庫(kù)應(yīng)用相關(guān)的服務(wù)。能對(duì)數(shù)據(jù)庫(kù)從應(yīng)用可用性、系統(tǒng)資源占用和數(shù)據(jù)庫(kù)性能指標(biāo)等多個(gè)方面提供全面的監(jiān)測(cè)管理策略,確保數(shù)據(jù)庫(kù)的運(yùn)行正常。
中間件管理
對(duì)中間件的管理是通過模擬監(jiān)視和性能指標(biāo)兩種方式進(jìn)行的。以監(jiān)視器的形式加載在平臺(tái)上
的。在系統(tǒng)不斷地發(fā)展中,可以根據(jù)用戶的具體需求定制、動(dòng)態(tài)加所支持的部分中間件品牌如下:
對(duì)中間件的管理是通過模擬監(jiān)視和性能指標(biāo)兩種方式進(jìn)行:實(shí)時(shí)監(jiān)控當(dāng)前中間件的連接響應(yīng)時(shí)間、監(jiān)聽器的管理模式,能夠在連接中間件出現(xiàn)問題時(shí)告警檢測(cè)。監(jiān)控中間件的響應(yīng)時(shí)間、請(qǐng)求數(shù)、傳輸速度、內(nèi)存總數(shù)、連接數(shù)等等諸多指標(biāo),并可直觀了解所在服務(wù)器的性能和使用情況。
3.6服務(wù)資源管理
通過展現(xiàn)當(dāng)前服務(wù)過程的響應(yīng)時(shí)間等性能數(shù)據(jù)情況,能夠整體直觀的了解當(dāng)前應(yīng)用狀況進(jìn)行實(shí)時(shí)監(jiān)控、分析、報(bào)警確保服務(wù)正常使用,并為用戶提供較高的用戶體驗(yàn)。
網(wǎng)頁(yè)服務(wù)
服務(wù)器管理系統(tǒng)可以很好的監(jiān)控http服務(wù)??梢员O(jiān)控到網(wǎng)頁(yè)服務(wù)的招標(biāo)參數(shù)進(jìn)行分析設(shè)置還好閾值后當(dāng)違反規(guī)則后可以產(chǎn)生告警通知到運(yùn)維人員。
3.7鏈路資源管理
鏈路頁(yè)面添加接口異常信息圖片,直觀查看到是哪個(gè)設(shè)備的接口影響到鏈路異常。同時(shí)在接口告警時(shí),異常描述信息也將明確影響哪個(gè)鏈路進(jìn)行了說明和提示。
綜合管理系統(tǒng)可以監(jiān)控鏈路資源,并根據(jù)鏈路資源的屬性設(shè)置閾值,判斷當(dāng)前鏈路狀態(tài)等,并通過告警的方式及時(shí)通知運(yùn)維管理人員。
3.8業(yè)務(wù)資源管理
網(wǎng)絡(luò)管理系統(tǒng)可以針對(duì)以用戶體驗(yàn)與滿意度、數(shù)據(jù)安全、服務(wù)水平等為出發(fā)點(diǎn),將若干個(gè)資源構(gòu)建在一起的業(yè)務(wù)系統(tǒng)進(jìn)行全面監(jiān)控。系統(tǒng)可以根據(jù)企業(yè)用戶真實(shí)的IT環(huán)境將業(yè)務(wù)系統(tǒng)以及承載這些業(yè)務(wù)的IT基礎(chǔ)設(shè)施合理構(gòu)建成一個(gè)真實(shí)的業(yè)務(wù)模型,并通過對(duì)業(yè)務(wù)系統(tǒng)的下屬資源、系統(tǒng)API、用戶模擬進(jìn)行三維視角的立體化監(jiān)控與分析。
支持的部分業(yè)務(wù):
系統(tǒng)所展現(xiàn)的各種信息和數(shù)據(jù)組合構(gòu)建成各個(gè)符合個(gè)人所關(guān)注的業(yè)務(wù)管理信息,通過MTBF和MTTR能夠更清晰更直接的了解該業(yè)務(wù)系統(tǒng)的系統(tǒng)性能。任何一個(gè)業(yè)務(wù)系統(tǒng)中的細(xì)小變化和端倪,都能通過系統(tǒng)及時(shí)組合成各種直觀的性能數(shù)據(jù),真正幫助您實(shí)現(xiàn)從整體到局部,從宏觀到微觀的全面運(yùn)維!掌握整體網(wǎng)絡(luò)運(yùn)行狀況,將最復(fù)雜的網(wǎng)絡(luò)狀況以最簡(jiǎn)明、直觀的方式呈現(xiàn)。