一個(gè)大型的數(shù)據(jù)中心內(nèi)部往往都包含了很多小系統(tǒng),運(yùn)維工作都是圍繞著這些具體的應(yīng)用系統(tǒng)展開的,數(shù)據(jù)中心運(yùn)維管理系統(tǒng)具體的可以分為基礎(chǔ)運(yùn)維管理、日常業(yè)務(wù)運(yùn)維、網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、安全六大部分,本文就來說一說一般大型的數(shù)據(jù)中心應(yīng)該具備的哪些運(yùn)維方法和能力。
數(shù)據(jù)中心運(yùn)維管理系統(tǒng)是一款簡(jiǎn)單易用的數(shù)據(jù)中心日常運(yùn)維活動(dòng)的管理軟件。規(guī)范管理運(yùn)維團(tuán)隊(duì)以及服務(wù)流程,保障數(shù)據(jù)中心業(yè)務(wù)高可靠運(yùn)行,讓您徹底告別excel和紙質(zhì)工單的傳統(tǒng)管理方式,進(jìn)入電子化、規(guī)范化的運(yùn)維時(shí)代。
一、數(shù)據(jù)中心運(yùn)維管理系統(tǒng)的管理監(jiān)控對(duì)象
主要有硬件配置管理、可維護(hù)性優(yōu)化、監(jiān)控、報(bào)警處理、自動(dòng)化運(yùn)維、斷網(wǎng),斷電、機(jī)房容災(zāi)等運(yùn)維工作。
硬件配置管理包含機(jī)柜里每臺(tái)服務(wù)器的型號(hào)和硬件配置,并清楚是哪些業(yè)務(wù)系統(tǒng)在使用這些服務(wù)器。即便是虛擬化運(yùn)行環(huán)境,也需要知道這些虛機(jī)都在哪些物理機(jī)組成的資源池中流動(dòng)。
數(shù)據(jù)中心物理機(jī)和虛機(jī)數(shù)量都很龐大,使用自動(dòng)化運(yùn)維是非常有必要的。自動(dòng)化運(yùn)維不僅能提升運(yùn)維的工作效率,還可以減少人為的參與,同時(shí)讓數(shù)據(jù)中心自己管理自己,釋放人力。并對(duì)數(shù)據(jù)中心可能發(fā)生的故障還做好監(jiān)控與報(bào)警處理,以便能夠在故障發(fā)生的..時(shí)間知曉問題,往往一次大的故障都是從開始的一點(diǎn)小故障逐漸擴(kuò)展最終引發(fā)整個(gè)大系統(tǒng)的崩潰的,所以在出現(xiàn)一些小的異常時(shí)一定要及時(shí)消除,而這些異常就要靠監(jiān)控和報(bào)警系統(tǒng)來檢測(cè)。
二、數(shù)據(jù)中心運(yùn)維管理系統(tǒng)的日常業(yè)務(wù)運(yùn)維
主要有日常檢查、應(yīng)用變更、軟硬件升級(jí)、突發(fā)故障等。
日常檢查:“千里之堤,潰于蟻穴”。
任何的故障在出現(xiàn)之前都可能會(huì)有所表現(xiàn),小的隱患不消除,可能導(dǎo)致重大的故障出現(xiàn),所以數(shù)據(jù)中心日常的例行檢查工作枯燥,但也很重要,可以及時(shí)發(fā)現(xiàn)一些運(yùn)行中的隱患。
根據(jù)數(shù)據(jù)中心承載業(yè)務(wù)重要性的不同,要對(duì)數(shù)據(jù)中心里的所有運(yùn)行的設(shè)備進(jìn)行例行檢查。檢查服務(wù)器應(yīng)用服務(wù)是否正常,CPU內(nèi)存等利用率是否正常。對(duì)應(yīng)用業(yè)務(wù)進(jìn)行檢查,看業(yè)務(wù)運(yùn)行是否正常。還有對(duì)數(shù)據(jù)中心的機(jī)房環(huán)境也要進(jìn)行檢查,環(huán)境的溫度、濕度、灰塵是否合乎要求??照{(diào)、供電系統(tǒng)進(jìn)行運(yùn)行良好,設(shè)備運(yùn)行是否過熱,地板、天窗、消防、監(jiān)控都是檢查的部分??照{(diào)漏水、設(shè)備漏電都會(huì)對(duì)數(shù)據(jù)中心正常穩(wěn)定運(yùn)行產(chǎn)生危害,千萬不可大意。
三、數(shù)據(jù)中心運(yùn)維管理系統(tǒng)的應(yīng)用變更
數(shù)據(jù)中心承載的業(yè)務(wù)不會(huì)是一成不變的,隨著業(yè)務(wù)的多樣化和不斷發(fā)展,經(jīng)常要對(duì)業(yè)務(wù)進(jìn)行調(diào)整,包括服務(wù)器和網(wǎng)絡(luò)的設(shè)置。因此要對(duì)服務(wù)器和網(wǎng)絡(luò)設(shè)備操作很熟悉,主要需要掌握Linux服務(wù)器命令和網(wǎng)絡(luò)協(xié)議。要根據(jù)應(yīng)用的需要,及時(shí)準(zhǔn)確做出變更。
四、數(shù)據(jù)中心運(yùn)維管理系統(tǒng)的軟硬件升級(jí)
數(shù)據(jù)中心的設(shè)備一般運(yùn)行周期是五年,不斷地有設(shè)備需要逐漸淘汰進(jìn)行更換,也有一些設(shè)備因?yàn)榇嬖谲浖毕菪枰?jí),因此軟硬件升級(jí)也是維護(hù)工作的一部分。
軟硬件升級(jí)時(shí)需要做好回退機(jī)制,以防升級(jí)出現(xiàn)問題時(shí)無法回退,業(yè)務(wù)長(zhǎng)時(shí)間無法恢復(fù)。
未來,自研交換機(jī)還會(huì)更進(jìn)一步和服務(wù)器自動(dòng)化上線結(jié)合,提升服務(wù)器交付和管理效率。網(wǎng)絡(luò)可以說是包羅萬象,涉及太多的設(shè)備和協(xié)議、軟件層技術(shù),所以也需要不斷地學(xué)習(xí),加深對(duì)網(wǎng)絡(luò)技術(shù)的理解,這樣才能做好網(wǎng)絡(luò)運(yùn)維工作。
以上就是關(guān)于數(shù)據(jù)中心的介紹,感謝大家的閱讀,文章內(nèi)容來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系我們刪除
標(biāo)簽: