2024年12月,為了周期性驗(yàn)證多套核心業(yè)務(wù)系統(tǒng)的容災(zāi)系統(tǒng)的可用性,確保生產(chǎn)端與災(zāi)備端兩端數(shù)據(jù)一致、災(zāi)備數(shù)據(jù)可用,該央企協(xié)同美創(chuàng)專家團(tuán)隊(duì)成立了演練領(lǐng)導(dǎo)和執(zhí)行小組,計(jì)劃通過(guò)模擬相關(guān)核心業(yè)務(wù)系統(tǒng)故障,分階段對(duì)多套系統(tǒng)進(jìn)行異地桌面演練及容災(zāi)演練,以驗(yàn)證生產(chǎn)系統(tǒng)可向?yàn)?zāi)備中心的備用系統(tǒng)進(jìn)行有效切換,要求RPO=0,RTO≤30分鐘。
以智能生產(chǎn)運(yùn)維系統(tǒng)從上海到異地災(zāi)備節(jié)點(diǎn)的容災(zāi)切換為例。演練于12月26日22:01:30開(kāi)始,首先采用美創(chuàng)新一代 災(zāi)備一體化平臺(tái)(DRCC)(點(diǎn)擊了解)進(jìn)行快速自動(dòng)化預(yù)案評(píng)估,演練執(zhí)行小組執(zhí)行一鍵啟動(dòng)智能生產(chǎn)運(yùn)維系統(tǒng)的主備切換,在充分保障備份任務(wù)完成和人工節(jié)點(diǎn)驗(yàn)證通過(guò)情況下,包括數(shù)據(jù)庫(kù)、應(yīng)用、NAS、中間件等各類資產(chǎn)節(jié)點(diǎn)均按照既定的演練預(yù)案完成切換,總耗時(shí)2分54秒。備端業(yè)務(wù)系統(tǒng)經(jīng)過(guò)近1個(gè)小時(shí)的試運(yùn)行后,成功驗(yàn)證備節(jié)點(diǎn)數(shù)據(jù)零丟失,容災(zāi)效果滿足業(yè)務(wù)運(yùn)行需求。
圖:實(shí)時(shí)跟蹤切換過(guò)程
備節(jié)點(diǎn)驗(yàn)證切換有效后,演練執(zhí)行小組利用DRCC自動(dòng)生成的回切鏈路,一鍵完成異地災(zāi)備機(jī)房的智能生產(chǎn)運(yùn)維業(yè)務(wù)回遷至上海本地?cái)?shù)據(jù)中心,業(yè)務(wù)正常運(yùn)行,共耗時(shí)2分56秒,完全滿足RPO和RTO預(yù)期。
此次容災(zāi)演練全面檢驗(yàn)了容災(zāi)備份系統(tǒng)的有效性。同時(shí),美創(chuàng)還協(xié)助該央企對(duì)演練中出現(xiàn)的問(wèn)題進(jìn)行了深入的總結(jié)與復(fù)盤分析,并針對(duì)性地提出了優(yōu)化措施。通過(guò)這一過(guò)程,該央企的災(zāi)難應(yīng)對(duì)能力和數(shù)據(jù)保護(hù)機(jī)制得到了實(shí)質(zhì)性的增強(qiáng),為未來(lái)可能面臨的突發(fā)情況打下了堅(jiān)實(shí)的基礎(chǔ)。