微軟Azure云的用戶發(fā)現(xiàn)在周二的大規(guī)模故障中丟失了數(shù)據(jù)庫(kù)記錄。報(bào)告稱,DNS故障和自動(dòng)腳本兩者正是事故的罪魁禍?zhǔn)住?
微軟在Azure中刪除了幾個(gè)透明數(shù)據(jù)加密(TDE,TransparentDataEncryption)的AzureSQL數(shù)據(jù)庫(kù),其中包含客戶的實(shí)時(shí)信息。TDE數(shù)據(jù)庫(kù)會(huì)動(dòng)態(tài)加密它們存儲(chǔ)的信息,并在客戶訪問時(shí)對(duì)其進(jìn)行解密。
雖然加密這些表有不同的方法,但許多Azure用戶將自己的加密密鑰存儲(chǔ)在微軟的KeyVault加密密鑰管理系統(tǒng)中,這個(gè)過(guò)程稱為自帶密鑰(BYOK,BringYourOwnKey)。
據(jù)微軟在一封發(fā)給客戶的信函中解釋說(shuō),這些刪除操作是自動(dòng)執(zhí)行的,由一個(gè)腳本觸發(fā),原因在于該腳本在密鑰保險(xiǎn)庫(kù)中無(wú)法再訪問相應(yīng)的密鑰時(shí)會(huì)刪除TDE數(shù)據(jù)庫(kù)表。
意外刪庫(kù)后,微軟不得不利用5分鐘前的快照備份恢復(fù)了客戶數(shù)據(jù),但這意味著5分鐘內(nèi)客戶的交易事務(wù)、產(chǎn)品訂單以及對(duì)數(shù)據(jù)存儲(chǔ)系統(tǒng)的其他更新統(tǒng)統(tǒng)丟失,需要手動(dòng)進(jìn)行處理。在這種情況下,客戶提出必須要微軟提供支持的工單,并要求將數(shù)據(jù)庫(kù)副本重命名為原始數(shù)據(jù)庫(kù)。
微軟則一直在竭力解釋:“如果TDE加密的SQL數(shù)據(jù)庫(kù)因無(wú)法繞過(guò)防火墻而訪問不了密鑰保險(xiǎn)柜,數(shù)據(jù)庫(kù)將在24小時(shí)內(nèi)被刪除。”
作為補(bǔ)償,微軟表示會(huì)免費(fèi)提供數(shù)月的數(shù)據(jù)庫(kù)服務(wù):
那為什么會(huì)出現(xiàn)「刪庫(kù)」事故呢?答案源于本周微軟及其Azure客戶面臨的更大問題。周二,全球的云服務(wù)遭到破壞,引發(fā)了一系列問題。其中包括間歇性訪問Office365失敗,Azure云資源的調(diào)度使用也下降了。
根據(jù)微軟當(dāng)時(shí)的Azure狀態(tài)頁(yè)面,這個(gè)問題反過(guò)來(lái)又歸結(jié)為DNS中斷故障:
報(bào)告顯示,此次DNS故障來(lái)自CenturyLink,后者為微軟提供DNS服務(wù)。該公司在一份聲明中說(shuō),當(dāng)天遭遇了軟件缺陷。這表明當(dāng)基于云的系統(tǒng)互連并且足夠自動(dòng)化以允許級(jí)聯(lián)故障時(shí)可能會(huì)出現(xiàn)問題。由于缺乏人工干預(yù),DNS供應(yīng)商的軟件缺陷間接導(dǎo)致了客戶實(shí)時(shí)信息的刪除。
CenturyLink最近似乎遇到了串行DNS問題。該公司在2017年底完成了以340億美元收購(gòu)大型網(wǎng)絡(luò)運(yùn)營(yíng)商Level3的計(jì)劃,該公司還在12月遭遇了DNS中斷事故,據(jù)報(bào)道,該中斷影響了緊急服務(wù),引發(fā)了聯(lián)邦通信委員會(huì)的調(diào)查。
(
邯鄲網(wǎng)站建設(shè))