全球互聯(lián)網服務在近日經歷了一場罕見的大規(guī)模中斷,多個知名網站和在線平臺集體陷入癱瘓狀態(tài)。這場由內容分發(fā)網絡服務商Cloudflare引發(fā)的故障,導致全球用戶無法正常訪問推特、ChatGPT、Canva等熱門服務,甚至連游戲服務器也受到影響,引發(fā)網友集體吐槽。
事件起因于Cloudflare數(shù)據庫權限配置出現(xiàn)異常。據技術分析,工程師在調整數(shù)據庫權限時,意外將原本指向中央索引節(jié)點的查詢請求,改成了向所有分片節(jié)點廣播的全局請求。這一改動導致多個數(shù)據庫分片同時響應,原本60條特征數(shù)據被重復疊加至數(shù)百條,超出系統(tǒng)設定的200條上限閾值,最終觸發(fā)服務崩潰。
故障呈現(xiàn)間歇性特征,部分用戶發(fā)現(xiàn)服務時斷時續(xù)。這種"仰臥起坐"式的異常狀態(tài)持續(xù)近6小時,源于Cloudflare采用的分批次更新機制——不同區(qū)域的數(shù)據庫節(jié)點處于不同版本狀態(tài),導致每次查詢都像在"開盲盒"。技術人員最初誤判為分布式拒絕服務攻擊,甚至發(fā)現(xiàn)自身狀態(tài)頁面也出現(xiàn)異常,進一步加劇了排查難度。
全球網友在社交媒體展開花樣吐槽。有用戶戲稱"Cloudflare打個噴嚏,全世界互聯(lián)網集體感冒",更有技術宅用漢堡點餐機類比:"這相當于全美漢堡店突然集體斷網"。最戲劇性的是,某網友偽造的新員工"首日操作導致全球崩潰"的推文獲得60萬次瀏覽,雖為惡搞卻折射出公眾對基礎設施穩(wěn)定性的焦慮。
作為支撐全球10%網站流量的基礎設施服務商,Cloudflare的崩潰暴露出互聯(lián)網架構的脆弱性。其CDN網絡覆蓋330多個數(shù)據中心,為網站提供安全防護、流量加速等服務。此次事故直接影響依賴其服務的電商平臺、新聞媒體、在線教育等眾多領域,部分企業(yè)因業(yè)務中斷遭受直接經濟損失。
技術團隊最終通過回滾配置文件版本解決問題,并在官方報告中承認存在設計缺陷。類似事件并非首次發(fā)生,上月AWS云服務宕機就曾導致全球1700萬用戶受影響。隨著互聯(lián)網深度融入社會運行,如何構建更具韌性的數(shù)字基礎設施,已成為全行業(yè)亟待解決的課題。
















