全球大量網站癱瘓近1小時 竟因為這家無名小公司

8日,包括《紐約時報》、《衛報》、Twitch、Reddit
和英國政府的主頁等全球多家網站出現了宕機情況,出現了「503」或者「連接失敗」的提示。

不僅包括了新聞、社交等類型,在地域上也覆蓋了美國、英國、北歐,持續了近1個小時後恢復。

據媒體報導,並沒有發現遭受黑客的痕跡,對於此次幾乎讓全球半個網際網路陷入癱瘓的原因,是由於一家雲服務商的軟體配置錯誤引起的。

全球大量網站癱瘓近1小時 竟因為這家無名小公司

據悉,這家位於舊金山的雲服務商Fastly為26個國家/地區提供內容交付網絡。

Fastly是一家來自美國的雲計算服務商,於2011年創辦、2019年上市,目前市值在60億美元左右,規模遠小於亞馬遜AWS等雲計算領域同行。

Fastly並沒有將所有網站的內容都託管在同一地點的伺服器上,而是在數十個地點都有雲基礎設施,從而使用戶可以從離他們最近的伺服器下載內容。

對於此次事故,Fastly的工程和基礎設施高級副總裁尼克·洛克威爾(Nick Rockwell)在其官網表示,是由於一個未知的軟體錯誤導致。

根據洛克威爾的說法,5月12日,公司進行了一項軟體部署工作,引入了一個在特定情況下可能由特定客戶配置而觸發的錯誤。

6月8日,一名客戶提出了一項有效的配置更改,其中就包括引發該錯誤的配置,而該錯誤最終導致85%的伺服器出現網絡返回錯誤。

而Fastly則在一分鍾內就檢測到了網絡中斷,開始迅速確定並糾正問題,禁用相關配置。經過49分鍾的努力,95%的網絡恢復正常運行。

安全公司Netscout的首席工程師Roland
Dobbins對此表示:這次中斷是CDN供應商太少導致的結果。他建議,每個大流量網站都應該有多個CDN供應商,以避免出現這種情況。

但是網站能做的選擇也很有限。

目前主導CDN業務的供應商只有3個——Cloudflare、Akamai和Fastly。其中任何一個出現問題,都會對整個網際網路產生重大影響。

不過非常有趣的是,可能經過了這次大事故後,人們意識到Fastly是多麼的重要,在6月8日下午4點收盤時,它的股價反而上升超過10%。

全球大量網站癱瘓近1小時 竟因為這家無名小公司

來源:遊民星空