logo

CDN 故障影響 Discord、巴哈姆特
為什麼弈樂科技仍能正常運作?

yile

在大規模的 CDN 及網路線路故障下 仍能正常運作

2021 年 8 月 23 日與 8 月 24 日,連兩日知名 CDN Cloudflare 與台灣主要網路線路 Hinet 在台灣皆發生大規模的故障事件Discord 與知名電玩網站巴哈姆特都受到影響,弈樂科技在使用Mlytics 平台下,透過融合 CDN 的架構,服務完全沒有中斷。

圖為 Cloudflare 官方發佈的故障事件資訊

確保良好 App 使用者體驗的關鍵是穩定的傳輸品質

弈樂科技是一間專注於研發、營運行銷遊戲的團隊,主要服務為 App 遊戲研發、營運發行與行銷推廣。目前的主要業務地區為台灣,也積極拓展東南亞與歐美等地,致力於將產品帶向全球化。

良好的 App 使用者體驗對他們來說非常重要,因此,他們相當重視穩定的傳輸品質。考量到主要的客群在台灣,目前,弈樂科技是透過國內的線路或是 CDN 來傳輸。

然而他們聽聞 CDN 無預警故障而造成的「災情」,為了預防不可控制的突發事件影響使用者體驗,他們開始積極尋找備用線路解決方案,以確保服務不中斷,提供最接近完美的體驗品質。

CDN 故障一再發生 影響 App 服務品質

弈樂科技的使用場景,是大多數台灣企業的使用情況,終端用戶只有台灣區域,傳統實體機房作法是拉兩條線路互為備援,但仍然有實體線路的物理限制。而雲服務的快速部署與高彈性設計的特性,深受遊戲產業的喜愛,近年來陸續都將服務移往雲端。

雖然各家 CDN 服務供應商,都宣告有99.9%以上的 SLA,但不代表服務不會發生問題,即使如 Akamai、Fastly 這樣全球知名的 CDN 服務商,一旦發生故障事件,影響層面都是大規模的。像是 Akamai 在今年 7 月即發生嚴重的故障事件,導致 Fedex、達美航空及麥當勞等知名企業受到嚴重影響。更早的 6 月,Fastly 同樣發生故障事件,讓其用戶 Spotify、Netflix 等以 App 及 WebApp 為主要產品的企業大受影響。

如何建立高可用性(High Availability)的雲服務架構才能面對突發的故障事件?事實上在兩個不同的雲供應商部署跨雲的高可用性架構是不容易的,必須考慮到:

  1. 成本,包含建置成本、運維成本
  2. 資料同步
  3. 切換的流程與切換過度時間對業務的衝擊

弈樂科技到底是如何躲過 CDN 故障的影響?

在今年 8 月在 Cloudflare 與 Hinet 發生問題的當下,弈樂科技關閉 Mlytics 平台上的 Cloudflare 與 Hinet 線路,透過其他 CDN 依然能夠正常提供服務給終端用戶,整個切換時間不到五分鐘就完成,終端用戶完全沒有產生客訴。

在 Mlytics 可以透過一個介面管理多家 CDN

Mlytics 可以讓企業一站輕鬆完成佈署與管理多家 CDN,即完成建立線路的高可用性架構。完成佈署後,只需要將服務在 DNS 設定作 CNAME 即可,整套建置時間不過一個小時。企業不需要與多家 CDN 服務供應商簽約,而 Mlytics 有全自動的智能調度,可以直接幫企業無痛在各家 CDN 線路做切換,不需要額外人力操作,而 Mlytics 同時提供 7*24 小時的線上 SOC 團隊技術支援,讓企業在面臨緊急故障事件也能從容應對。