是否太脆弱? 罗渣士一个错误摧毁了网络核心
羅渣士高管在斷網聽證會上表示,一個編碼錯誤摧毀了公司網絡的「大腦」。星報資料圖
羅渣士通信公司(Rogers Communications)高管周一在眾議院工業委員會的聽證會上,向國會議員們詳細介紹了7月初大斷網當天出現的混亂情況,稱這一「真正前所未有的事件」摧毀了公司網絡的「大腦」。
//
據《星報》報道,上周獲任命的羅渣士新首席技術官麥肯齊(Ron McKenzie)表示,是一個編程錯誤引發了廣泛的網絡故障,令數百萬加拿大人的服務中斷超過15小時,包括無法撥打911。這個錯誤在本質上影響了支持所有無線、有線、內部通訊和連接的網絡大腦,導致「連接完全失去」。
麥肯齊說,當時公司正在對網絡進行持續數周的7個階段維護升級,編程錯誤是在第6階段出現,而網絡中斷從7月8日接近凌晨5時開始。他透露,維護升級在前5個階段都沒有問題。
行政總裁斯塔菲里(Tony Staffieri)說,在中斷發生的最初幾個小時中,羅渣士的工作人員自己無法溝通,因而導致他們的反應以及與公眾和政府的溝通被延遲。斷網發生後,公司主要專注於兩個問題,一是確定是否受到網絡攻擊,二是何時能夠恢復網絡服務。
當被一位國會議員問及是何時向魁省省長通報斷網情況時,斯塔菲里回應說,「回想起來,我很遺憾我們沒能更早地溝通。不過這是有原因的,因為我們當時正專注於解決方案,讓我們的服務能夠恢復。但儘管如此,對於像政府這樣的重要利益相關者來說,這些溝通應該更早發生。」
斯塔菲里說,由於當時是核心網絡出現故障,羅渣士無法關閉其無線電網絡,這本可以讓其客戶自動連接到另一家運營商網絡上的911服務。他指出,如果羅渣士關閉其無線電網絡,則可能會將整個斷網時間再延長一天。
斯塔菲里還透露,儘管當時競爭對手貝爾(Bell)和研科(Telus)表示願意提供幫助,但羅渣士無法將流量轉移到他們的網絡,因為這些網絡無法處理超過 1,000萬客戶的額外流量。
在聽證會上,斯塔菲里表示,羅渣士現在計劃將無線網絡和互聯網網絡在物理上分離,以確保未來有更多的冗餘。未來如果網絡的某一部分出現故障,公司可以將流量轉移到另一部分。他指出,「儘管增加這層額外的保護成本高昂,估計將花費至少2.5億元,但我們知道這是正確的做法。」
聯邦創新部長商鵬飛(Francois-PhilippeChampagne)及加拿大電台電視暨電訊委員會(CRTC)主席斯科特(Ian Scott)周一也出席了聽證會。
2年前