server

歲末年終,網站工程師在忙些什麼?

身為網站代管公司的網管工程師,我們深知長假期間為客戶做好主機維護的重要性,雖然今年度春節假期比往年稍短,但我們依然戒慎恐懼,啟動長假前的例行檢測作業,確保客戶的「網路黃金店面」都能於新春期間,天天業績強強滾。

由於檢測作業流程繁雜,也涉及一些不能說的祕密(意指我們內部的網站管理流程!),以下我們僅以條列方式,與大家分享我們的相關作業:

一、機房硬體及主機設備檢測:

1. 首先,我們會至機房進行總體盤點,確認機房的主機數量、運行狀態與系統所記錄的資訊是同步的。資訊正確性的重要性在於:因為記錄錯誤,導致機房操作人員判斷錯誤而導致資安事故,若能做好資訊的同步及確認,將有助於降低人為疏失的風險。

2. 緊接著,我們會前往各個機房巡視、檢查各伺服器及網路設備是否運作順暢,觀看燈號,以確認各項硬體設備皆在正常運作的狀態中。由於我們並無法預知設備何時發生異常,但經由燈號的警示可以讓我們及早進行故障排除,確保主機運行一切 Okay!

3. 工欲善其事,必先利其器!當我們前往機房時,也會隨身攜帶檢測工具及硬碟等零件,事先做好備料,並提早放置於機房。這也會有助於我們於年節期間碰到必須至機房解決問題時,可更快速的更換零件。

4. 最後一個步驟是,我們將於公司內部備妥 Firewall 、 Switch 、 Server 等備援機(包含復原流程文件),若遇到需更換整台設備時,可有效地降低故障排除的時間。

二、作業系統檢測:

1. 確認 Firewall、Switch 的設定檔有無完整備份。因為當我們碰到網路設備必須立即更換時,原主機內的所有設定都必須在最短的時間內復原,倘若我們手邊已經備妥備份設定檔,將可直接將其安裝在新的設備中,為客戶排除網站當機的風險。

2. 延續備份之重要性,我們也會進一步著手確認各主機的備份資料是否完整,確保若發生非預期的資料毀損時,備份檔案可以直接被複製於備援機中,,確保客戶重要的運營資料安全無虞。資料流失。

3. 確認監控系統的設定一切正常。長假期間,內部每位值班工程師皆會收到監控簡訊,以進行最佳的應變作業。

4. 調整公司客服中心電話進線流程,確保客戶於春節期間能快速地聯繫值班團隊。

上述的準備事項、確認重點,全部都是為了在過年期間讓主機可以正常運作,即便發生了不可預期的狀況,也能讓我們用最快的時間恢復正常。我們明白春節假期不僅是親戚朋友團聚的時機,也是電子商務活動活絡的時期,讓網站不因假期而停擺,也是我們工程師的使命感!做好這些長假前的確認工作,讓我們自己安心,也讓各位網路頭家放心!

 

作者:Ruffy Hsu

圖片來源:ColossusCloud/pixabay

發表迴響