作為工程師你有「手滑」釀禍過嗎?降低出錯率比追求好技術更重要
作為工程師你有「手滑」釀禍過嗎?降低出錯率比追求好技術更重要

編按:2022.3.15更新
今日傳出公視新聞片庫傳出資料遺失的消息,包含公視新聞部、客家電視台5年來42萬多筆的新聞資料,例如4大公投案等珍貴畫面,都遭外包資訊廠商誤刪。公視表示,目前仍有8萬筆遺失。

這樣的事件會造成重大的損失,背後錯誤也很難只歸咎於「手滑」。本文是RUBY大叔的專欄,從過去的誤刪學習檔案事件,談到各方該如何避免這樣的情況發生。

上月發生118所高中「學習歷程檔案」被工程師手滑誤刪的重大事故,一時間在科技圈造成熱議,有人檢討發包單位及外包廠商,也有人認為是工程師、政府採購法問題。追根究底,「工程師手滑」可能只是整起事件的冰山一角,今天RUBY大叔要跟大家聊聊這件事。

有備份為何還是救不回?

這次學習歷程檔案被刪,關鍵在於工程師「VM設定錯誤」,VM指的是虛擬機器(Virtual Machine),可以想像成是另一個測試用的環境,雖然環境及功能都一樣,但它是「虛擬」的,無論在虛擬機上如何變更破壞,都不會影響到正式機器的運作,這次工程師他在替學校建立公版模組時,本應選用「正式版」的VM設定,卻不慎選到「測試版」的,導致所有的資料連結錯誤。

然而致命點是,「測試版」的VM環境因內建重開機後,就會自動還原成初始狀態,所以過去資料不會保留,就像以前學生時代,不管是在電腦教室偷安裝遊戲或偷下載影片,重新開機後通通都會被洗掉的道理一樣,這次的「學習歷程檔案」就是因為這樣而「規組害了了(台語)」,想知道完整始末可以拜讀iThome 這一篇。

掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息

很多人問不是有備份,為何不能還原就好?由於當時在新舊機房搬遷期間,雖然有備份,但諸多環節上陰錯陽差,導致備份機制沒有到位,不能挽救這次失誤。

真正問題不只是工程師手滑

其實「工程師手滑」只是整個事件的一部分,我在過去與發包單位、外包廠商合作的經驗裡,也看過一些反覆存在的問題,包含發包單位對資安認知的不足、或各種外包後所產生的規劃與資訊落差等問題,這些跟技術不一定有直接關係。

當發包單位對資安認知有限,容易於層層預算規劃下截長補短、東拼西湊,甚至在執行後發現缺失環節再行追加。而在外包廠商的配合上,也容易因同一專案的負責人員都不同,在配合與建置上產生不一樣的認知及專業度,互踢皮球的戲碼我們也沒有少見過。

在這之中也牽涉到政府採購法及審查機制的規則,因而影響專案發展的細節與走向。雖然沒有辦法立即改善這種規則,但當大家對事件有所共識,並有志一同的想把工作圓滿完成時,工程師們除了盡力做好份內能做的事,避免淪為被收割的韭菜之外,也要知道,在工作上降低出錯率比追求好技術更為重要。

Programmers Working On Software In Office. Team Of
「一失足成千古恨」,在追求卓越技術的同時,別忘了「減少失誤」的重要性。
圖/ shutterstock

注意這兩件事降低出錯率

身為工程師的大家都有手滑過吧?別說工程師,一般人寄信都可能會發錯對象、不小心砍了重要資料等,我想說,手滑真的不可恥,只要你有注意以下兩件事,幾乎可以避掉大部分失誤。

1.建立備份認知

無論是哪一種備份方式,都務必要做完整,別認為有做到幾項就好,要以能維持整體系統不中斷為最終目標的做備份,例如採用High Availability的備援系統。過程中的檢查工作也很重要,尤其是移機前後、服務重新開放前後,或涉及大量資料轉移時,務必再三反覆確認服務狀態。

像這次事件的工程師,很可能是對系統不熟悉或沒有反覆檢查所發生,當發生問題或資料遺失時,如果不確定下一步該怎麼做,千萬別貿然行動,應先停止操作,讓狀態凍結,再仔細檢查並求救,操作實行後,也必須回頭檢查最後設定,及早發現及早治療,降低出錯率。

像我平常跟客戶溝通時,碰到最大問題是備份廠商的選擇及預算,有時客戶傾向於找便宜的雲端/備份廠商,其實每間公司資料重要程度及規模不同,不一定要在備份上把預算花到最滿。

建議可以用Open mind的精神多比較幾家,找到可靠的廠商及合適的備份方案,這件事之所以重要是因為,未來如果發生任何狀況,挽救資料的成本將可能更高,甚至資料也不一定百分之百救得回來。

shutterstock_1092113771_ai_bigdata.jpg
在規劃程式與資料相關的預算時,應根據公司本身資料的重要度而調整,不應一昧追求便宜,若發生不可挽回的意外,付出的成本將會更多。
圖/ everything possible via shutterstock

2.制定對應的SOP

大家有看過電影《地心引力》嗎?由珊卓布拉克飾演的太空人在燃料用盡的太空艙裡,靠著翻閱「太空人手冊」啟動船艙裡的機器,其實「太空人手冊」就是一種SOP,不管是誰翻閱,都能在碰到問題時照著步驟操作。有句話說:預防勝於治療,只要在事發之前,針對各種可能發生的狀況制定完整的SOP,你就能掌握自己的處理狀況,若是換成不同人操作,同樣也能照著流程解決。

雖然不確定這次「學習歷程檔案」有沒有進行SOP演練,但若碰到這種需要異地備份,或進行大規模的資料遷移時,建議不論是實體場域或虛擬場域,都要以最接近實際狀況的環境設定來演練。

在演練時,因客戶檔案可能不符合原本設定的資料規則,最好先請客戶提供真實需要備份的資料,實際跑過一次,才能建立最完善的SOP,大家可以把握以下三個原則:

  • 原則1:盡可能模擬真實備份狀況
  • 原則2:提高SOP演練完成度
  • 原則3:確保系統可以正常運作

責任編輯:吳佩臻、陳建鈞

《數位時代》長期徵稿,針對時事科技議題,需要您的獨特觀點,歡迎各類專業人士來稿一起交流。投稿請寄edit@bnext.com.tw,文長至少800字,請附上個人100字內簡介,文章若採用將經編輯潤飾,如需改標會與您討論。

(觀點文章呈現多元意見,不代表《數位時代》的立場)

【熱門焦點】
1.搶攻太空商機,福衛八號7成將採台灣製元件!林百里:半導體會是最強後盾
2.不再因就醫感到羞恥!健康科技獨角獸Ro推遠距醫療助人,獲融資5億美元

最新11月號雜誌《台灣生技新版圖》馬上購:傳送門
「電子雜誌」輕鬆讀:傳送門

關鍵字: #工作術
追蹤我們
AI全球100+台灣50
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓