「33%復健科醫師 + 33%數據統計阿宅 + 33%馬拉松愛好者 + 1%無限可能」台大復健科醫師吳沛燊,用這樣的綜合體來形容自己。
平常星期一到五,他是台大復健科的住院醫師;而在下班或是週末的時間,他是均一教育平台的資料科學顧問,綜合起來目前最大的困擾是「時間都不夠用」。
吳沛燊之所以會成為一名資料科學家,歷經過人生中幾次轉彎。大學時他本來讀的是台大電機系,在大二時轉醫學系。今年踏入住院醫師第三年的他,過去幾年早已經習慣用資料解決工作上遇到的大小事。
2014年,他發覺醫院的系統設計往往都從工程師的角度出發,沒有考慮到人因的因素,而繁瑣的系統,反而干擾到一名醫師能夠花在臨床的時間。例如寫病歷時需要不斷重複拼貼、往往十幾分鐘的時間就是浪費,整天都要坐在電腦前,反而沒心力花在照顧病人身上,於是他開始自己寫系統,將醫院的資料自動化。
「懂一點數據,對工作上有很大的幫助,你的feedback(回饋)會很快。」吳沛燊說。例如過去醫師做臨床研究,遇到資料時需要假手醫院的工程部門,但懂資料就可以自己做。像是他當時在臨床的經驗累積了2、300個病人,總會思考一個問題:到底這些病人常出現的共同問題是什麼?這類問題通常怎麼去處理?大概的效果又是如何?於是他開始試著用系統化的方式去記錄跟追蹤、分析資料。
舉例來說,大部分肩膀痛的人一開始他都建議做復健,大部分效果不好,但如果是建議病人先打針再去做復健,成效就比較好。這時候就可以套上更複雜的模型,用小資料套上貝氏模型得出結果,「只要能夠找到一些小小的pattern(模式),就可以大幅改善。」他說。
從醫療到教育
原先只是為了更好的處理工作上會遇到的問題,吳沛燊在Coursera平台上自學R語言,也修當時史丹佛人工智慧實驗室主任吳恩達的機器學習課程。另外,他也上資料科學平台Kaggle,找醫學類的題目來做,除了對臨床經驗有幫助外,也連帶培養自己在資料科學領域的研究能力,「這應該算是我第一次跳級打怪,玩這個可以快速成長。」
吳沛燊把自己學習資料科學的經驗分享到自己的Facebook上,讓均一教育平台執行長呂冠緯找上他,問他有沒有興趣合作。對他來說,誘因是可以摸到真正的資料,因此開始以外部顧問的方式合作。
到了均一教育平台擔任外部顧問後,也讓吳沛燊開始真正用資料科學在實踐、解決問題。正如同醫學,教育也是一門艱深的學問,讓他必須花心力去讀教育理論、教育心理學,深入了解使用者的內心,才能開始去問更複雜的問題。從一開始只問「使用者流量有沒有增加?」,再問到「使用者到底為什麼會來?來了到底有沒有學到東西?」這類的問題。例如還有用資料建模型,做到預測使用者心態。像是當使用者答錯題目遇到挫折時,要用什麼辦法激勵不同心態的人,是要推薦他再接再勵,還是給他一個更難的題目?唯有理解每一個人不同的狀況,才能達到均一在幫助學生學習的初衷。
吳沛燊認為,不管是在醫院的臨床經驗,或者是均一教育平台,其實都會產生大量的數據。但如果不是因為對資料的意識(awareness),就會讓這些資料跑過去了,出社會的學習是情境式的學習,碰到問題就學著解決,試著「從data(數據)到insight(洞察)到action(行動)」。
而對他來說,從電機到醫學,再到跨入教育領域,一直都是因為自己對理解「人」本身有興趣,「Data本身也是要回應這個問題的,因為不管它多複雜多fancy(花俏),最後還是都要解決人身上的問題。」