趨勢科技與國家實驗研究院國家高速網路與計算中心宣佈「T-brain」機器學習智慧運算分析平台上線。
T-brain模式雷同於甫被Google收購的Kaggle
T-brain平台類似於甫被Google收購的Kaggle。2010年成立的Kaggle是全球最大資料科學和機器學習競賽社群,據傳有50萬資料科學家貢獻所學。
Kaggle掌握了機器學習的發展需要三個關鍵,第一個是數據集(Dataset),如政府單位或是企業組織提供的資料庫;其次是腳本集(Script),好的程式模型與運算法方可讓機器做出更有效的決定與預測;最後是討論群(Community),一個讓群體智慧和創意充分交流的平台,激盪出更多的火花。
趨勢科技全球資深研發副總暨人工智慧加速計劃主持人周存貹則更進一步指出Kaggle模式成功,主要原因在於平台發展的早,七年前機器學習尚未形成巨大風潮,而其開放的資料又具有足夠的「代表性」,再者平台也提供了誘人的獎勵機制(來自全球的企業為在平台發起競賽,並且提供誘人獎金)因此廣受全球資料科學家與人工智慧領域專業人士的認同與喜愛。
而Kaggle被Google收購後,雷同模式的競賽社群更受科技界矚目。中國已經有多個競賽社群,T-brain則是台灣第一個。「不過T-brain目前並沒有導入獎金獎勵機制。」周存貹指出。
解決台灣本土問題:牽起中小企業與學界的共同發展機器學習橋樑
對於台灣學界來說,第一步就卡在缺乏「真實」環境下產生的各式大量資料,而T-brain希望能吸引企業把真實環境下的資料公開分享讓學界能實彈演練。
「學界目前最常反應,沒有足夠的與真實環境下的高品質的數據發展機器學習技術。」趨勢科技台灣暨香港區總經理洪偉淦指出。「以資安領域來說,目前市面上公開的數據多為5到10年的舊數據,其實很多數據公開時程晚一個月,效用就有限了。」
因此趨勢科技在T-brian提供超過20萬筆資料,
包含「趨勢科技垃圾郵件資料」與「趨勢科技惡意程式資料」並且也歡迎政府單位與私人企業把數據匯入T-brain平台。不過平台剛運行,上面的數據集還很有限,目前有趨勢科技與蘋果日報等企業的六大組資料。
趨勢科技也強調,這些資料是具有機器學習訓練價值的,「這些資料已經去蕪存菁,是較具有代表性的。」周存貹指出。
除了大企業,T-brian也希望提供沒有資源的中小企業發展機器學習的機會。「很多中小型企業有發展資料科學或人工智慧的需求,但請不起資料科學家或機器學習專家,產學合作也不容易申請,這時T-Brain平台就有助於這些企業以最小成本發展相關技術或找尋適合的人才。」洪偉淦指出。
T-brain平台目前規畫提供學術研究使用,具有國研院國網中心學界會員資格的學術單位與大專院校師生透過申請國網中心大資料平台分析服務,即可免費使用。