Facebook 在 2016/04/12, 13 日,假舊金山梅森堡中心(Fort Mason Center)舉辦其專屬之 f8 開發者大會(Facebook F8 2016),以下是今日開發者大會直播連結:
第二天開場演講,Facebook 的講者們進一步闡釋了昨天 Mark Zuckerburg 談到未來 Facebook 發展的 10 年計畫,透露了其在人工智慧(Artificial Intelligence)的一些發展藍圖。
Facebook 首先提到,根據其內部統計,現在已經有超過四分之一的臉書工程師,投注心力在人工智慧或機器學習(Machine Learning)的開發上。而目前 Facebook 實際上線的服務,有關人工智慧或機器學習的相關應用裡,資料中心需要進行每秒鐘多達 600 萬次以上的演算預測。
(AI 其實被大量應用在 Facebook 的很多服務上,例如上週發佈的圖像辨識。James Huang 攝影。)
Facebook 揭露其人工智慧或機器學習的應用主要在以下幾個面向:電腦辨識視覺(Computer Vision)、語言轉換或語言應用:自然語言處理與理解(Natural Language Processing and Understanding)、臉部辨識與自動字幕等。
電腦辨識視覺 Computer Vision
主要是透過一些機器學習的演算法,將原本圖片資料先做切割(segmentation)成為物件(object),透過這些不同物件的特徵值來學習這些物件是什麼,例如一張圖片可以辨認出包含有兩個人、笑臉、樹、湖、雪與滑雪板等。另外可以加上臉部辨識,就可以判斷出這張圖片裡面有哪些人。(一張圖片有超過一個以上的人意味著這些人可能有關係,可以產生連結)。這個技術主要可以用在幾個面向:
- 圖片自動分類:幫助使用者可以很簡單的自動分類圖片
- 嘉惠視障者:透過讀出辨認結果,可以讓視障者也有機會理解圖片裡的事物
- 圖片搜尋:透過這些辨認結果,可以快速幫助一般人找到已經無法記住時間、地點甚至拍攝者與共同出現者的照片資料
這樣的電腦辨識視覺也可以進一步用在影片或甚至 VR 內容辨識上,可以幫助使用者快速理解這個內容所包含的相關資訊。
自然語言處理 Natural Language Processing
透過機器學習切割人語句中重要的詞(專業術語通常叫做切詞),並以人工智慧學習理解語意(其中一種作法通常應用到類神經網絡),不同語言的使用者可以在不同的語言留言下,透過「翻譯年糕」(Facebook 目前該功能的中文翻譯,就是從 F.藤子不二雄的作品:多拉ㄟ夢/小叮噹的漫畫梗所做的翻譯)來理解不同語言的精髓。這個翻譯的重點在常用的術語也要能夠在不同語言之間對譯,例如「北車」要能夠很精確的被理解為「台北車站」,並進一步翻譯成英文的 Taipei Main Station。
(自然語言處理最簡單的應用就是「翻譯年糕」,James Huang 攝影。)
這樣的自然語言處理技術也可以作為商業應用,例如 Facebook 這次 F8 2016 稍早所公布的即時通平台(Messenger Platform beta),可以透過接受 NLP 訓練的 機器人(Bot)接受一般人以對話的方式訂電影票。
延伸閱讀: