08

[舊金山直擊]圖片人物自動幫你下tag ? Facebook沒有告訴你的事:人工智慧藍圖揭密!

2016.04.14 | 科技

Facebook 在 2016/04/12, 13 日,假舊金山梅森堡中心(Fort Mason Center)舉辦其專屬之 f8 開發者大會(Facebook F8 2016),以下是今日開發者大會直播連結:

第二天開場演講,Facebook 的講者們進一步闡釋了昨天 Mark Zuckerburg 談到未來 Facebook 發展的 10 年計畫,透露了其在人工智慧(Artificial Intelligence)的一些發展藍圖。

Facebook 首先提到,根據其內部統計,現在已經有超過四分之一的臉書工程師,投注心力在人工智慧或機器學習(Machine Learning)的開發上。而目前 Facebook 實際上線的服務,有關人工智慧或機器學習的相關應用裡,資料中心需要進行每秒鐘多達 600 萬次以上的演算預測。

掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息

AI 其實被大量應用在 Facebook 的很多服務上,例如上週發佈的圖像辨識。James Huang 攝影。
(AI 其實被大量應用在 Facebook 的很多服務上,例如上週發佈的圖像辨識。James Huang 攝影。)

Facebook 揭露其人工智慧或機器學習的應用主要在以下幾個面向:電腦辨識視覺(Computer Vision)、語言轉換或語言應用:自然語言處理與理解(Natural Language Processing and Understanding)、臉部辨識與自動字幕等。

電腦辨識視覺 Computer Vision

主要是透過一些機器學習的演算法,將原本圖片資料先做切割(segmentation)成為物件(object),透過這些不同物件的特徵值來學習這些物件是什麼,例如一張圖片可以辨認出包含有兩個人、笑臉、樹、湖、雪與滑雪板等。另外可以加上臉部辨識,就可以判斷出這張圖片裡面有哪些人。(一張圖片有超過一個以上的人意味著這些人可能有關係,可以產生連結)。這個技術主要可以用在幾個面向:

  1. 圖片自動分類:幫助使用者可以很簡單的自動分類圖片
  2. 嘉惠視障者:透過讀出辨認結果,可以讓視障者也有機會理解圖片裡的事物
  3. 圖片搜尋:透過這些辨認結果,可以快速幫助一般人找到已經無法記住時間、地點甚至拍攝者與共同出現者的照片資料

照片裡的資料可以被有效切割辨認,並可以知道裡面有些什麼物件,可以幫助使用者很容易理解內容。James Huang攝影。

這樣的電腦辨識視覺也可以進一步用在影片或甚至 VR 內容辨識上,可以幫助使用者快速理解這個內容所包含的相關資訊。

自然語言處理 Natural Language Processing

透過機器學習切割人語句中重要的詞(專業術語通常叫做切詞),並以人工智慧學習理解語意(其中一種作法通常應用到類神經網絡),不同語言的使用者可以在不同的語言留言下,透過「翻譯年糕」(Facebook 目前該功能的中文翻譯,就是從 F.藤子不二雄的作品:多拉ㄟ夢/小叮噹的漫畫梗所做的翻譯)來理解不同語言的精髓。這個翻譯的重點在常用的術語也要能夠在不同語言之間對譯,例如「北車」要能夠很精確的被理解為「台北車站」,並進一步翻譯成英文的 Taipei Main Station。

自然語言處理最簡單的應用就是「翻譯年糕」,James Huang 攝影。
(自然語言處理最簡單的應用就是「翻譯年糕」,James Huang 攝影。)

這樣的自然語言處理技術也可以作為商業應用,例如 Facebook 這次 F8 2016 稍早所公布的即時通平台(Messenger Platform beta),可以透過接受 NLP 訓練的 機器人(Bot)接受一般人以對話的方式訂電影票。

延伸閱讀:

追蹤我們
AI全球100+台灣50
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓