[舊金山直擊]圖片人物自動幫你下tag ? Facebook沒有告訴你的事：人工智慧藍圖揭密!|數位時代 BusinessNext

[舊金山直擊]圖片人物自動幫你下tag ? Facebook沒有告訴你的事：人工智慧藍圖揭密!

Facebook 在 2016/04/12, 13 日，假舊金山梅森堡中心（Fort Mason Center）舉辦其專屬之 f8 開發者大會（Facebook F8 2016），以下是今日開發者大會直播連結：

第二天開場演講，Facebook 的講者們進一步闡釋了昨天 Mark Zuckerburg 談到未來 Facebook 發展的 10 年計畫，透露了其在人工智慧（Artificial Intelligence）的一些發展藍圖。

Facebook 首先提到，根據其內部統計，現在已經有超過四分之一的臉書工程師，投注心力在人工智慧或機器學習（Machine Learning）的開發上。而目前 Facebook 實際上線的服務，有關人工智慧或機器學習的相關應用裡，資料中心需要進行每秒鐘多達 600 萬次以上的演算預測。

（AI 其實被大量應用在 Facebook 的很多服務上，例如上週發佈的圖像辨識。James Huang 攝影。）

Facebook 揭露其人工智慧或機器學習的應用主要在以下幾個面向：電腦辨識視覺（Computer Vision）、語言轉換或語言應用：自然語言處理與理解（Natural Language Processing and Understanding）、臉部辨識與自動字幕等。

電腦辨識視覺 Computer Vision

主要是透過一些機器學習的演算法，將原本圖片資料先做切割（segmentation）成為物件（object），透過這些不同物件的特徵值來學習這些物件是什麼，例如一張圖片可以辨認出包含有兩個人、笑臉、樹、湖、雪與滑雪板等。另外可以加上臉部辨識，就可以判斷出這張圖片裡面有哪些人。（一張圖片有超過一個以上的人意味著這些人可能有關係，可以產生連結）。這個技術主要可以用在幾個面向：

圖片自動分類：幫助使用者可以很簡單的自動分類圖片

嘉惠視障者：透過讀出辨認結果，可以讓視障者也有機會理解圖片裡的事物

圖片搜尋：透過這些辨認結果，可以快速幫助一般人找到已經無法記住時間、地點甚至拍攝者與共同出現者的照片資料

照片裡的資料可以被有效切割辨認，並可以知道裡面有些什麼物件，可以幫助使用者很容易理解內容。James Huang攝影。

這樣的電腦辨識視覺也可以進一步用在影片或甚至 VR 內容辨識上，可以幫助使用者快速理解這個內容所包含的相關資訊。

自然語言處理 Natural Language Processing

透過機器學習切割人語句中重要的詞（專業術語通常叫做切詞），並以人工智慧學習理解語意（其中一種作法通常應用到類神經網絡），不同語言的使用者可以在不同的語言留言下，透過「翻譯年糕」（Facebook 目前該功能的中文翻譯，就是從 F.藤子不二雄的作品：多拉ㄟ夢/小叮噹的漫畫梗所做的翻譯）來理解不同語言的精髓。這個翻譯的重點在常用的術語也要能夠在不同語言之間對譯，例如「北車」要能夠很精確的被理解為「台北車站」，並進一步翻譯成英文的 Taipei Main Station。

（自然語言處理最簡單的應用就是「翻譯年糕」，James Huang 攝影。）

這樣的自然語言處理技術也可以作為商業應用，例如 Facebook 這次 F8 2016 稍早所公布的即時通平台（Messenger Platform beta），可以透過接受 NLP 訓練的機器人（Bot）接受一般人以對話的方式訂電影票。

延伸閱讀：

F8 2016：虛擬實境跨越物理距離，讓異地的兩人同遊倫敦

[舊金山直擊]佐克伯：讓更多人能上網，Facebook自有衛星將很快升空!

F8大會佐克柏開場演講摘要：全力發展Messenger成為整合服務平台

[舊金山直擊] 編程以連結，開源成社群 - Facebook 正在厚植的軟實力

Facebook Messenger推聊天機器人，幫你處理生活大小事!