Google今日宣布收購提供聊天機器人開發工具的新創API.AI,透過API.AI,開發者可輕鬆打造同時支援文字和語音辨識的對話式介面(Conversational UI)。
API.AI可支援15種語言
API.AI的API透過語音辨識、意圖辨識和上下文語境理解等技術,讓電腦理解人類語言並轉換為行動,協助開發者打造類似Siri的對話式智慧助理,可用於聊天機器人、app、智慧家電等。
Google指出,目前已有超過6萬名開發者使用API.AI,其中包含Slack、Facebook Messenger和Kik等通訊軟體。API.AI目前可支援英文、中文、法文、德文和西班牙文等15種語言和方言,而API.AI自家的聊天機器人助理Assistant已擁有超過2千萬名使用者。
Facebook和Google的語音辨識大戰
在此之前,Google已有豐富的自然語言處理相關經驗,並於今年開放自家語音辨識工具Google Natural Language API供開發者免費使用。
此外,Google也推出類似亞馬遜Alexa、蘋果Siri的智慧語音助理Google Assistant,並整合進旗下即時通訊軟體Allo,可提示回覆訊息、協助訂餐廳等功能,而收購API.AI後,可讓Google更容易轉換人類語言、理解這些文字背後的意圖。
除了Google,Facebook同樣也在其通訊軟體加強語音辨識功能,除於2015年收購語音辨識新創WIT.AI,也測試將Facebook Messenger的語音內容轉換為文字,讓接收者可直接閱讀。Facebook旗下WhatsApp則是在iOS 10中與Siri整合,可以直接用語音指示WhatsApp撥電話或傳訊息。
語音辨識 + 藍芽耳機 = 語音時代來臨
有了語音辨識技術,未來智慧型手機可以辦到的事,可能都不再需要打開手機便可完成。
知名科技趨勢分析師瑪麗米克(Mary Meeker)在報告中指出,語音時代即將來臨。她說明,「語音是最有效率的運算輸入形式」,此外,語音介面也可以更容易預測我們談話背後的意圖,讓我們不用再從首頁開始瀏覽,而是直接進入想要的功能。
從蘋果推出無線耳機AirPods也可看見此趨勢,AirPods內建免持麥克風,讓使用者可隨時輕鬆招喚Siri。可想見,未來和智慧助理的溝通管道,可能將逐漸從手機轉移至耳機,或許我們就不用再花這麼多時間盯著手機螢幕了!