AI語音新創ElevenLabs推出首款語音閱讀器「ElevenLabs Reader: AI Audio」,導入ElevenLabs的AI語音庫,這款App可以流暢朗讀任何文本頁面,包括網頁文章、新聞、報告或研究論文,甚至是書籍小說、email等,直接變成有聲書或Podcast聆聽。
用戶只需要將想要收聽的內容網址複製到App上,或是上傳 PDF、ePub檔案格式,並提供多種人聲語音搭配不同的文字情境、情緒和場合,從口音、說話速度到語氣都可以自由控制,例如用專業聲音口吻閱讀商業報告,或變身教授大聲朗讀教科書,甚至是自己本人的聲音都可以加入導讀。
ElevenLabs Reader: AI Audio目前僅提供iOS英文版本,Android用戶則可以加入體驗候補名單。ElevenLabs表示,未來將擴展支援29種語言。
AI語音市場在吸引大量資金投入。
新創ElevenLabs就是其中一個例子。團隊提供的AI工具,讓使用者自由創建跨語言、跨口音的AI聲音,吸引超過100萬用戶及100間的合作企業使用。
團隊在今(2024)年1月宣布在B輪融資中收到8,000萬美元(約新台幣25億元),主要投資人包含a16z、紅杉資本、前GitHub執行長Nat Friedman等。
是什麼原因讓新創ElevenLabs在短短半年內,市場估值從原先的近1億美元,增長超過10倍達到11億美元,成為英國增長最快的獨角獸?
新創ElevenLabs成英國最新獨角獸,成員專業技術及未來明確規劃打動創投的心
語音新創ElevenLabs主打利用生成式AI製作語音模型,使用者可導入欲作為範本的聲音片段或使用範本庫中的檔案製作出新的語音,應用於AI配音、新聞報導、有聲書朗讀等領域。
新創ElevenLabs於2022年創立,至今已累積超過100間合作企業,其中包含華盛頓郵報、有聲書品牌Storytel、遊戲發行商Paradox Intereactive等。
儘管AI語音不算新題目,ElevenLabs團隊之所以能吸引到眾多投資人的支持,原因與團隊創辦人背景相關。
ElevenLabs團隊的成立源自於兩位多年好友,前Google機器學習工程師Piotr Dabkowski,及前Palantir員工Mati Staniszewski,出身於波蘭的兩人對美國電影中不和諧的波蘭配音感到困擾,希望利用自己對AI技術的認識改變現況。
ElevenLabs團隊的投資人Concept Ventures在官網宣布ElevenLabs最新募資消息時提到,創辦人特質是他們決定是否加入投資時的決定因素。在Piotr Dabkowski及Mati Staniszewski發現配音市場的不足時,ElevenLabs團隊對其未來的明確願景及團隊成員擁有的專業知識深深吸引創投的注意。
另一位投資人a16z同樣在官網上表達對ElevenLabs團隊的肯定,ElevenLabs團隊擁有機器學習及大型系統運作的專業知識,改變現有的文字轉語音(TTS)模型,使其創造出的新聲音具備自然的語氣停頓、呼吸,期待未來ElevenLabs能擴大可應用的語言範圍,打破現有語音市場的限制。
語音新創不可避免的濫用問題,ElevenLabs積極推出應對措施避免影響擴大
儘管新創ElevenLabs在2024年初成為眾所矚目的新創獨角獸,但同所有AI語音新創,團隊同樣身陷技術濫用的爭議中。
美國最大匿名網路論壇4chan因長期充斥種族歧視言論備受討論,包含利用如Emma Watson、Joe Rogan等名人聲音散佈含有種族歧視內容,不久前被爆出有些上傳到該論壇的深偽影片中是透過ElevenLabs所推出的beta版軟體所製成。
儘管這並非ElevenLabs團隊研發新技術的初衷,但考量到其技術創造出的高品質音段及創造新聲音的簡易性,深偽音訊(deepvoice)問題成為眼下急需解決的問題。
因應這項問題,新創ElevenLabs以AI Speech Classifier為名,推出可偵測音段是否經過ElevenLabs軟體加工的API程式,協助使用者辨認經變造後的聲音。同時團隊也預計推出如付費版使用驗證、完成後作品附上創作者ID及增加手動批准聲音複製要求等功能,避免技術被濫用問題。
除了謹慎注意任何技術濫用的消息外,Piotr Dabkowski也在官網聲明中提到,團隊未來亦將利用一部分收到的新資金加強安全措施的推出,並藉由推動團隊研究計畫、擴大現有基礎建設及開發新垂直領域的新產品,確保AI技術在正確的軌道上發展。
資料來源:《TechFundingNews》、《VentureBeat》、《Crunchbase》、《Vice》、《TechCrunch》、《Futurism》、《Sifted》、《Fast Company》
責任編輯:蘇柔瑋