重點1 :Google於美國時間3月12日推出Gemma 3,強調其為「全球最佳單一加速器模型」,在效能上超越Llama-405B、DeepSeek-V3 和 o3-mini等競爭對手。
重點2 :Gemma 3具備強化後的文字與視覺推理能力,可分析圖像、文字與短影片,並為超過 140 種語言提供預訓練支持。
重點3 :為強化Gemma 3 安全機制,Google一併推出ShieldGemma 2圖像安全檢查器,並針對危險內容、色情、暴力等潛在濫用風險進行評估。
Google宣布推出最新的開放模型Gemma 3,該模型基於Gemini 2.0模型的研究與技術構建。
Google強調, Gemma 3在LMArena基準測試中,超越了Facebook的Llama、DeepSeek、以及OpenAI等競爭對手 ,並且在輝達的 GPU 和專用 AI 硬體上運行具有優化的功能,是「可在單一GPU或TPU上運行的最強大模型。」
Gemma系列模型在過去一年內已達到超過一億次的下載量,並在「Gemmaverse」中衍生出六萬多種變體,其設計目標是「直接在裝置上快速運行,從手機、筆記型電腦到工作站」。
Gemma 3也提供1B、4B、12B和27B等多種模型尺寸,以滿足不同開發者的需求。
強化文字與視覺推理能力,支援140種語言
Gemma 3在4B及更大尺寸的模型中,增強了文字與視覺推理能力,使其能夠分析圖像、文字和短影片。此外,該模型支援128k的上下文視窗,並內建超過35種語言的支援,經過預訓練後更可支援超過140種語言。
為了提升開發者的應用彈性,Gemma 3支援功能呼叫和結構化輸出,有助於自動化任務和構建代理體驗。此外,Google還推出了官方量化版本,以減少模型大小和計算需求,同時保持高準確性。
強化安全機制,降低潛在濫用風險
在安全方面,Gemma 3推出了名為ShieldGemma 2的「強大4B圖像安全檢查器」,提供圖像安全解決方案,並針對危險內容、色情內容和暴力內容三個安全類別輸出安全標籤。
Google強調,在開發過程中,他們進行了廣泛的資料治理、透過微調與安全政策保持一致,並進行了穩健的基準評估。
此外,針對Gemma 3在STEM(科學、技術、工程和數學)領域的強化效能,Google特別評估了其在創建有害物質方面的潛在濫用風險,結果顯示風險等級較低。
開發者已經可以透過Google AI Studio立即試用Gemma 3,並透過Kaggle或Hugging Face下載模型。