Google DeepMind於4月2日正式發布新一代開放AI模型「Gemma 4」,這次不只是效能升級,更一口氣推出4種規模的版本,從手機、物聯網裝置到研究用工作站全都涵蓋。更關鍵的是,Gemma 4改採Apache 2.0授權,企業和開發者可以自由修改、商業部署,不再受到過去授權條款的限制,被業界視為Google在開源AI市場的重大策略轉向。

Google Gemma 4 發布!4款模型全面開放商用,最小版本手機離線也能跑

4款規格一次到位,最小版本手機就能跑

Gemma 4共推出Effective 2B(E2B)、Effective 4B(E4B)、26B混合專家模型(MoE)、31B Dense四種規格,針對不同硬體環境分別最佳化。E2B和E4B主打低延遲、省電設計,可在智慧型手機、Raspberry Pi、NVIDIA Jetson Orin Nano等輕量裝置上完全離線運作,適合行動應用與物聯網場景。26B MoE採動態引數啟動機制,在速度與品質之間取得平衡;31B Dense則是品質優先,適合高階推論與學術研究用途,可在研究者的個人電腦上直接執行。效能方面,在全球AI模型評測榜單Arena AI上,31B模型在開放模型中排名第3,26B模型排名第6,而業界標準測試更顯示Gemma 4能超越體積是自身20倍的競爭模型,「每引數智慧」大幅提升。功能面同樣全面升級:支援圖片、音訊、影片的多模態輸入,最長可處理25萬6000個token的超長文字,並原生支援140種以上語言,還具備高品質離執行緒式碼生成能力。

Google Gemma 4 發布!4款模型全面開放商用,最小版本手機離線也能跑

Gemma 4的底層技術源自Google旗艦模型Gemini的研究成果,但這次特別強化了「代理型工作流程」支援,讓模型不只能回答問題,還能自主執行多步驟任務,更接近實際應用場景的需求。硬體相容性方面,Google與Qualcomm、MediaTek等晶片廠商合作最佳化,確保從Android手機到雲端工作站都能高效執行。開發工具整合也相當完整,支援Google AI Studio、Android Studio及ML Kit GenAI Prompt API等主流開發環境。安全性上,Google DeepMind套用了自家的安全協定,針對供應鏈漏洞與資料污染等風險進行防護設計。模型目前已可從Hugging Face、Kaggle及Ollama下載取用。

Google Gemma 4 發布!4款模型全面開放商用,最小版本手機離線也能跑

31B模型在Arena AI開放模型排行榜拿下第3名,26B模型緊追在第6位,兩款模型均可在研究者的個人電腦上直接執行,門檻遠低於同級競品。


本站圖片部分取自於網路,如有版權使用疑慮煩請告知。

標籤關聯文章 : #人工智慧
左右滑動查看更多