AI 圖像生成戰場又有新動作!Google 在 2026 年 2 月正式發佈全新圖像生成模型「檢索增強生成 2」(Nano Banana 2),以 Gemini 3.1 Flash Image 為核心架構打造,主打速度更快、畫質更高、成本更低三大賣點,並宣布全面取代舊版 Pro 模型,成為 Gemini App、Google 搜尋、AI Studio、Google Ads 等平台的新預設引擎。這波升級對創作者、行銷人員與一般用戶來說,都是一記實實在在的強心針。

Google 圖像生成模型大升級!檢索增強生成 2 速度翻倍、4K畫質成本砍半
    本圖片為參考現實資料之 AI 輔助生成

四大技術升級一次看懂:速度、畫質、理解力全面進化

檢索增強生成 2 最核心的突破,在於同時繼承了舊版 Nano Banana Pro 的「世界知識」(World Knowledge)推理能力,以及 Flash 系列模型的高速生成架構,兩者合而為一,讓過去「要畫質就得等、要速度就得犧牲品質」的兩難局面正式成為歷史。

在具體規格方面,輸出解析度從 2K 直接跳升至 4K,畫面細節更豐富、紋理更銳利,同時大幅改善了過去常見的中文亂碼、語義混亂與畫面偽影等問題。角色一致性也是這次的亮點之一,模型最多可同時維持 5 個角色的外觀特徵一致,以及保留 14 個物件的細節準確度,對於需要製作分鏡腳本或品牌視覺延伸圖像的創作者來說,幾乎是量身打造的功能。

文字渲染能力同樣獲得強化,生成圖像中的文字可讀性更高,並支援圖像內翻譯與在地化處理,行銷素材、賀卡設計等應用場景的實用性大幅提升。此外,模型對複雜指令的遵循能力也更嚴格,當使用者指定光源方向、材質質感或畫面氛圍時,檢索增強生成 2 會更精準地按照描述執行,不再自行更動畫面元素。

在成本方面,單張圖像生成費用約為 0.067 美元,相當於舊版 Pro 的一半左右,大幅降低了 API 使用門檻,也加速了 AI 圖像生成功能的普及速度。

除了技術規格的全面升級,檢索增強生成 2 在實際使用體驗上也帶來明顯改變。模型整合了 Gemini 的即時網路搜尋能力,生成圖像時不只是根據提示詞拼湊視覺元素,而是會主動參考真實世界的背景知識,舉凡真實地標、特定產品外觀、現實品牌物件,乃至具體數據圖表,都能以更高的準確度呈現。

在影像編輯功能上,檢索增強生成 2 支援強大的局部修改,使用者可以直接上傳圖片並下達指令,例如「把這雙鞋換成紅色」,模型會在保留原圖光影與質感的前提下,只針對指定部位進行修改,精準度堪比手術刀。多圖融合功能也相當實用,可提取圖片 A 的主體、結合圖片 B 的背景,再套用圖片 C 的畫風,創作自由度大幅提升。對於付費訂閱 Google AI Pro 與 Ultra 方案的進階用戶,系統仍保留調用舊版 Pro 模型處理特定專業任務的權限,兩者並行不悖。

目前檢索增強生成 2 已在 Gemini App 中正式上線,免費用戶無需佔用 Pro 模型的使用額度即可使用,相比舊版 Pro 的高運算需求與等待時間,這次的普及化策略讓更多一般用戶也能輕鬆體驗 Pro 等級的圖像生成能力,AI 製圖的門檻正式再往下降了一個台階。

本站圖片部分取自於網路,如有版權使用疑慮煩請告知。

標籤關聯文章 : #人工智慧
左右滑動查看更多