Google 近日正式發表全新語音模型 Gemini 3.5 Live Translate,主打近即時的 AI 語音翻譯能力,不僅支援超過 70 種語言,更能保留說話者原本的語氣與聲調,大幅提升跨語言溝通體驗。這項技術已陸續導入 Google 翻譯、Google Meet 與 Gemini Live API,未來無論是跨國會議、旅遊交流還是國際通話,都有望實現更自然流暢的即時對話。

Google Gemini 3.5 即時語音翻譯登場!支援 70 種語言、2000 種組合⋯最新功能一次看!

Google 發布的大更新是什麼?

出國旅遊時比手畫腳、跨國會議中等待翻譯、與外國朋友聊天時頻繁切換翻譯軟體,這些情境未來可能都將成為過去式。Google 近日正式推出 Gemini 3.5 Live Translate,這項全新 AI 語音技術最大的特色,就是讓不同語言的人能夠像平常聊天一樣自然對話。過去的即時翻譯工具雖然已相當方便,但大多需要等對方完整講完一句話後才能開始翻譯,因此常出現停頓與延遲感。而 Gemini 3.5 Live Translate 則改採串流式語音處理模式,能夠在使用者說話的同時持續進行翻譯,讓雙方幾乎能同步理解彼此內容。更令人驚豔的是,它不只翻譯文字內容,還能保留說話者原本的語氣、情緒與聲調。換句話說,即使是開玩笑、驚訝或激動的語氣,也能透過翻譯後的聲音傳遞給對方,讓交流更接近真人對話。

Google Gemini 3.5 即時語音翻譯登場!支援 70 種語言、2000 種組合⋯最新功能一次看!
    圖片來源:Gemini AI

目前系統已支援超過 70 種語言,包括中文、英文、日文、韓文、西班牙文、法文與德文等主流語言。Google 也特別強調,新模型對背景噪音的容忍度更高,即使在街道、機場或餐廳等環境中,也能維持不錯的辨識效果。除了 Google 翻譯 App 外,升級幅度最有感的莫過於 Google Meet。原本僅支援少數語言的翻譯功能,如今可擴展至超過 2,000 種語言組合,對於跨國企業與遠距工作團隊來說是一大突破。Google 也同步開放 Gemini Live API,讓開發者能將即時語音翻譯功能導入更多服務。像是東南亞叫車平台 Grab 就已率先測試,讓司機與乘客能跨語言直接對話。隨著 AI 翻譯逐漸從文字走向即時語音互動,人與人之間最大的溝通障礙之一,似乎正被快速消除。

載入中...

延伸閱讀


本站圖片部分取自於網路,如有版權使用疑慮煩請告知。

標籤關聯文章 : #人工智慧
左右滑動查看更多