OpenAI 在美國時間 2025 年 12 月 11 日無預警推出全新一代大型語言模型 GPT-5.2,正式向 Google Gemini 3 發起反擊!這次更新不只是例行性能升級,而是將 ChatGPT 從對話式 AI 全面轉型為專業知識型工作助手。官方數據顯示,重度使用者透過 AI 每週可節省超過 10 小時工時,而 ChatGPT Enterprise 用戶更回饋,AI 每天平均能為他們節省 40 至 60 分鐘的工作時間。GPT-5.2 同步推出三種版本,包括 Instant(極速版)、Thinking(深度推理版)與 Pro(專業版),即日起陸續向付費用戶開放使用,免費用戶則需再等待一段時間。

延伸閱讀:ChatGPT 禁 3 大服務惹怒用戶!網友實測傻眼:「誰還續訂?」

ChatGPT 無預警推出 GPT-5.2!工作效率爆升 11 倍 3 大版本一次看!

GPT-5.2 在多項基準測試中刷新紀錄,其中最受矚目的是 OpenAI 首度引入名為 GDPval 的全新評測基準。這項測試聚焦於美國 GDP 貢獻最高的 9 大產業,涵蓋 44 種實際職業任務,直接檢驗 AI 在真實知識型工作中的表現。測試結果相當震撼,GPT-5.2 Thinking 在 70.9% 的任務中表現持平或優於產業頂尖專家,相較之下前一代 GPT-5.1 僅為 38.8%。更驚人的是,完成相同任務時,GPT-5.2 的速度比人類專家快超過 11 倍,而成本卻不到 1%。在軟體工程方面,GPT-5.2 Thinking 在業界公認難度極高的 SWE-Bench Verified 測試中取得 80% 的通過率,刷新目前已知紀錄;在 SWE-Bench Pro 測試中更達到 55.6% 的新成績,證明其在軟體開發方面的強大實力。此外,GPT-5.2 的幻覺(編造事實、引用不存在的資料)相比 GPT-5.1 減少約 38%,輸出資料更可信、更結構化。知識截止日期也更新到 2025 年 8 月底,並支援長達 400,000 個 token 的上下文,代表可以同時處理數百頁的文件、多份合約或大型程式碼庫,並保持高度的一致性與準確性。

ChatGPT 無預警推出 GPT-5.2!工作效率爆升 11 倍 3 大版本一次看!
    圖片來源:AI 生成

三種版本各有特色,滿足不同使用需求。GPT-5.2 Instant 主打超快回應速度,適合日常任務如快速回答問題、寫郵件、翻譯、摘要文章、產生創意內容等,成本較低且適合需要即時互動的場景。GPT-5.2 Thinking 則是「深度思考」版本,專為複雜任務設計,例如寫程式碼、分析長文件、解數學題、做策略規劃、處理多步驟專案,前身正是神秘的「草莓/Orion 計畫」。最高階的 GPT-5.2 Pro 強調極高的準確性與可靠性,適合對錯誤容忍度極低的專業場景,例如法律文件審查、金融分析、醫療研究支援等。OpenAI 特別強調,GPT-5.2 是在內部「code red」緊急狀態下加速開發的成果,目的是快速回應 Google Gemini 3 等競爭對手的進步,維持在生成式 AI 領域的領先地位。從投資銀行等級的財務模型、顧問簡報,到結構複雜的專業文件,GPT-5.2 已不只是輔助撰寫,而是能直接產出可交付成果。這次更新象徵 AI 正從「內容生成工具」正式轉型為能獨立解決問題的專業型助手。當一個模型能以專家水準、極低成本處理超過 70% 的知識型工作時,這不只是科技進步的問題,也迫使人類重新思考,在 AI 時代,真正不可取代的核心價值究竟是什麼。GPT-5.2 的設計目標,是讓 AI 能夠產出可直接使用的工作成果、長時間維持任務脈絡與上下文、主動呼叫工具並完成完整流程,為專業工作者帶來前所未有的效率提升。


本站圖片部分取自於網路,如有版權使用疑慮煩請告知。

標籤關聯文章 : #人工智慧