樂天集團(Rakuten)日前高調發布旗下最新大型語言模型「Rakuten AI 3.0」,對外宣稱這是「日本國內最大規模、高效能的日語專用AI模型」,並以免費開源的方式釋出,訊息一出引發科技圈廣泛追蹤。然而,就在發布後短短數小時內,社群上的開發者便在 HuggingFace 平台翻出模型的設定檔,發現其架構竟與中國AI公司深度求索(DeepSeek)的 DeepSeek V3 高度吻合,讓這場「日本之光」的發布會瞬間變調。

樂天 Rakuten AI 3.0 號稱日本最大自研AI,上線數小時被抓包核心是 DeepSeek

自研旗艦遭翻底細,DeepSeek V3 架構曝光

根據樂天官方說明,Rakuten AI 3.0 採用混合專家架構(Mixture of Experts,MoE),總引數量高達約 6710 億,每次推理時啟動約 370 億引數,並在多項日語基準測試中取得優異成績。樂天強調,這款模型是作為日本經濟產業省主導的「GENIAC計畫」(Generative AI Accelerator Challenge)一環所開發,旨在強化日本國內生成式AI的自主研發能力,並以 Apache 2.0 授權條款免費開源,供全球開發者使用。GENIAC計畫由日本經濟產業省於2024年2月啟動,目標是扶植國內基礎模型開發實力,樂天此次參與正是該計畫的重要成果之一。不過,社群開發者在仔細檢視 HuggingFace 上的模型設定檔後,發現其架構引數與 DeepSeek V3 的公開資料幾乎完全一致,包括模型層數、隱藏層維度等核心設計,讓外界對「自主研發」的說法打上大大的問號。訊息在 X(前身為 Twitter)平台上迅速擴散,不少日本科技業人士轉寄討論,直指樂天的宣傳方式有誇大之嫌。

載入中...

DeepSeek V3 是由中國杭州深度求索公司開發的開源大型語言模型,以低成本、高效能著稱,在全球AI圈引發廣泛追蹤。由於 DeepSeek 採用開源授權,任何公司在技術上確實可以基於其架構進行二次開發或微調,這在AI產業並非罕見做法。然而,樂天在對外宣傳時強調「自研」與「日本最大」,卻未主動揭露底層架構來源,才讓這次發布引發強烈反彈。值得注意的是,台灣行政院已宣布公務機關全面停用 DeepSeek 相關服務,理由是資安與個資外洩疑慮,此背景讓樂天此次事件在亞洲科技圈更加敏感。目前樂天方面尚未就「是否基於 DeepSeek V3」一事作出正面回應,但相關討論已在日本與國際科技社群持續延燒。

Rakuten AI 3.0 的模型已上架 HuggingFace 供外界下載,技術社群的逐行比對仍在進行中,更多架構細節預計將陸續浮出水面。這場「日本最大AI」的爭議,也再次點燃外界對AI模型透明度與開發溯源的討論熱度。


本站圖片部分取自於網路,如有版權使用疑慮煩請告知。

標籤關聯文章 : #人工智慧
左右滑動查看更多