笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了個名?

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了個名?

文章圖片

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了個名?

文章圖片

笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了個名?
"multi_version":false
好家伙……我真的是直接好家伙!
3月17日 , 楽天(樂天)集團正式發布了Rakuten AI 3.0模型 , 號稱是“日本國內最大規模的高性能AI模型” 。 官方宣傳的參數量為約7000億 , 并且日語特化 , Apache 2.0開源許可 , 還拿了日本經產省和NEDO的GENIAC項目補助 。

然而就是這樣一個日本國民級的AI模型 , 不到12小時 , 爆出驚天大雷 。
當天下午 , 有人打開了Rakuten AI 3.0在Hugging Face上的config.json 。
第一行配置 , architectures(架構)字段 , 赫然寫著一個在中國家喻戶曉的模型:DeepseekV3ForCausalLM.
而model_type字段為deepseek_v3 。
也就是說 , 這個日本“國內最大規模的高性能AI模型” , 正是DeepSeek V3 。

01
事情的發現過程沒有任何技術門檻 。
Rakuten AI 3.0發布后 , 模型權重按慣例上傳到了Hugging Face的楽天官方倉庫 。
任何人點進去 , 切到“Files and versions”標簽頁 , 打開config.json就能看到 。
這個config.json是每個大模型都有的配置文件 , 記錄著模型的架構信息 。
architectures字段寫的“DeepseekV3ForCausalLM” , 意思是這個模型使用的是DeepSeek V3的因果語言模型架構 。
不是“參考” , 不是“借鑒” , 是直接聲明了模型類別 。
【笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了個名?】往下看 , hidden_size是7168 , intermediate_size是18432 , num_hidden_layers是61 , n_routed_experts是256 , vocab_size是129280 。
這些數字和DeepSeek V3的原版配置一模一樣 。

說實話 , 真的是演都不演了 。 而且現在DeepSeek已經更新到V3.2了 , V3幻覺太高 , 其實不怎么好用的 。
難怪楽天的Rakuten AI 3.0號稱“參數量約7000億” , 因為DeepSeek V3的參數量就是6810億 。
Hugging Face的模型頁面上 , 標簽欄里甚至直接掛著“deepseek_v3”的標簽 。 這不是網友后加的 , 是模型上傳時系統根據config自動生成的 。
楽天自己的說法是基于開源社區最優秀的模型開發 。
這句話寫在官方新聞稿里 , 還寫在Hugging Face的模型卡片里 , 也寫在楽天集團的PR Times新聞通稿里 。 從技術角度講 , 這句話沒有說謊 。
改了個名字確實也算是開發 。
DeepSeek V3是開源模型 , 許可證也允許這么做 。 楽天在此基礎上用自己的日語雙語數據做了微調和優化 , 這個流程在業界很常見 。
但問題在于 , 楽天在所有對外宣傳中 , 從未提及“DeepSeek”這三個字 。
新聞稿里沒有 , 模型卡片的描述里沒有 , 接受媒體采訪時也沒有 。
所以當有人把config.json的截圖貼到 X(原Twitter)上時 , 評論區的反應可想而知 。
02
最先傳播開來的是一張截圖:Hugging Face上Rakuten AI 3.0的config.json 頁面 , architectures字段里的“DeepseekV3ForCausalLM”被藍框高亮圈出 。
截圖下面 , 有人只寫了兩個詞加一個問號:“deepseek V3?”

這條帖子被迅速轉發到Impress Watch的報道推文下面 。
Impress Watch是最早報道 Rakuten AI 3.0 的日本科技媒體之一 , 它的推文本來是一條普通的新聞轉發 , 評論區卻變成了另一番景象 。
一個叫Ryu的用戶寫道:“日本終于到了用中國AI冒充日本產AI的時代了嗎?”
底下的日語評論普遍都是罵街的 , 中文評論都是看樂子的 , 在這里我也就不放出來了 , 大家自行想象一下那個場景就好了 。
誠然 , 嚴格來說 , 楽天沒有違反任何規則 。 DeepSeek V3的開源許可允許商業使用和二次開發 , 在開源模型基礎上做微調也是行業通行做法 。
可是這事并沒有那么體面 。
2025年DeepSeek爆火的時候 , 日本媒體給它起了個名字 , 叫“AI界的黑船事件” 。
黑船是 1853 年美國海軍準將佩里率艦隊強行叩開日本國門的歷史事件 , 在日語里專門用來形容外來力量對日本造成的巨大沖擊 。
把一個中國的AI產品比作黑船 , 這個措辭本身就說明了很多 。
日本政府的反應很快 。 2025年2月初 , 日本數字大臣平將明公開表態 , 稱在安全疑慮消除之前 , 日本公務員應避免使用DeepSeek , 或者在使用時格外謹慎 。
他特別提到了個人信息保護的問題 。 隨后 , 日本政府向各省廳發出警告 , 要求不要在政府設備上使用DeepSeek 。
企業層面的動作更直接 。
豐田汽車明確禁止員工使用DeepSeek , 官方理由是“出于信息安全的考慮” 。 三菱重工同樣實施禁令 , 即便員工提交內部申請也不會被批準 。
軟銀則限制了公司內部對 DeepSeek 的訪問 , 并禁止員工在工作設備上下載和使用 。
可是現在……你怎么讓我忍得住不笑?。 ?

    推薦閱讀