国产成人三级在线视频网站观看,亚洲精品午夜一区二区电影院,国产高清第一区第二区第一页

文章圖片

文章圖片

文章圖片

「工程師正在瘋狂地分析 DeepSeek ，試圖從中復(fù)制任何可能的東西。」
DeepSeek 開源大模型的陽謀，切切實實震撼著美國 AI 公司。
最先陷入恐慌的，似乎是同樣推崇開源的 Meta 。
最近，有 Meta 員工在美國匿名職場社區(qū) teamblind 上面發(fā)布了一個帖子。帖子提到，國內(nèi) AI 創(chuàng)業(yè)公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌，因為在前者的低成本高歌猛進下，后者無法解釋自己的超高預(yù)算的合理性。
原文如下：
這一切始于 DeepSeek-V3 ，它在基準(zhǔn)測試中就已經(jīng)讓 Llama 4 落后。更糟糕的是那個「擁有 550 萬訓(xùn)練預(yù)算的不知名中國公司」。
工程師們正在瘋狂地分析 DeepSeek ，試圖從中復(fù)制任何可能的東西。這一點都不夸張。
管理層擔(dān)心如何證明龐大的生成式 AI 組織的成本是合理的。當(dāng)生成式 AI 組織中的每個「領(lǐng)導(dǎo)」的薪資都比訓(xùn)練整個 DeepSeek-V3 的成本還要高，而我們有好幾十個這樣的「領(lǐng)導(dǎo)」時，他們要如何面對高層？
DeepSeek-R1 讓情況變得更加可怕。雖然我不能透露機密信息，但這些很快就會公開。
這本應(yīng)該是一個以工程為重點的小型組織，但是因為很多人想要參與進來分一杯羹，人為地膨脹了組織的招聘規(guī)模，結(jié)果每個人都成了輸家。

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 分別發(fā)布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。
其中， DeepSeek-V3 在發(fā)布時提到，該模型在多項評測成績超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他開源模型，并在性能上和世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。
不過，更引人關(guān)注的是，這個參數(shù)量高達 671B 的大型語言模型訓(xùn)練成本僅 558 萬美元。具體來說，它的預(yù)訓(xùn)練過程竟然只用了 266.4 萬 H800 GPU Hours ，再加上上下文擴展與后訓(xùn)練的訓(xùn)練，總共也只有 278.8 H800 GPU Hours 。相較之下， Meta 的 Llama 3 系列模型的計算預(yù)算則多達 3930 萬 H100 GPU Hours—— 如此計算量足可訓(xùn)練 DeepSeek-V3 至少 15 次。

而最近發(fā)布的 DeepSeek-R1 性能更猛 —— 在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上，它的性能比肩 OpenAI o1 正式版。而且模型在發(fā)布的同時，權(quán)重同步開源。很多人驚呼，原來 DeepSeek 才是真正的 OpenAI 。 UC Berkeley 教授 Alex Dimakis 則認(rèn)為，DeepSeek 現(xiàn)在已經(jīng)處于領(lǐng)先位置，美國公司可能需要迎頭趕上了。

看到這里，我們不難理解為何 Meta 的團隊會陷入恐慌。如果今年推出的 Llama 4 沒有點硬本事，他們「開源之光」的地位岌岌可危。
有人指出，其實該慌的不止 Meta ， OpenAI、谷歌、Anthropic 又何嘗沒有受到挑戰(zhàn) 。「這是一件好事，我們可以實時看到公開競爭對創(chuàng)新的影響。」

還有人擔(dān)心起了英偉達的股價，表示「如果 DeeSeek 的創(chuàng)新是真的，那 AI 公司是否真的需要那么多顯卡？」

不過，也有人質(zhì)疑， DeepSeek 究竟是靠創(chuàng)新還是靠蒸餾 OpenAI 的模型取勝？有人回復(fù)說，這可以從他們的發(fā)布的技術(shù)報告中找到答案。

目前，我們還無法確定帖子的真實性。
【Meta陷入恐慌內(nèi)部爆料在瘋狂分析復(fù)制DeepSeek, 高預(yù)算難以解釋】不知道 Meta 后續(xù)將如何回應(yīng) ，即將到來的 Llama 4 又會達到怎樣的性能。

Meta陷入恐慌內(nèi)部爆料在瘋狂分析復(fù)制DeepSeek, 高預(yù)算難以解釋

推薦閱讀

五險和社保一樣嗎

逃跑吧少年鉆石怎么獲得

交口稱贊的意思

60ml防曬霜可以帶上飛機嗎 60ml防曬霜可以帶上高鐵嗎

aj怎么看真假 aj如何看真假

無錫穩(wěn)崗返還申請條件+流程+時間

外國人為什么在水里生孩子

恢復(fù)6233的手機通訊錄的一些經(jīng)驗

威朗曲軸皮帶盤如何拆裝

過時不候歌詞是什么

釣回來的鯉魚能養(yǎng)幾天

波爾多紅怎么調(diào)色汽車波爾多紅怎么調(diào)配

味精主要呈鮮物質(zhì)是什么，味精的主要呈鮮物質(zhì)是什么？

什么是透水石透水石是什么東西

去除戈上的銅銹

華為p9和三星s7哪個拍照好,r9s哪個拍照更好