Kimi沒有DeepSeek的命

2026-05-03 創投圈電腦創業 ai 軟件

文章圖片

2024或許你還記得，在并不遙遠的2024 年， Kimi是中國AI當紅炸子雞：10億美金融資、Kimi概念股多次漲停、200萬字輸入碾壓GPT、激進的投流推廣策略。
但他們當時獲得的曝光度，遠超自己的技術影響力。
事實上，那個200萬字的模型，后來能用到的人微乎其微。后來了解到，那是個實驗性模型，每次運行成本接近 3 位數，完全不具備大規模服務用戶的可能性。
那時的技術圈，對 Kimi 是不屑一顧的。
但是靠著200萬字的噱頭， Kimi還是站住了「長文本」標簽和用戶心智。
20252025 年初， DeepSeek 橫空出世，真正靠技術實力成為中國AI技術的代言人。
到了 2025年中， Kimi 已快一年沒任何融資的消息。被「唱衰」成為主旋律，員工開始流失，業內基本給這個創業項目判了死刑。
如果你從2025年年中開始，閉關了 9 個月，到2026年3月看到新聞：

Kimi 最新估值 1200 億；
Kimi 20 天收入超過去一年；
Kimi的模型被3500億估值的最火AI編程工具Cursor套殼并實錘（你閉關了9個月，所以不知道最火的AI編程工具已經是 Claude Code了， Cursor已成老二）；
Kimi新模型被承載了互聯網20%流量、市值超過 5000 億Cloudflare引入為主力模型；
Kimi新模型成為全球最大獨立AI搜索應用Perplexity唯一引入的開源模型和中國模型；
Kimi新技術「注意力殘差」開始改造深度學習架構10多年來的地基，并得到前OpenAI的聯合創始人Andrej Karpathy、OpenAI推理模型之父 Jerry Tworek 以及馬斯克稱贊；
楊植麟成為英偉達2026 GTC年度大會唯一受邀做演講的全球獨立大模型公司代表……

你很可能會驚掉下巴。
大家說「AI 一天，人間一年」， AI 領域 9 個月確實發生了很多事情。
但歸根結底是一件事情， AI技術的范式發生了變化。這個變化最常見、最偷懶的概括是從 Chat 到 Agent 。
對全世界的 3000萬程序員來說，變化是，最受推崇的工具從Cursor 變成 Claude Code 。
對總是率先擁抱新技術的 early adopter 來說，變化是更頻繁地打開那個類似 DOS 系統的黑白命令行終端……
對AI公司來說，變化是大家陸續發現：更會聊天的模型，遠不如會寫代碼和調用工具的模型有價值。
最酷的產品從ChatGPT變成Claude Code ，最酷的創業公司也從 OpenAI 變成了 Anthropic 。
回到 2025 年初的中國市場。
DeepSeek R1 因為復刻并開源了 OpenAI o1 的「深度思考」能力爆火，另一個「通用 Agent」產品 Manus 也橫空出世……
彼時的中國AI公司，大多數在忙著復現 DeepSeek R1 ，推出能「深度思考」的新模型。少數公司意識到 Manus 背后的那個模型，才是更值得花資源「復現」的東西。或者意識到了，但沒有分配到足夠的資源，或找到方法。
Manus的一個很大的價值，就是可視化呈現了Claude模型的多輪工具調用能力。正如一位大模型公司的技術專家在自己的博客中寫到，「絕大多數 Agent 產品，離了 Claude 以后，什么都不是。」
直到 2025年7月，中國第一個主打Agent能力的模型才悄然出現。 7月11日， Kimi K2 發布，喊的是 Open Agentic Intelligence 。這里顯然藏著他們的野心：復現 Claude 模型的 Agent 能力，并開源出去。就像 DeepSeek R1 復現 OpenAI o1并開源出去。
發布 5 天后， 7月16日，英國的 Nature 自然雜志發現了這個模型的價值，用「另一個DeepSeek時刻」來形容。
發布10天后， 7月21日， Anthropic聯合創始人Jack Clark在自己的博客中介紹了 K2 ，評價稱：
在我看來， Kimi 是一款還不錯的模型，落后美國最前沿幾個月，延續了 DeepSeek 的軌跡。其編碼和工具調用分數已足夠高，我預計現實中會有人真正用它，因此觀察其采用率能折射競爭力。
7 月底，楊植麟在播客專訪中，解釋了 K2 為什么沒有先做「深度思考」，而是在 Agent 需要的編程和工具調用能力上發力。他用「缸中之腦」來形容主打深度思考的模型。對了，楊植麟這篇采訪值得多看幾遍，他講了很多技術層面更本質的東西，比如編程和Agent的關系，思考和工具調用的關系。
因為 K2 和后續 K2 Thinking 模型的表現， Kimi 的融資在年底終于續上了， 5 億美金， IDG和幾家老股東繼續加持。
20262026 年春節前后，這個瘋狂的大模型發布季， Kimi 是第一個交卷的選手。可能也是讓同行們最難受的一個，因為 K2.5萬億參數、圖片和視頻的多模態理解能力，支持思考和非思考模式。其他創業公司同行發布的都是純文本模型。有實力把多模態能力融入旗艦模型的，只有大廠的閉源模型。
3月16號， Kimi團隊發布了Attention Residuals的技術論文，挑戰已有 10 年歷史的神經網絡底層殘差連接機制。 OpenAI的聯合創始人Andrej Karpathy銳評Kimi「讓我們意識到根本沒有把Attention is All You Need理解透徹」，要知道， Attention is All You Need就是開啟大模型時代的圣杯，哪怕考慮到AI圈的通詞膨脹，這個評價也是前所未有的高。據說，論文第一作者是一位僅 17歲的高中生，天才出少年，真是令人感慨。
3月17號， Kimi 模型繼年初的 CES 2026 之后，在黃仁勛的 GTC 2026 主旨演講中再度成為英偉達展示下一代芯片和推理性能的御用模型。

3月18號，作為英偉達的GTC年度大會唯一受邀的中國獨立大模型公司代表，楊植麟的現場演講全是干貨，上來就把優化器、注意力機制、殘差連接三大核心模塊比作有8-11年歷史的陳舊技術標準，是繼續Scaling的障礙，用新的技術突破表明「每一項基礎技術都值得重新思考」。
然后是這幾天人盡皆知的「Cursor丑聞」，誰能想到，估值500億美金的全球最大編程助手Cursor ，重磅推出的新一代編程模型Composer 2——跑分超過Claude Opus 4.6——竟然是套的Kimi K2.5的殼??
身為Token中介定位的Cursor之所以要發力「自研」，主要還是為了擺脫它對Anthropic和OpenAI的高度依賴，卡脖子這事兒可不分國界， Anthropic也真的曾經斷供Windsurf這類編程工具，在既當裁判員又當運動員的環境下， Cursor希望獨立自主的心情，完全可以理解。
只是能力和愿景之間的巨大鴻溝，讓Cursor選擇了抹掉來自Kimi的底座模型名字，靠代筆求融資，事情最后也算是體面收場， Cursor的聯合創始人公開道歉，在技術報告中給除了選擇 Kimi K2.5 作為底座模型的詳細理由，而Kimi官方也回應表示，很高興Cursor使用Kimi K2.5作為基座，雙方通過推理服務商 Fireworks AI 做了技術授權。
根據小道消息，2026 年春節前后， Kimi 陸續以投前 48 億美元、60 億美元、100億美元的估值完成總額近 20 億美元的融資， 3月份開啟的 180 億美元輪次份額也要排隊才能拿到。
這當然也受益于兩個同行在港股的超常表現，但更重要的還是靠自己的 K2和后續的模型實際表現，包括前文題庫的 Cursor、Cloudflare、Perplexity、黃仁勛、馬斯克、馬克·安德森、查馬斯等不斷發來的「金水」，以及K2.5發布后20天收入超過過去一年的財務表現。
一位 Kimi 的朋友在私下聊天里說，制約業務發展的只有算力，現在至少還有 10 倍的需求沒有滿足。有多少卡，就能有多少收入。據我跟另一個大廠工作的朋友了解，現在有些大廠在編程工具中接入的Kimi模型，甚至要通過預購才能拿到足夠的額度。
這 9 個月， Kimi 算是完成了一次逆天改命。
命DeepSeek V3不是一天煉成的。其背后的幻方量化基因，決定了他們從 2023 年起就走上了一條與硅谷截然不同的極致能效比之路。在 2023 到 2024 年的大部分時間里，他們游離于主流敘事之外，潛心自研 MLA（多頭潛在注意力機制）與 DeepSeekMoE 架構，試圖在有限的算力下壓榨出超越物理極限的性能。直到 2025 年成就自己，也給其他AI創業公司帶來信心。
所有人都在期待 DeepSeek 的下一代模型繼續驚艷全場，但媒體上三番五次的「狼來了」把戲只會消磨大家的注意力。技術突破，哪是那么容易的事情，我們完全有理由更有耐心地等待 DeepSeek 團隊的下一個作品。
Kimi K2 也不是一天煉成的。他們實際上跟 DeepSeek R1同一天發布了無人問津的K1.5模型，被OpenAI官方認為是率先復現o1的兩個公司之一。他們在被唱衰最厲害的2025年初發布了Moonlight系列小型MoE模型，用來驗證下一代二階優化器技術，并且最終應用到萬億的K2模型上。現在Muon已取代已經用了10年的標準技術Adam ，成為Kimi、GLM-5、DeepSeek Engram在內的新模型都開始采用的新標準。
正所謂，「出來混，總要還的。」Kimi 在2024年提前享受了C位和曝光， 2026年沒再復現該屬于自己的流量。
各有各的命。
【Kimi沒有DeepSeek的命】作為兩家幾乎同時起步的創業公司，我佩服他們那種從來不認為市場格局已定、相信技術才是最大變量、敢于追逐AGI 的勇氣和年輕生猛、戰績可查、永遠相信細水長流的力量。
即使站在 2026年3月底這個時間節點看， 2022年底開始的這場AI革命也才進行了3年半的時間，一切才剛剛開始。為什么下一個 OpenAI 和 Anthropic 不能是一家中國公司？

推薦閱讀

上一篇：曾讓N卡追不上！AMD雙核卡皇HD 6990發布15周年：為啥雙GPU消失了

下一篇：操作很到位！219g+9000mAh！紅米直接實現電量自由