國產模型開源震撼老外,谷歌Genie 3緊急跟進?海外AI圈炸了

國產模型開源震撼老外,谷歌Genie 3緊急跟進?海外AI圈炸了

文章圖片

國產模型開源震撼老外,谷歌Genie 3緊急跟進?海外AI圈炸了

文章圖片


【國產模型開源震撼老外,谷歌Genie 3緊急跟進?海外AI圈炸了】【TechWeb】最近AI圈的一大看點 , 莫過于螞蟻靈波和谷歌的“開源接力” 。
先是螞蟻靈波密集出手 , 從1月27日開始 , 四天連續開源四大核心模型 , 其中可對標谷歌Genie 3的開源世界模型LingBot-World一經發布 , 谷歌火速跟進 , 于1月30日面向特定用戶開放世界模型體驗平臺Project Genie 。
這場前后腳的動作 , 瞬間引爆全球AI社區 , 相關話題全天占據X熱門榜單首位 。 螞蟻牽頭開源世界模型為啥能引起這么大的反響 , 讓老外都直呼“Amazing”?
螞蟻撕開缺口 海外AI圈炸鍋
在海外社交平臺 , 螞蟻LingBot-World的Demo一放出 , 即吸引到不少海外網友瘋狂打call , 直呼這個來自中國的模型太震撼了 。
從畫面呈現來看 , LingBot-World視覺效果已經可以做到與谷歌推出的Genie 3不相上下 , 但時間維度明顯更長 。
據了解 , LingBot-World能做到近10分鐘連續無損生成 , 物體特征、場景邏輯始終保持一致 , 就像真實世界一樣穩定 。
而且LingBot-World生成的視頻不僅能看 , 還可以深度參與其中 。 你可以通過鍵盤或鼠標操控角色與相機視角 , 畫面隨指令即時反饋 。
你還能以文本指令觸發天氣、風格等環境變化 , 且在鏡頭最長移動60秒返回后 , 目標物體仍能保持物體結構和外觀的一致性 。
整個過程 , 端到端交互延遲控制在1秒以內 , 也就是說 , 你操作后 , 世界立刻會有反應 。 生成幀率約16 FPS , 畫面流暢不卡頓 。
值得一提的是 , 該模型具備Zero-shot泛化能力 , 只需要輸入一張真實照片(如城市街景)或游戲截圖 , 就可以生成可交互的視頻流 , 無需再針對單一場景進行額外訓練或數據采集 , 從而解決具身智能訓練成本高、泛化能力弱的行業核心痛點 。
長期以來 , 全球高端AI模型多走閉源路線 , 谷歌、OpenAI等巨頭牢牢把控核心技術 , 形成行業壁壘 。 如果學術界和初創公司想訓練一個高質量的世界模型 , 門檻是極高的 。
而螞蟻LingBot-World的發布 , 讓大家看到 , 中國也有SOTA級的世界模型 , 而且還是開源的 。 德國頭部財經網站AdHocNews評價稱 , “螞蟻集團發布了名為 LingBot-World 的高質量機器人AI模擬環境 。 這家中國科技公司完善了一套完整的開源工具包 , 用于物理AI系統的開發 。 這也是在全球機器人領域主導權爭奪戰中的一項戰略性舉措 。 ”
還有行業專家直言 , “這對整個行業都是變革 , 此前這類訓練環境通常是專有的 , 成本昂貴 。 現在 , 每位開發者都能接觸到工業標準技術 。 ”
有意思的是 , LingBot-World在X上發布后 , 谷歌就宣布開源體驗平臺Project Genie , 部分用戶可以試用Genie 3 。
兩大巨頭先后官宣 , 世界模型開源開放的窗口被打開 , 海外社區反響熱烈 , 相關話題全天占據X熱門榜單首位 , Reddit多個AI子社區將其列為Top 1熱帖 。
四大開源模型齊亮相 具身智能“全能工具箱”有了
螞蟻靈波在開源世界模型LingBot-World之外 , 還相繼開源了高精度空間感知模型 LingBot-Depth、具身大模型LingBot-VLA和具身世界模型LingBot-VA 。 這四大開源模型并非孤立存在 , 而是層層遞進 , 構建起從“感知”到“行動”再到“認知”的完整技術鏈條 , 實現從虛擬預訓練到真實世界部署的無縫銜接 , 解決具身智能 “訓練成本高、泛化難、執行偏差” 等核心挑戰 。
其中 , LingBot-Depth相當于機器人的“眼睛” , 主攻透明反光物抓取這一行業痛點 , 能幫助機器人更精準地識別物體三維空間關系 。 螞蟻還與奧比中光深度合作 , 后者計劃基于LinBot-Depth打造了新一代深度相機 。
LingBot-VLA相當于機器人的“通用大腦” , 基于20000+小時真實機器人操作數據訓練而成 , 能同時適配9種主流雙臂機器人構型 , 實現“一腦多機” , 從而緩解具身智能模型落地面臨的泛化性問題 。 這也是螞蟻開源的第一款具身智能基座模型 。
LingBot-World相當于機器人的“數字訓練場” , 為具身智能、自動駕駛、游戲開發提供低成本的虛擬訓練環境 。
LingBot-VA則將大規模視頻生成模型與機器人控制深度融合 , 讓機器人能夠像人一樣“邊推演、邊行動” , 打通世界模型到物理執行的最后一公里 。 真機評測中 , LingBot-VA在多項高難操作任務上性能超越業界標桿Pi0.5 。
寫在最后:
螞蟻靈波四大模型的全鏈條開源 , 對其自身、行業乃至全球格局來說 , 都有著不小的影響 。
此前 , 高端AI模型的研發和使用門檻極高 , 中小企業和初創公司因資金、算力不足 , 難以涉足前沿領域 。 螞蟻的開源舉措 , 相當于免費向全球開發者開放工業級技術工具包 , 讓開發者無需從零造輪子 , 僅憑消費級硬件就能部署和微調模型 。
特別是世界模型 , 于全球格局而言 , 螞蟻率先撕開了高性能世界模型閉源缺口 , 展現了國產AI的技術實力 , 谷歌同期調整策略 , 世界模型賽道從封閉競爭轉向開放協同 。
開源普惠 , 不僅激活了中小企業的創新活力 , 更讓AI技術從少數巨頭專屬走向全民共享 , 加速技術迭代速度 。 也讓螞蟻在具身智能、世界模型賽道確立了先發優勢 。
這不僅是一次技術的突圍 , 更標志著在具身智能的下半場 , 中國科技公司正試圖用“開源定義標準”的新范式 , 重寫全球 AI 創新的游戲規則 。 2026 , 好戲正在上演 。

    推薦閱讀