ClawBench大模型榜單發布:小米字節等四款模型躋身全球前十

ClawBench大模型榜單發布:小米字節等四款模型躋身全球前十

太平洋科技快訊】3 月 30 日 , 評測機構ClawBench 發布了最新大型模型榜單 。 北京人工智能企業智譜、字節、小米共有 4 款模型躋身全球前十 。
【ClawBench大模型榜單發布:小米字節等四款模型躋身全球前十】榜單顯示 , 智譜 GLM-5-Turbo 以 93.9 分獲得全球第一;字節跳動旗下豆包模型 Doubao-Seed-2.0-lite 位列全球第二 , 同時在全榜單中使用成本最低;小米 MiMo-V2 系列兩款模型成功上榜 , 其中 MiMo-V2-Omni 位列第九 , 在運行速度上表現領先 。
今日 , 小米方面透露 , MiMo-V2-Pro 在復雜邏輯推理、長指令遵循、多輪對話穩定性等維度表現穩健 , 在 Model Rank 排名中位居全球第五 。 在反映實驗室綜合研發能力的 LabRank 體系中 , 小米在 Text Arena(ArenaExpert)位列全球第四 , Code Arena 位列全球第五 , 綜合實力僅次于 Anthropic、OpenAI 與谷歌 。
據介紹 , ClawBench 關聯的 Text Arena 榜單采用雙盲測試機制 , 在隱藏模型身份的前提下 , 由全球真實用戶依據回答質量直接投票 , 有效避免針對數據集優化的 “刷榜” 現象 , 評測結果更貼近實際使用體驗 。

    推薦閱讀