
【TechWeb】3月6日消息 , 近日 , 高德地圖正式推出全球首個由大模型驅動的“視覺認知步導”系統——地標AI領航 , 該系統深度融合千問大模型、億級POI與千萬級街景圖像 , 讓導航系統首次具備了“視覺認知與人類語言理解”的空間智能感知能力 。
【高德發布全球首個由大模型驅動的視覺認知步行導引系統】在導航場景中 , 用戶常常面臨三個主要痛點:起步時方向感模糊、對距離與步行進度缺乏直觀感知、到達目的地附近仍無法確認準確終點 。
高德基于多模態人機交互、地理語義理解與生成式AI應用上的突破 , 推出了更符合人類指路習慣的視覺認知導航 , 有效解決了上述痛點 , 為用戶提供零認知負擔的“直覺式行走”體驗 。
人類在日常指路時常用“在那邊”“走那條路”“穿過紅色建筑”“下個路口有排餐飲店”等表達方式 , 通過融入當前環境的地標參考 , 讓路線信息更明確 , 其核心依賴“方向語義+地標錨定+上下文感知”的認知邏輯 。 導航工具若要達到人類語境下的指路效果 , 首先需要構建覆蓋真實世界、可聽可視的地理語義網絡 。
為此 , 高德地圖基于三大核心能力 , 建立導航系統對空間關系的深度理解:超億級POI數據庫、高精度步行路網拓撲 , 以及覆蓋全國大部分城市及景區的千萬級高精街景圖像 。 結合千問的多模態能力 , 系統可識別交通設施、商鋪、地標建筑等實體 , 并評估其視覺顯著性 , 從而生成更符合人類習慣的自然語言描述 。
真實場景中 , 并非所有POI都適合用于指引 , 地標不清、提示不準會導致用戶拿不準“第幾個路口轉”“何時該提醒” 。 為提升指引有效性 , 高德地標AI領航采用“雙重篩選”:一是時空關鍵節點篩選 , 僅在起點、轉彎、偏航及臨近終點等決策點播報;二是顯著感知篩選 , 優先選擇更醒目、更易識別的參照物 , 如地鐵標識、銀行大牌、餐飲招牌等 。
同時 , 播報文案采用更口語化、具象化的表達 , 突出顏色、形態與相對位置(如“左側第二個玻璃門”) , 并根據場景動態調整詳略 。 實測顯示 , 用戶在聽到視覺地標提示后 , 平均比傳統導航快2秒確認正確路徑 , 減少看手機頻次 , 進一步降低老人、親子家庭、游客及注意力易分散人群的步行出行門檻 。 (周小白)
推薦閱讀
- 存儲漲價波及全行業,全球手機面板出貨下滑,vivo3月15日起全系提價
- FlashAttention-4正式發布:算法流水線大改,矩陣乘法級速度
- 炮火,AI,全球飄零:逆潮中的伊朗開發者
- 10098元起!海信發布四筒洗衣機:首創集成洗鞋機
- 高通Akash:2029年6G正式商用 高通攜手全球伙伴共推技術落地
- 后置自拍外掛,影石發布Snap手機自拍屏
- 比HBM4快60%,全球最快 HBM4E 控制器研發成功!
- 海信發布UX2026款RGB-Mini LED電視 畫質提升超想象
- 高德納:「震驚!震驚!」Claude破解《計算機程序設計藝術》難題
- 叫板OLED畫質?海信UX 2026款發布,參數堆料太狠了
