去他的龍蝦,千問有自己的節奏

去他的龍蝦,千問有自己的節奏

文章圖片

去他的龍蝦,千問有自己的節奏

文 | 闌夕
在全民「養豬」龍蝦的熱潮尾聲 , 千問宣布實裝了「AI打車」的skill , 對比起來 , 有種未來主義向現實主義回歸的基本常識 。
從排隊安裝到付費卸載 , 短短十來天的時間 , OpenClaw在中文互聯網就走過了從入門到入土的全生命周期 , 著實抽象 。
除了鋪天蓋地的FOMO之外 , 缺少使用場景其實是被廣泛忽略的最大問題 , 在費盡心力的完成配置完之后 , 對著命令框 , 大多數人可能依然處于腦子一片空白的狀態 , 不知道讓它做什么好 。
最后只好安排龍蝦給自己做個新聞簡報之類 , 姑且不論這個活兒其實主流AI助手都能辦到 , 燒掉幾十萬Tokens就為了證明自己用上了龍蝦 , 代價未免也太高了 。
這就是我反復說過的 , 如果你不是已經把AI助手的能力榨取到了極限 , 極限到它已經無法滿足你的需求——要知道 , 連頂級數學家陶哲軒也都還在使用網頁版的ChatGPT——否則其實就用不上那些工程化的新品 。
何況AI助手本身也在工程化 , 打個不恰當的比方 , 在撒腿跑步之前 , 先學會好好走路 , 可能才是AI連接普通用戶的最好路徑 。
怎么說呢 , 看多了拔苗助長的行業躁動 , 千問繼續擴大辦事能力半徑的做法 , 反而更加顯得眉清目秀起來了??
打車當然是辦事的 , 但它和點奶茶、買東西不太一樣的是 , 帶有更大的非標性 , 和更低的容錯率 。
AI幫買奶茶 , 如果點錯了或者買少了 , 對于用戶來說固然糟心 , 但也不是完全不能接受 , 但AI幫忙打車 , 把目的地選錯了 , 甚至耽誤了航班 , 必然引起「天塌了」級別的暴怒 。
而且 , 打車的變量不止是起點和目的地 , 千問能做的事情 , 還有「不要臭車」「30塊以內」「定時預約」這些個性化需求的滿足 , 確保言出法隨的體驗 。
我自己就模擬出了一整套通勤流程 , 由于平時就是高德地圖的高頻用戶 , 有了家和公司的預設地址 , 可以說不存在任何遷移成本 , 甚至半路想起來要買東西的臨場需求 , 千問都能一一實現 。

下班也是一樣 , 對用戶意圖的識別和匹配相當精準 , 包括付款在內的整個流程都不需要跳轉其他APP 。

工程學的難度及其原理在于 , 流程可以做加法 , 結果卻是做乘法 , 每個步驟的成功率是95% , 看起來很高 , 十個步驟連在一起 , 成功率就連60%都不到了 。
這也是為什么我對千問死磕辦事的評價一直很高 , 因為它是真的在以一己之力推動AI在真實世界贏得用戶信任這件事情 。
當AI變得越來越油——在指出它犯了錯誤之后 , 「你說得對」成了它屢教不改的開場白——這反而強化了AI在通用場景里只適合完成開放性任務的刻板印象 , 但凡對準確度有所要求 , AI的可信度就急劇下降 。
所以才有「人工智能不如能工智人」的段子??
而千問正式上線以來的每一步 , 都是在把AI從近乎無限的免責區拉出來 , 拒絕延續「它還是個孩子」的寵溺 。
重要的是 , 千問想做成的事情 , 向下有多扎實 , 往上就有多壯麗 。
ChatGPT也能調用Uber , 但是只有用了之后 , 才知道距離「一句話打車」的理想體驗有多遙遠:
必須指名Uber的應用 , 必須完整寫出明確指令——少一個字都不行——必須跳轉到Uber的App里完成下單 , 整個過程充滿了「脫褲子放屁」的多余感 。
這當然不是模型不中用 , ChatGPT再怎么強大 , 它也無法去管理Uber的運行數據 , 兩款產品通過有限的接口互通 , 博弈下來的成果就是 , AI依然只能在它的「一畝三分地」里行動 , 只要涉及到第三方應用的 , 就還是要把流量和履約都挪過去 。
也確實是難為AI了 , 模型的智商再高 , 也處理不了這些復雜的人情世故啊??
而千問能夠擺平同樣的問題 , 原因還是在于阿里的自有生態足以支持服務供給 , 而且不光是客觀上「有」 , 更得是主觀上「能」 。
無論是用千問點奶茶也好、打車也好 , 響應的都是阿里自家生態產品 , 此時發揮出來的體制優勢 , 或者說「集中力量辦大事」的戰略高度 , 讓阿里不必重復OpenAI的窘迫 。
從千問已經能夠支持的混合任務來看 , 阿里是真的把入口做了「AI優先」的重新設計 , 可以一句話打車 , 不代表只能一句話打車 , 事實上 , 用稍微復雜的表達 , 讓千問先訂電影票、然后以規劃時間為前提去幫打車、最后在電影結束后預約一輛回家的車 , 都是可以實現的 。
而在這個過程中 , 檢驗的不只有模型自身的能力 , 還有千問對于工具的使用 , 它能像人一樣 , 去地圖里查看路線 , 去計算合理的日程 , 去預判網約車的接送時間 。
還是那句話 , 但凡錯一項 , 給用戶體驗的損傷 , 都是毀滅級的 。
這才是隨著千問的一次次升級 , 創造出來的開創性價值 , 它在做的事情 , 同行要么避而遠之 , 要么舉步維艱 , 對阿里來說也不可能立刻帶來特別突出的經濟效益 , 但千問偏要把這塊硬骨頭給啃了 , 不為別的 , 就是任性 。
這會讓人想到1923年「紐約時報」追問登山家喬治·馬洛里為什么堅持要冒著生命危險去爬珠穆朗瑪峰時 , 后者甩出來的那句言簡意賅的回答:
「因為山在那里 。 」
是啊 , 山就在那里 , 作為一個職業的登山者 , 是不可能騙自己沒看到的 。
如果阿里真的相信AI是當代正在發生的工業革命這個敘事 , 真的相信千問模型是開源之光、是能和頂級模型打得有來有回的資質 , 那么承擔為整個AI行業向前探路的使命 , 也就是一種必然 , 而不是選擇 。
從買一杯奶茶 , 到打一輛車 , 千問在逐漸打出產品心智的同時 , 還在落實著AI之于主流用戶的安全性 。
這里的安全性 , 在于放心委托AI替自己辦事 , 第一次可以是嘗鮮 , 第十次、第一百次就是習以為常的生活方式了 。
所有的技術進步 , 遲早都要邁過這一步 , 現在的年輕人可能不知道 , 當計算器和電子秤最初被應用到菜市場等場景后 , 很長一段時間里 , 消費者不會輕信機器上顯示的數字 , 一定要自己心算過一遍才踏實 。
也許 , 當下看過去有多滑稽 , 未來看當下就有多著急 。
就像「阿瑪拉定律」所說的:「我們總是高估一項科技所帶來的短期效益 , 卻又低估它的長期影響 。 」
AI是一個過度炒作的行業嗎?很難否認 。
誠實的說 , 正是因為許諾的太多 , 實現的太少 , 以致于前沿與大眾之間的割裂感過于嚴重 。
但也有千問這樣 , 一步一個腳印的 , 把吹過的牛逼挨個實現的產品 , 并在長期的尺度上 , 對齊AI的智力和行動力 , 這就夠了 。
【去他的龍蝦,千問有自己的節奏】凡是過往 , 皆為序章 。

    推薦閱讀