日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

又黑又紅的Manus,還要闖三道關(guān)

又黑又紅的Manus,還要闖三道關(guān)

文章圖片

又黑又紅的Manus,還要闖三道關(guān)

文章圖片



定焦One(dingjiaoone)原創(chuàng)
作者 | 王璐
編輯 | 魏佳
“AI一天 , 人間一年” 。
3月6日凌晨 , Manus亮相 , 瞬間點(diǎn)燃了整個(gè)科技圈 。 它被稱為全球首款通用型AI Agent(人工智能代理)產(chǎn)品 , 由國(guó)內(nèi)一家創(chuàng)業(yè)團(tuán)隊(duì)——Monica.im打造 。 但這場(chǎng)技術(shù)狂歡 , 迅速陷入爭(zhēng)議旋渦 。 發(fā)布僅兩天 , Manus的口碑經(jīng)歷了數(shù)次劇烈反轉(zhuǎn) 。
Manus官方將自己定義為一款連接思維與行動(dòng)的通用人工智能代理 , 特點(diǎn)是擅長(zhǎng)處理各種任務(wù) , 不僅能思考(聽懂復(fù)雜指令進(jìn)行推理) , 還能交付成果(順滑對(duì)接完成該任務(wù)的各個(gè)環(huán)節(jié) , 將最終結(jié)果給到用戶) 。
舉個(gè)簡(jiǎn)單的例子 。
如果讓Manus篩選簡(jiǎn)歷 , 用戶只需將存有多份簡(jiǎn)歷的壓縮包直接發(fā)給Manus , 剩下的任務(wù)就全部交由它完成 。 Manus會(huì)自動(dòng)解壓縮文件 , 瀏覽找出重要信息 , 給出候選人評(píng)估結(jié)果 , 還可以將候選人姓名和重要信息做成表格 , 方便用戶查閱 。
在此過程中 , 用戶不僅可以關(guān)閉電腦 , 還能隨時(shí)添加其他任務(wù) 。
有了Manus , 普通HR的日常工作似乎變得“多余” 。 這也讓許多人驚呼 , 取代打工人的“AI牛馬”真的來了 。
不過 , Manus屬于“黑紅”體質(zhì) 。
發(fā)布之初 , 它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名頭 , 風(fēng)光無限 。 不久后質(zhì)疑聲接踵而至 , 有人認(rèn)為它過度營(yíng)銷 , 技術(shù)沒有太大突破實(shí)為“套殼” , 噱頭遠(yuǎn)大于實(shí)際能力 。
緊接著 , 其內(nèi)測(cè)邀請(qǐng)碼被炒到10萬(wàn)元天價(jià)的消息傳出;它在X平臺(tái)上的官方賬號(hào)被凍結(jié) , 顯示原因?yàn)椤斑`反平臺(tái)規(guī)則” 。 隨后 , Manus聯(lián)合創(chuàng)始人兼首席科學(xué)家季逸超公開回應(yīng)稱 , 賬號(hào)被凍結(jié)可能與第三方提及加密貨幣詐騙有關(guān) , 該領(lǐng)域與Manus的運(yùn)營(yíng)完全無關(guān) 。
這一系列事件 , 更加深了外界對(duì)Manus的疑慮 。 這款備受矚目的產(chǎn)品 , 究竟是真正的技術(shù)革新 , 還是營(yíng)銷噱頭?未來又能火多久?
爭(zhēng)議中的Manus , 真有實(shí)力還是套殼工具?Manus爆火兩天 , 外界對(duì)它的評(píng)價(jià)極為兩極分化 。
一部分人覺得Manus讓AI Agent又上了一個(gè)臺(tái)階 , 馬上就要搶走打工人的飯碗 , 也有一部分人認(rèn)為它只是個(gè)套殼工具 。
來看它“封神”的點(diǎn) 。
相比市面上已經(jīng)出現(xiàn)AI Agent(比如豆包、文小言都內(nèi)置了很多智能體) , Manus的優(yōu)點(diǎn)之一在于 , 處理復(fù)雜任務(wù)時(shí)具備自主性、連續(xù)性 。
比如用戶只需給出一段比較詳細(xì)的提示詞 , Manus便能自主解讀、拆解并給出結(jié)果 , 還能進(jìn)行自我檢查 , 省去了一步步的對(duì)話引導(dǎo)步驟 。
由于Manus是基于云端異步運(yùn)行 , 用戶下達(dá)完指令后關(guān)閉頁(yè)面都不會(huì)影響Manus處理指令 , 任務(wù)完成后還會(huì)自動(dòng)通知用戶結(jié)果 。
Manus的另一大亮點(diǎn) , 是號(hào)稱全球首款通用型AI Agent產(chǎn)品 。
需要注意的是“通用”二字 , 指它能夠處理各種各樣的任務(wù) , 不限任何領(lǐng)域 , 比如支持篩選簡(jiǎn)歷、房產(chǎn)調(diào)研、股票分析等多場(chǎng)景 。

然而 , 對(duì)于這兩大亮點(diǎn) , 也存在著不少質(zhì)疑的聲音 。
首先 , 由于Manus處于內(nèi)測(cè)階段 , 采用邀請(qǐng)碼制度 , 大多數(shù)用戶尚未真正使用過該產(chǎn)品 , 目前對(duì)其“驚艷”的評(píng)價(jià)大多源自官方發(fā)布的演示視頻 。 鑒于過往許多AI產(chǎn)品都存在“樣片水平大于實(shí)際實(shí)力”的情況 , 部分從業(yè)者認(rèn)為Manus的真實(shí)能力有待進(jìn)一步考量 。
其次 , 對(duì)于Manus的“通用性” , 部分從業(yè)者認(rèn)為 , 存在套殼嫌疑 。
有從業(yè)者評(píng)價(jià) , Manus沒有自研底層大模型的能力 , 其模型能力主要來源于國(guó)外Anthropic的Claude 。 而且 , 很多場(chǎng)景和功能早已在其他Agent中實(shí)現(xiàn) 。 比如 , Devin作為全球首個(gè)AI程序員 , 也是一個(gè)能獨(dú)立完成寫代碼任務(wù)(學(xué)習(xí)新技術(shù)、調(diào)試代碼到部署應(yīng)用程序)的AI Agent , 在去年年底便面向公眾開放 。
從這個(gè)角度來看 , Manus更像是給現(xiàn)有的各類AI應(yīng)用加了個(gè)殼子 , 把DeepResearch(OpenAI推出)、Computer Use(Anthropic推出)等應(yīng)用匯總了起來 。
AI軟件工程師覃相告訴「定焦One」 , Manus是基于現(xiàn)有大語(yǔ)言模型的調(diào)用 , 并未涉及底層技術(shù)突破 。 比如在進(jìn)行股票分析時(shí) , Manus通過調(diào)用雅虎金融API獲取數(shù)據(jù) , 再借助編程語(yǔ)言生成可視化圖表 , 依賴的都是現(xiàn)有的技術(shù)和工具 。
參加了Manus閉門分享會(huì)的AI博主自動(dòng)華也對(duì)「定焦One」表示 , 制作團(tuán)隊(duì)分享了Manus作為AI員工主要做的三件事:配電腦(賦予AI訪問瀏覽器和工具的能力)、配權(quán)限(接入私有API和權(quán)威數(shù)據(jù)源)、給培訓(xùn)(用戶可以通過反饋實(shí)時(shí)調(diào)整AI行為) 。
可見 , Manus本質(zhì)上是將各種工具進(jìn)行拼接 , 其能完成跨應(yīng)用這類復(fù)雜任務(wù) , 依賴的是Claude模型 , 以及接入的各類智能體工具 。
至于“套殼”“拼接”是否算作創(chuàng)新 , 業(yè)界觀點(diǎn)不一 。 支持者認(rèn)為 , 這種整合方式能夠快速實(shí)現(xiàn)多種功能 , 為用戶提供一站式解決方案 , 具有一定的實(shí)用價(jià)值;反對(duì)者則認(rèn)為 , 這種模式只是基于現(xiàn)有技術(shù)進(jìn)行簡(jiǎn)單組合 。
但從業(yè)者基本都認(rèn)同 , 從技術(shù)維度上看 , Manus還遠(yuǎn)稱不上是下一個(gè)DeepSeek 。
如何正確看待Manus?比起技術(shù) , Manus走紅的關(guān)鍵在于用戶體驗(yàn) 。
減少了操作步驟 , 執(zhí)行過程中不用反復(fù)和AI對(duì)話 , 還可以關(guān)閉界面 , 這都是過往AI Agent產(chǎn)品所不具備的 。
自動(dòng)華認(rèn)為 , AI Agent的意義在于幫助普通人提效 , Manus重新定義了AI應(yīng)用的價(jià)值指標(biāo) , 由重視DAU(用戶留存)變到AHPU(Agentic Hours Per User , 用戶使用AI完成任務(wù)所耗費(fèi)的時(shí)間) 。
“正是這樣的benchmark(可簡(jiǎn)單理解為評(píng)估指標(biāo)) , 決定了產(chǎn)品優(yōu)化路線 , 讓Manus和市面上其他AI Agent產(chǎn)品有了區(qū)別 。 ”自動(dòng)華表示 。
他解釋 , 傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品都是“注意力經(jīng)濟(jì)” , 希望占據(jù)用戶更多的使用時(shí)間 , 最終通過廣告變現(xiàn) , 所以將五花八門的垂類Agent放到了產(chǎn)品中 。
Manus的定位是通用型AI Agent , 在執(zhí)行同量任務(wù)情況時(shí) , 試圖讓用戶花的時(shí)間越短越好 , 所以它做了一個(gè)大整合 , 希望用越快的操作方式、越少的操作步驟為用戶提效 。
這與團(tuán)隊(duì)的過往背景有關(guān) 。 Manus背后的團(tuán)隊(duì)在2023年開發(fā)了AI瀏覽器插件助手Monica , 他們發(fā)現(xiàn)瀏覽器作為單用戶場(chǎng)景存在人機(jī)控制權(quán)沖突 , AI頻繁打斷用戶體驗(yàn)的痛點(diǎn) , 由此得出“AI應(yīng)擁有獨(dú)立云端瀏覽器” 。

自動(dòng)華覺得 , 正是由此他們提出了“Less structure more intelligence” , 主張減少對(duì)AI的結(jié)構(gòu)化限制 , 依賴模型自主進(jìn)化能力 , 而非人工預(yù)設(shè)流程 , 才讓Manus區(qū)別于傳統(tǒng) AI Agent 。
這也是大部分用戶對(duì)Manus感到興奮的點(diǎn) 。 覃相將Manus比作“數(shù)字代理人” , 能自動(dòng)拆解復(fù)雜指令、替用戶完成多個(gè)任務(wù) , 而且執(zhí)行速度快 , 在任務(wù)執(zhí)行和用戶體驗(yàn)上超越了豆包和百度的AI Agent 。
覃相還進(jìn)一步分析Manus核心優(yōu)勢(shì)背后的技術(shù)原理:多代理架構(gòu)、強(qiáng)自主學(xué)習(xí)能力 。
首先 , Manus具備多代理架構(gòu)與任務(wù)分解能力 , 它采用了多智能體系統(tǒng)架構(gòu) , 能夠?qū)?fù)雜任務(wù)分解為多個(gè)子任務(wù) , 并通過不同的智能體協(xié)同完成 。 這種架構(gòu)使其能夠高效處理長(zhǎng)尾任務(wù) 。
其次 , 它具備自主學(xué)習(xí)與記憶功能 , 能夠記住用戶的偏好 , 并在后續(xù)任務(wù)中主動(dòng)調(diào)整策略 。 這種自主學(xué)習(xí)能力使其能夠不斷優(yōu)化任務(wù)執(zhí)行邏輯 , 逐漸從被動(dòng)響應(yīng)轉(zhuǎn)向主動(dòng)服務(wù) 。
不過 , 在速度提升時(shí) , 準(zhǔn)確率也是需要重點(diǎn)考慮的要素 。
Manus官方指出其具有低錯(cuò)誤率 , 在GAIA(一個(gè)專為通用人工智能助手設(shè)計(jì)的基準(zhǔn)數(shù)據(jù)集 , 主要用來評(píng)估 AI的基本能力)中 , 面對(duì)基?。 ㄕ砦募?、数据分斡z⒅械齲ǖ饔肁PI、寫代碼)、復(fù)雜(邏輯推理、多模態(tài)處理)三個(gè)級(jí)別的任務(wù)測(cè)試 , 其分?jǐn)?shù)都超過了OpenAI的DeepResearch , 但低于人類平均正確率92% , 仍不如人腦聰明 。
正如前文所說 , 由于產(chǎn)品還未大范圍鋪開 , 從業(yè)者對(duì)其實(shí)際效果持懷疑態(tài)度 。 很多博主在測(cè)評(píng)中發(fā)現(xiàn) , Manus在處理中等復(fù)雜的任務(wù)時(shí) , 出現(xiàn)了長(zhǎng)耗時(shí)問題;在訪問需要登錄的網(wǎng)站或處理付費(fèi)墻內(nèi)容時(shí) , 也會(huì)出現(xiàn)卡頓 , 還是需要用戶手動(dòng)接管 。
Manus的下一步 , 成本、技術(shù)、市場(chǎng)競(jìng)爭(zhēng)Manus的爭(zhēng)議不小 , 但被捧得很高 。 很多人擔(dān)心 , Manus正式上線后 , 如果實(shí)力與預(yù)期不符 , 很有可能消耗掉DeepSeek為國(guó)內(nèi)AI積攢下來的正向價(jià)值 。
自動(dòng)華告訴「定焦One」 , 在Manus的閉門分享會(huì)上 , 官方也提到了將面臨的一些問題 。 比如未來的產(chǎn)品戰(zhàn)略會(huì)朝著優(yōu)化成本和提升運(yùn)行速度努力 , 同時(shí)他們也在尋找一個(gè)與成本相平衡的商業(yè)化定價(jià)模式 , 所以距離公開上線還會(huì)有一段時(shí)間 。
這些挑戰(zhàn)中 , 成本問題尤為突出 。
“Manus單任務(wù)運(yùn)行成本約2美元 , 雖然僅為競(jìng)品DeepResearch的1/10 , 但相比于豆包的單次任務(wù)調(diào)用回答 , 卻昂貴了非常多倍 。 ”自動(dòng)華表示 , 在他看來 , Manus調(diào)用的算力和生成結(jié)果的質(zhì)量與競(jìng)品存在差異 , 但在目前國(guó)內(nèi)大模型產(chǎn)品普遍免費(fèi)的背景下 , 這種AI一次性完成高質(zhì)量結(jié)果對(duì)應(yīng)的付費(fèi)模式 , 還有待探索 。
目前 , 大多數(shù)普通用戶為AI產(chǎn)品付費(fèi)的意愿較低 , 盡管是功能強(qiáng)大的AI軟件工程師Devin , 高昂的月費(fèi)(500美元)導(dǎo)致使用它的人很少 。
這也是Manus需要邀請(qǐng)碼才能使用的重要原因 。 從業(yè)者認(rèn)為 , 官方之所以不全面放開使用權(quán)限 , 一方面可能是“饑餓營(yíng)銷” , 但更重要的是 , 要考慮商業(yè)價(jià)值和成本的平衡 。

用戶多了很有可能導(dǎo)致算力跟不上 。 “Manus的底層是依靠大模型能力 , 算力緊張可通過加顯卡解決 , 但很多公司支付不起背后高額的成本 , 特別是Monica還是一家創(chuàng)業(yè)公司 。 ”自動(dòng)華表示 , Kimi在剛推出市場(chǎng)時(shí)也遭遇過類似問題 , 也沒有輕易選擇加顯卡 。
其次 , 當(dāng)前AI Agent還做不到像人類一樣聰明 , 解決問題的能力相對(duì)有限 , Manus也同樣面臨著這一問題 。
比如 , 最容易出現(xiàn)的情況是對(duì)用戶問題理解不清晰 , 同一個(gè)問題反復(fù)問AI Agent好幾遍 , 生成的答案還是無法達(dá)到與人類認(rèn)知相匹配的標(biāo)準(zhǔn) 。
因?yàn)锳I Agent在執(zhí)行任務(wù)時(shí)的思考方式是 , 復(fù)現(xiàn)成熟的任務(wù)流程或通過訓(xùn)練數(shù)據(jù)對(duì)問題進(jìn)行簡(jiǎn)單拆分 , 歸根究底 , 還是依賴于大模型的基礎(chǔ)能力 。 Manus并沒有在這方面做出強(qiáng)技術(shù)突破 。 有使用者指出 , Manus對(duì)復(fù)雜問題的拆解能力仍處于較低水平 。
以及Manus即將面臨的市場(chǎng)競(jìng)爭(zhēng)壓力也不小 。
覃相認(rèn)為 , 豆包和百度的AI Agent也有各自的市場(chǎng)定位和技術(shù)優(yōu)勢(shì) , 未來它們可能會(huì)通過技術(shù)升級(jí)或差異化競(jìng)爭(zhēng) , 縮小與Manus的差距 , 而且這兩家公司的資金實(shí)力更強(qiáng) 。
對(duì)于Manus的火爆 , 很多人持觀望態(tài)度 。 不止一位投資人對(duì)「定焦One」表示 , 雖然他們很看好今年AI Agent的發(fā)展 , 但由于之前有類似AI程序員Devin的出現(xiàn) , Manus并沒有太驚艷到他們 , 核心技術(shù)問題也沒有得到根本性提升 。
此刻 , 相比DeepSeek護(hù)城河較低的Manus , 已經(jīng)有不少開源復(fù)刻版項(xiàng)目出現(xiàn) , 留給Manus的時(shí)間不多了 。
【又黑又紅的Manus,還要闖三道關(guān)】*題圖及文中配圖來源于Manus官網(wǎng)截圖 。

    推薦閱讀