首頁 > 科技要聞 > 科技> 正文

Manus的狂熱和爭(zhēng)議之后,我和AI開發(fā)者們聊了聊 :這是智能體的勝利嗎?

appso 整合編輯:太平洋科技 發(fā)布于:2025-03-13 17:59

自從發(fā)布以來,Manus 經(jīng)過了一個(gè)堪比過山車的傳播歷程。

從一開始的驚艷,到被加速捧至高點(diǎn),再到遭受套殼、營(yíng)銷的批評(píng),一切都發(fā)生在短短一周內(nèi)。

在各種各樣的聲音當(dāng)中,我們找到了和 Manus 最為相關(guān)的一群人:正在參與 agent 以及配套設(shè)施的開發(fā)者們,聊了聊他們眼中的 Manus——不討論營(yíng)銷和爭(zhēng)議,僅僅是技術(shù)層面。

結(jié)論并不復(fù)雜:Manus 無疑是一款優(yōu)秀的產(chǎn)品。以「套殼」為理由來否定 Manus,是它的無妄之災(zāi)。

同時(shí),「縫合」一詞,也并不公允。一個(gè)通用型 agent 的能力和潛力,不僅體現(xiàn)在鏈接了多少工具,更在于對(duì)于 agent 本身的認(rèn)知。

那些圍繞營(yíng)銷和套殼展開的爭(zhēng)議,指向的是一個(gè)問題:Manus 的價(jià)值到底是什么?

橫空出世的「全球首個(gè)」

快忘了上周盛況的朋友們,這里有一個(gè)快速回顧:3 月 5 號(hào)深夜,Manus 上線內(nèi)測(cè),在官方展示的視頻中,放出了好幾個(gè)原本只在 PPT 中才會(huì)出現(xiàn)的精彩使用案例,無一不展現(xiàn)出 Manus 獨(dú)特的任務(wù)理解和執(zhí)行能力。

老實(shí)說 Agent(智能體)并不新鮮,但 Manus 打出「全球首個(gè)通用型智能體」的說法,掀起了前所未有的討論浪潮,也讓「通用型 agent」走到臺(tái)前。

由于內(nèi)測(cè)使用需要申請(qǐng)邀請(qǐng)碼,且發(fā)放速度慢,一時(shí)間造成了哄搶的局面——用例有多驚艷,用不上的人就有多焦慮。

這種邀請(qǐng)碼的機(jī)制,陰差陽錯(cuò)地把 Manus 推到一個(gè)近乎詭異的熱度,甚至被稱為「又一個(gè) DeepSeek 時(shí)刻」。

DeepSeek 是模型,Manus 是智能體,是截然不同的兩種產(chǎn)品。然而某種程度上,二者的歷程,確實(shí)有相似之處。

DeepSeek 做的是模型,但它并非是從零開始,而是在一系列已有的開源工作上,實(shí)現(xiàn)了工程上的勝利。

類似地,Manus 實(shí)際上并非第一個(gè)做通用型 agent 產(chǎn)品,在 2023 年同類產(chǎn)品就涌現(xiàn)過一輪。Manus 本身也從大量開源工作中獲得幫助,團(tuán)隊(duì)此前曾經(jīng)打造過 monica,一款集成式 AI 助手,積累了豐富的 agent 工程經(jīng)驗(yàn)。因此,Manus 也同樣被視為一種工程上的勝利。

工程上的勝利究竟是指什么?

這個(gè)問題必須回到「通用型 agent」是什么這個(gè)根本源頭上。

人跟動(dòng)物之間的區(qū)別在于制造和使用工具,這句話,放在 agent 身上也成立——普通 agent 和通用型 agent 的區(qū)別在于,后者能夠主動(dòng)調(diào)用工具

「很多人覺得 agent 就是原來的對(duì)話機(jī)器人,接上數(shù)據(jù)庫,就叫做 agent。實(shí)際上,一直以來 agent 的定義都是需要能使用工具,能真正的有所行動(dòng)。」 William Lee 解釋道,他從去年開始和創(chuàng)業(yè)團(tuán)隊(duì)一起開發(fā)針對(duì) agent 的中臺(tái)系統(tǒng) ACI.DEV,就是在為 agent 類產(chǎn)品提供盡可能便捷的 API 調(diào)用服務(wù)。

在具體的產(chǎn)品使用上,工具調(diào)用能夠把 agent 的能力邊界,再推得更推遠(yuǎn)一些;钴S在 agent 開發(fā)社區(qū)的堅(jiān)白,見識(shí)過 Manus 在執(zhí)行上的能力:剪視頻。

「剪的效果怎么樣另說,但是它可以去做到,可以完成,不會(huì)拒絕你!

原理并不復(fù)雜:剪輯的動(dòng)作,可以在一定程度上以代碼的方式來實(shí)現(xiàn)。又或者,一些在線工具可以被調(diào)用出來,完成剪輯的動(dòng)作。

這樣完成的剪輯當(dāng)然是粗放的,成品跟人工剪輯無法相提并論,但就像堅(jiān)白所說,Manus 不會(huì)拒絕這個(gè)要求,而是會(huì)主動(dòng)尋找工具完成。「在過去的應(yīng)用里,agent 可能會(huì)推薦給你一個(gè)剪視頻的網(wǎng)站或者工具,但沒有這樣端到端的結(jié)果!

他認(rèn)為這反應(yīng)了 Manus 團(tuán)隊(duì)的認(rèn)知,是在一種更有高度的位置上!肝艺J(rèn)為他們把代碼,包括整個(gè)代碼的運(yùn)行環(huán)境,更多作為工具,而不是目標(biāo)!

曾經(jīng)一些類似的項(xiàng)目,給出一段代碼或者設(shè)置虛擬機(jī),就已經(jīng)是最終目的。而 Manus 的理解是,設(shè)計(jì)虛擬機(jī)跑代碼,只是實(shí)現(xiàn)方式,它們是為了完成某種目的而存在。

「我覺得是他們?cè)谡J(rèn)知上有領(lǐng)先」,堅(jiān)白說,「大家都在說要把 agent 當(dāng)成人看,但他們真的是認(rèn)真思考了 agent 如何作為一個(gè)主體!

Agent 最重要的是「大腦」

那么,虛擬機(jī)是那個(gè)讓 Manus 脫穎而出的設(shè)計(jì)嗎?

「虛擬機(jī)不是一個(gè) creative 的設(shè)計(jì),」同樣是在做通用型 agent 產(chǎn)品的鄭淺解釋。

鄭淺所在的公司 Convergence.ai,在 1 月時(shí)推出了同樣屬于通用型 agent 的產(chǎn)品 Proxy,并且在 webvoyage 基準(zhǔn)測(cè)試中險(xiǎn)勝 OpenAI。

不久前 Proxy 登上 Product Hunt 榜單,鄭淺忙著帶領(lǐng)工程團(tuán)隊(duì)?wèi)?yīng)對(duì)突然涌來的流量。他們面對(duì)的是海外市場(chǎng),可見通用型 agent,在海內(nèi)外都是被寄于厚望的 agent 形態(tài)。

「OpenAI Operator 就是虛擬機(jī),Manus 是給 browser use 之后,加了一個(gè) coding execution,然后放到一個(gè)虛擬機(jī)里面去實(shí)現(xiàn)!

Browser use,是一個(gè)在 Github 上獲得了 4 萬星的開源項(xiàng)目,它相當(dāng)于把網(wǎng)頁瀏覽器放在了 agent「眼」前,結(jié)合了大語言模型以及視覺識(shí)別。用戶只需要通過自然語言,就能讓智能體對(duì)網(wǎng)頁上的元素進(jìn)行實(shí)際操作。

早期 Proxy 也嘗試過類似 browser use 的路線!竿ㄟ^這種方式幫用戶做點(diǎn)擊、拖動(dòng)等等的動(dòng)作。整體是比較簡(jiǎn)單直接的,只需要用戶給一個(gè)任務(wù),它一步一步去執(zhí)行!

這個(gè)形態(tài)比較線性,無法勝任更復(fù)雜的任務(wù);蛘哒f,當(dāng)任務(wù)的復(fù)雜程度上升,需要用戶給出更有細(xì)節(jié)的指令,反而成了對(duì)用戶的挑戰(zhàn)。

「我們公司算開始得比較早,跟 OpenAI 和 H Company 他們也比較多交流,后來 OpenAI Operator 出來,agent 一下就變火了。大家很快就往一個(gè)新的東西上面去靠攏,就是 agent orchestrator!灌崪\非常明確,「可以說 general agent 真正的區(qū)別,不在于縫合了多少工具。

建設(shè)一個(gè)普通的 agent,可以用「縫合」簡(jiǎn)單粗暴地概括。但是要建設(shè)一個(gè) general agent,必須是一個(gè)系統(tǒng)工程。

「你可以把 agent 想象成一個(gè)人,最復(fù)雜的部分在于核心決策系統(tǒng)——就是大腦和神經(jīng)傳輸。其次復(fù)雜的是執(zhí)行構(gòu)建,比如說相當(dāng)于人類的四肢與末端。至于你剛才提到的生成報(bào)告、瀏覽器交互、代碼執(zhí)行等功能模塊,本質(zhì)上屬于工具鏈層面的能力。」

人并不是生下來就會(huì)走路的,嬰兒只會(huì)胡亂揮舞手腳,然后會(huì)爬、會(huì)站,磕磕絆絆地學(xué)會(huì)走路,最后學(xué)會(huì)精準(zhǔn)地控制自己的四肢。

整個(gè)學(xué)習(xí)的過程,也是大腦逐漸成熟的過程。Proxy 的絕大多數(shù)工作都在圍繞這個(gè)「大腦」展開,具體而言,是 planner agent 所負(fù)責(zé)的動(dòng)態(tài)規(guī)劃。

「有一個(gè)調(diào)侃是,規(guī)劃不能預(yù)測(cè)未來:規(guī)劃可以做的很好,但你不知道未來會(huì)發(fā)生什么。放在 agent 上面也是一樣的,比如說它瀏覽某個(gè)網(wǎng)站,碰到無法打開的情況,比如改版啊或者域名過期,或者直接關(guān)停等等,那這時(shí)候 agent 該怎么做,這就需要?jiǎng)討B(tài)規(guī)劃!

Manus 實(shí)測(cè)中,碰到網(wǎng)站登錄及驗(yàn)證問題

一個(gè)典型場(chǎng)景是驗(yàn)證碼,Proxy 和 Manus 可以解決一些簡(jiǎn)單的驗(yàn)證碼,但太復(fù)雜的還是需要交回給用戶,也可能被直接跳過。

鄭淺解釋難度藏在細(xì)節(jié)里,「都是細(xì)節(jié),而且情況非常多樣。如何在規(guī)劃上去實(shí)現(xiàn)復(fù)雜任務(wù),同時(shí)又能回傳——用戶基數(shù)一大,做什么千奇百怪的事情都有,如何覆蓋各種各樣的場(chǎng)景是很大的難點(diǎn)。

現(xiàn)階段 Manus 并非盡善盡美,但它足以作為一個(gè)工程啟示錄。「它主要的成功之處,確實(shí)就是在工程上面」Wiilliam非常認(rèn)同這一點(diǎn),「它結(jié)合了市場(chǎng)上已有的模型,很好的跟工具做了對(duì)接,然后讓用戶第一次看到,真正可以調(diào)用工具的agent到底能做出什么樣的效果。這樣子我覺得百分之百是工程上的勝利!

真正的勝利屬于生態(tài)

Manus正像是那個(gè)正在學(xué)走路的幼兒,它能夠造成巨大的討論,并不在于它已經(jīng)能走多遠(yuǎn)、跳多高,而在于展示出了足夠的潛力。

這或許才是它最大的貢獻(xiàn):Manus的走紅,讓一系列與 general agent 類的應(yīng)用,乃至基礎(chǔ)建設(shè)的工作,都漸漸浮出水面。

最新的進(jìn)展是 OpenAI 推出了 Responses API,這是一個(gè)面向開發(fā)者,而且就是 agent 開發(fā)者的新發(fā)布。

在開發(fā)者社群里,Manus 更加是激發(fā)了許多想法。堅(jiān)白正在做和 agent 記憶相關(guān)的項(xiàng)目,Manus 的出現(xiàn)讓他開始重新思考記憶儲(chǔ)存相關(guān)的范式。

記憶儲(chǔ)存對(duì)于 agent 的實(shí)際工作至關(guān)重要,這不僅影響著 agent 能否從過往任務(wù)里學(xué)習(xí)到經(jīng)驗(yàn)并沿用,也影響著能否形成關(guān)于用戶使用習(xí)慣的記憶,真正做到個(gè)性化。

另外,通用型 agent 在理論上有著最大的自由度,可以鏈接和調(diào)用任何工具——在延遲、接口標(biāo)準(zhǔn)化等方面足夠好的前提下。這正是 ACI 這類中臺(tái)型產(chǎn)品,所想要提供的服務(wù)。

這可能是 Manus 最成功的一點(diǎn):它作為現(xiàn)階段通用型 agent 最出圈的案例,為一系列配套設(shè)施打開了想象和探索的空間。

「其實(shí)通過 Manus 可以看到,現(xiàn)在模型已經(jīng)跑在工程的前面很多了!筗illiam 認(rèn)為工程方面還有很多可以探索的空間,「我們還可以在工程上面繼續(xù)做點(diǎn)什么,來拉高這種 AI agent 產(chǎn)品的效能。我個(gè)人的看法是現(xiàn)在 agent infrastructure 這一端的話都還是挺不成熟的,包括像我們這種工具調(diào)用平臺(tái),或者是說這種 memory layer,這些在工程方面都還有很多方向是可以優(yōu)化的!

這也是我們跟開發(fā)者社群接觸下來最大的感受:他們感到興奮與躍躍欲試!竿ㄓ谩箖蓚(gè)字所包含的可能性,前所未有的生動(dòng)。

Proxy 馬上要基于新的 parallel agent 思路,推出迭代的版本。鄭淺一直在觀察社群的反饋,他看到許多用戶把 Proxy 用出了自己根本沒過的方式,不斷被挖掘出新的可能。

「大多數(shù)產(chǎn)品最后的使用目的,都不太會(huì)是一開始開發(fā)的目的,可能后面是由用戶來發(fā)現(xiàn)我們沒有發(fā)現(xiàn)的用途,我們也在等待那一個(gè)moment的到來!

本文來源:Appso

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋
    漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋

    作為美國(guó)百年家電品牌,HamiltonBeach漢美馳在美國(guó)市場(chǎng)處于行業(yè)領(lǐng)導(dǎo)地位,在本屆AWE展會(huì)上,漢美馳與太平洋網(wǎng)絡(luò)合作,展出了他們的三個(gè)主打品類:破壁機(jī)、慢燉鍋和空氣炸鍋,其中,破壁機(jī)屬于攪拌類小家電,漢美馳是這個(gè)品類的開創(chuàng)者;慢燉鍋是美國(guó)家庭的必需品,就像我們中國(guó)家庭的電飯煲一樣,漢美馳慢燉鍋累計(jì)在美國(guó)的銷量超過3000萬臺(tái),是這個(gè)品類的領(lǐng)導(dǎo)品牌;漢美馳的這款HALO空氣炸鍋剛剛獲得了全球頂級(jí)設(shè)計(jì)大獎(jiǎng)——iF設(shè)計(jì)獎(jiǎng)。 今年,漢美馳在國(guó)內(nèi)市場(chǎng)的動(dòng)作很多,包括:推出了家電行業(yè)第一款應(yīng)用chatGPT的AI牛排機(jī),全球首發(fā)煙灶產(chǎn)品,全球首發(fā)中式廚電產(chǎn)品,自建抖音、淘寶直播間,與頭部主播烈兒寶貝等合作……這些經(jīng)營(yíng)動(dòng)作的背后,漢美馳有怎樣的戰(zhàn)略規(guī)劃?他們對(duì)中國(guó)市場(chǎng)有些什么樣的判斷?他們的優(yōu)勢(shì)有哪些?請(qǐng)看PConline獨(dú)家專訪漢美馳中國(guó)營(yíng)銷中心總經(jīng)理李梟雄先生。

    呼倫 呼倫 2023-05-05 00:03
  • 極氪“流血”上市,最急的是埃安、哪吒?jìng)?

    在經(jīng)歷了2018-2020年“蔚小理”的上市潮后,隨著國(guó)內(nèi)新能源汽車市場(chǎng)競(jìng)爭(zhēng)日益激烈,以及全球EV需求放緩,IPO的大門正在向造車新勢(shì)力們緩緩關(guān)閉。極氪的成功上市既是對(duì)新勢(shì)力的一次激勵(lì),也是一次警示——后來者必須面對(duì)越來越嚴(yán)苛的上市條件。留給哪吒汽車、廣汽埃安們的機(jī)會(huì)可能不多了。

    劉凡 劉凡 2024-05-11 11:26
    極氪   吉利   哪吒   埃安
  • 二維碼 回到頂部
    国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av