非常意外的,Manus本尊和它的開源復現(xiàn)在國外開始火了! 首先,越來越多的外國網(wǎng)友開始注意到了Manus,并且大贊它是「全球首個類似AGI的全自主AI智能體」,已經(jīng)快要摘下人工智能的圣杯AGI了。 所以,中國的AI產(chǎn)品這是成功「內(nèi)銷轉(zhuǎn)出口」了? 另外,OpenManus和OWL等項目,更是在國外獲得一眾開發(fā)者的贊賞。 其中,OWL更是以58.18的成績,拿下了GAIA基準的開源第一! 現(xiàn)在的開發(fā)者社區(qū)中,Manus的開源替代方案已經(jīng)如雨后春筍般冒出,除了star數(shù)很高、人氣暴漲的OpenManus和OWL之外,還出現(xiàn)了autoMate、Deep Research、Open Deep Research等平替。 親身體驗過的開發(fā)者對此這樣評價:大部分開源平替都是偏向Deep Research,但Manus一句話就出代碼和原型的能力,確實沒有那么容易達到。 被質(zhì)疑沒有任何技術創(chuàng)新,只是套殼套得好的Manus,竟然開始在海外掀起聲浪,莫非的確有擊穿海內(nèi)外普通用戶心理的獨特之處? 讓我們來仔細看看。 歪果仁驚嘆:Manus也太好用了吧 此前,Manus之所以被詬病為營銷成分居多,就是因為跟ChatGPT、DeepSeek的爆紅途徑截然相反——在國內(nèi)自媒體掀起聲浪的時候,海外開發(fā)者社區(qū)和技術網(wǎng)站上一片寂靜。 但就在今天,顯然Manus已經(jīng)漸有了走出國門的趨勢,在海外大V和網(wǎng)友們那里傳播開了! 在Reddit上的singularity社區(qū),網(wǎng)友們開始熱烈討論起了Manus,并且拉踩了一把月費20000刀的OpenAI智能體。 TheRundownAI創(chuàng)始人Rowan Cheung,就給海外網(wǎng)友們介紹了這款「在中國瘋狂病毒式傳播」的AI智能體。 甚至他給出了這樣的評價——「中國的高光時刻到來了」!并且認為只需一段時間,Manus就會進入美國市場。 事件起因,是TheRundownAI上有一些用戶熱烈討論Manus,于是Rowan Cheung在官方通訊中進行了報道。 不久后,他就收到了Manus聯(lián)創(chuàng)發(fā)來的邀請碼,并展開了親測。 首先,他讓Manus創(chuàng)建了一份關于自己的傳記,并且基于這份傳記部署了一個網(wǎng)站。 Rowan Cheung表示,看到Manus在自己的社交渠道瀏覽文章、部署網(wǎng)站,簡直「瘋狂的令人深刻」。 最終,Manus的信息一直截止到今天的更新,并且完全準確! 然后,他決定測試一些更實用的的東西,比如舊金山最受歡迎的租房地點,需要滿足低犯罪率、大量AI活動、高密度的充滿抱負的年輕企業(yè)家。 Manus給出了一份詳細完整的報告,包含了4個非常準確的選擇。 最后,他測試了一下Manus在執(zhí)行非常長的研究任務時的表現(xiàn)。 為此,他要求Manus創(chuàng)建一門關于AI內(nèi)容創(chuàng)作的完整課程。 整個過程中,Manus耗費了2個小時,但制作出的課程令人印象深刻,包括工具、用例,甚至還有提示示例。 總之,看起來Rowan Cheung對Manus的表現(xiàn)十分滿意。 已經(jīng)拿到邀請碼實測過的歪果網(wǎng)友表示,自己非常喜歡Manus,唯一的缺點就是慢。 目前,還無法看出海外社區(qū)的這波討論是自來水,還是一種很新形式的PR。 對于Manus的走紅,不少業(yè)內(nèi)人士的評價都是:并沒有工程難度和實現(xiàn)難度,練劍少年可以批發(fā),不久后將滿大街都是「屠龍劍」。 為了更好的理解Manus的原理,接下來就讓我們跟著OpenManus項目的一作梁新兵,來分析一下它的算法實現(xiàn)。 作為一個多智能體系統(tǒng),Manus首先會使用PlanningTool做規(guī)劃,形成一個包含多個任務的線性結構的計劃,然后順序執(zhí)行每一個任務并動態(tài)分配給相應的Agent。在執(zhí)行每個任務時,Agent會以ReAct循環(huán)的形式調(diào)用工具來完成每一個任務。 1. 規(guī)劃能力:Manus將PlanningTool規(guī)劃工具引入多智能體框架。 這一趴十分重要。舉例來說,Claude 3.7 Sonnet將SWEBench上的解決率從之前的49%提升到了70%。其中,一部分提升來源于模型本身,而另一部分就來源于規(guī)劃了。 2. 工具使用能力(猜測):Manus應該是Claude加上其他一些經(jīng)過后訓練的模型。并通過在工程上的優(yōu)化,來增強它在不同場景下的工具使用能力。 總之,Manus在工程上的實現(xiàn)還是非常出色的,但技術層面上似乎并沒有護城河。 00后博士生0天復刻,霸榜開源第一 正如上文提到的,來自CAMEL AI的開源項目OWL(Optimized Workforce Learning),在GAIA認證榜單中一舉斬獲了開源第一的優(yōu)異成績。超過了Hugging Face Open DeepResearch的55.15%。 據(jù)團隊介紹,其實在3月3日的時候,就已經(jīng)取得了GAIA上開源最好的性能。 目前,由于時間的原因,項目還不是滿血版。但在一波迭代之后,還是有信心刷爆Manus的! 項目地址:https://github.com/camel-ai/owl?tab=readme-ov-file 根據(jù)網(wǎng)友AIGCLINK的分析,OWL把Manus的核心工作流拆成了6步: 啟動一個Ubuntu容器(Agent遠程工位就位) 知識召回(把之前學過的內(nèi)容撿起來用) 連接數(shù)據(jù)源(數(shù)據(jù)庫、網(wǎng)盤、云存儲全覆蓋) 把數(shù)據(jù)掛載到Ubuntu(Agent的搬磚時刻) 自動生成http://todo.md/(規(guī)劃任務+寫待辦清單) Ubuntu工具鏈+外接工具組合拳,執(zhí)行全流程任務 所有Manus里智能體用到的操作,OWL也會配齊。 核心機制WorkforceOWL的核心是一個多個AI智能體協(xié)同工作解決任務的系統(tǒng),目前還在調(diào)試中,其完整版將是一個可優(yōu)化的、可遞歸的、動態(tài)多智能體合作機制。 通過使用Workforce,用戶可以快速設置具有自定義配置的多AI智能體任務解決系統(tǒng)。 下圖展示了一個簡單示例的工作流程: · 架構 Workforce遵循層級架構。一個Workforce可以由多個工作節(jié)點組成,每個工作節(jié)點將包含一個或多個AI智能體作為工作者。 其中,工作節(jié)點由Workforce內(nèi)的協(xié)調(diào)者AI智能體管理,協(xié)調(diào)者AI智能體將根據(jù)工作節(jié)點的描述及其工具集向工作節(jié)點分配任務。 除了協(xié)調(diào)者AI智能體外,Workforce內(nèi)部還有一個任務規(guī)劃者AI智能體。任務規(guī)劃者AI智能體負責分解和組合任務,使Workforce能夠逐步解決任務。 · 通信機制 Workforce內(nèi)部的通信基于任務傳遞通道。 在初始化后,就會創(chuàng)建一個由所有節(jié)點共享的通道。任務將被發(fā)布到這個通道中,每個工作節(jié)點會監(jiān)聽該通道,接受從通道中分配給它的任務并解決。 當任務被解決后,工作節(jié)點會將結果發(fā)布回通道,結果將作為其他任務的「依賴項」存在于通道中,并由所有工作節(jié)點共享。 通過這種機制,Workforce能夠以協(xié)作和高效的方式解決任務。 · 故障處理 Workforce設有故障處理機制。當任務失敗時,協(xié)調(diào)者AI智能體將采取行動來修復它。這些行動可以是將任務分解為更小的任務并重新分配,或者創(chuàng)建一個能夠完成該任務的新工作者。 目前,協(xié)調(diào)者會根據(jù)任務已被分解的次數(shù)來做出決策。如果任務已經(jīng)被分解超過一定次數(shù),協(xié)調(diào)者將采取創(chuàng)建新工作者的行動;如果沒有,協(xié)調(diào)者將簡單地采取分解行動。 有一些任務可能無法由AI智能體解決。在這種情況下,為了防止Workforce陷入無限的AI智能體創(chuàng)建循環(huán),如果一個任務已經(jīng)失敗了一定次數(shù)(默認為3次),Workforce將被暫停。 曾提出首個ChatGPT多智能體框架團隊表示,距離自己提出全球首個ChatGPT Multi-agent框架思想,已經(jīng)將近兩年了。 看到Monica團隊把Multi-agent技術落地成產(chǎn)品非常驚喜。Manus系統(tǒng)設計其實非常巧妙,特別通過文件系統(tǒng)來實現(xiàn)Context管理和持久化、使用Ubuntu虛擬機的命令行來實現(xiàn)靈活的工具使用,是非常值得學習的工程思路。 對此,團隊正在開源復現(xiàn)中。 除了Web和命令行的操控之外,團隊今后還將實現(xiàn)電腦、手機、機器人、車載等各種跨平臺的操控。到了那時,才是真正的賽博workforce! 原因是,OS端Agent有一個巨大的優(yōu)勢——比較容易拿到可驗證的獎勵信號。也就是說,未來可以通過強化學習訓得飛起。 也許在一年內(nèi),我們就會看到DeepSeek R1 Zero這樣的「啊哈時刻」出現(xiàn)在OS / Web Agent領域。 團隊介紹OWL項目第一作者胡夢康,是香港大學攻讀博士學位,師從羅平教授。他在ICLR、COLING和KDD等頂會發(fā)表了多篇一作論文,在 AI 研究的前沿戰(zhàn)場穩(wěn)扎穩(wěn)打。如果AI研究是一場解謎游戲,那胡夢康無疑是那個總能找到最優(yōu)解的玩家。 OWL項目共同第一作者周宇航,雖然還在哈工大讀大四,但已在AI研究的道路上跑出了自己的加速度。在校期間專業(yè)排名第一,曾獲國家獎學金、省三好學生等多項榮譽,保研至復旦大學攻讀碩士學位。 CAMEL-AI.org社區(qū)的創(chuàng)始人李國豪,在帶領社區(qū)尋找智能體的Scaling Laws,他是人工智能研究員和開源貢獻者,致力于構建能夠感知、學習、溝通、推理和行動的智能體。 他的主要研究興趣包括自主智能體、圖形機器學習、計算機視覺和具身人工智能。他在國際頂級會議和期刊上發(fā)表了相關論文,如ICML、NeurIPS、ICLR、ICCV、CVPR、RSS、3DV和TPAMI。 李國豪曾在英國牛津大學與Philip Torr教授合作擔任博士后研究員。他在沙特阿拉伯的阿卜杜拉國王科技大學(KAUST)獲得計算機科學博士學位,導師為Bernard Ghanem教授。 在攻讀博士學位期間,他創(chuàng)立了DeepGCNs.org,致力于研究GNNs的Scaling Laws,他有幸在英特爾ISL與Vladlen Koltun博士和Matthias Müller博士合作,擔任研究實習生,并訪問了ETH蘇黎世的計算機視覺實驗室(CVL)作為訪問研究員。 此外,他還作為早期成員在硅谷創(chuàng)業(yè)公司Kumo AI和PyG.org與斯坦福Jure Leskovec教授和Matthias Fey博士進行合作研究。 Wendong Fan, Qianshuo Ye, Zeyu Zhang, Xukun Liu, Zhaoxuan Jin對該項目亦有貢獻。 這個團隊,不僅有理論的深度,還有趣的靈魂, AI研究的世界里,一起探索最前沿的智能邊界。 開源復現(xiàn)Manus項目,人氣爆棚 項目地址:https://github.com/mannaandpoem/OpenManus?tab=readme-ov-file MetaGPT團隊的OpenManus火到什么程度呢,連冒充的賬戶都冒出來了,逼得項目作者趕緊上線辟謠。 OpenManus的工作流如下: 首先,OpenManus在接收到用戶需求后,會使用PlanningTool形成一個包含多個任務的線性結構的計劃,寫入至一個plan的markdowns文件中去。 然后,OpenManus會去查看這個Plan,并從中依次取出每個任務。 在執(zhí)行任務時,OpenManus會將該任務分配給最適合處理該任務的Agent,它們分別裝備了不同的工具集,在處理不同任務時,有不同的優(yōu)勢。 需要注意的是,Agent分配是在執(zhí)行每個任務時臨時被分配的。這種動態(tài)分配的方式讓系統(tǒng)更靈活,能夠根據(jù)任務的具體需求和上下文選擇最合適的Agent。 目前,團隊使用正則匹配對Agent進行任務的分配,如果沒匹配到,則使用默認配置的Agent去執(zhí)行任務。 以下是由LLM為OpenManus生成的類圖和流程圖: 類圖 流程圖 對此,開發(fā)者的真實體感是:雖然只是普通的ReAct模式的Agent,但是因為代碼寫得太好了,非常值得學習。 這也說明了,哪怕是LLM時代,Cursor等依然非常好用,好的工程能力實在太重要了。 本文來源:新智元 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選