原文:《 AI Agent 的「GPT 時刻」,Manus 炸醒整個AI 圈!

作者:shiyun張勇毅

編輯:靖宇

2025 年是AI Agent 元年——這句話,在北京時間3 月6 日凌晨,得到了應驗。

「DeepSeek 之後,又一個科技圈的不眠之夜。」

不少用戶在社群媒體上如此點評。

所有人徹夜蹲守,只為該產品的一個使用邀請碼——它就是Monica.im 研發的全球首款AI Agent 產品「Manus」。

根據團隊介紹,「Manus」是真正自主的AI 代理,能夠解決各類複雜多變的任務。與傳統AI 助理不同,Manus 不僅能提供建議或答案,還能直接交付完整的任務成果。

AI Agent的“GPT 時刻”,用戶的“萬能之手”Manus誕生!

 Manus 的介紹影片只有短短的4 分鐘,卻威力驚人|圖片來源:Monica.im

正如「Manus」的名字寓意,它在拉丁文裡象徵著「手」。也就是說,知識不只要在腦子裡,還要能用手執行。這正是Agent 和AI Bot(聊天機器人)產品的本質進階。

Manus 牛在哪裡?最直觀的是看官方網站展示、以及用戶自發性展示的使用用例,極客公園部分整理如下:

  1. 旅行規劃:不僅整合旅遊訊息,也為使用者創建客製化旅遊手冊。例如,為使用者規劃日本四月旅行,提供個人化的旅遊建議和詳細手冊。
  2. 股票分析:進行深入的股票分析,設計視覺上吸引人的儀表板展示全面的股票洞察。例如,對特斯拉股票進行深度分析,創建視覺化儀錶板。
  3. 教育內容創作:為中學教師創建影片簡報資料,解釋動量定理等複雜概念,幫助教師更有效教學。
  4. 保險政策比較:建立清晰的保險政策比較表,提供最佳決策建議,幫助使用者選擇最適合的保險產品。
  5. 供應商採購:在整個網路中進行深入研究,找到最適合用戶需求的供應商,作為真正公平的代理為用戶服務。
  6. 財務報告分析:透過研究和數據分析捕捉市場對特定公司(如亞馬遜)的情緒變化,提供過去四個季度的市場情緒分析。
  7. 新創公司清單整理:造訪相關網站識別符合資格的公司,並將其整理成表格。例如,整理YC W25 批次的所有B2B 公司清單。
  8. 線上商店營運分析:分析亞馬遜商店銷售數據,提供可操作的洞察、詳細視覺化和客製化策略,幫助提升銷售績效。
  9. 當Agent 透過一長串思維鍊和工具調用,最終輸出一個無比完整、專業的結果時,用戶們開始感嘆「真的能幫人類做事了」。

根據官方網站信息,在GAIA基準測試(評估通用AI助手解決真實世界問題的能力)中,Manus在所有三個難度級別上都取得了新的最先進(SOTA) 表現。

總結成一句話——Manus 更想做的,是你在數字世界中,字面上的「代理人」。而它做到了。

就像你想的一樣,凌晨推出的Manus,一下子把所有AI 圈的人都炸醒了!

01、Manus,你的「數位代理人」

首先,Manus 在體驗上與先前LLM 最大的不同:

它強調直接交付最終結果的能力,而不只是給出一個單純的「答案」。

Manus 目前採用Multiple Agent 架構,運作方式與先前Anthropic 發布的Computer Use 類似,完全運作在獨立虛擬機器中。同時可以在虛擬環境中呼叫各類工具-編寫執行程式碼、瀏覽網頁、操作應用程式等,直接交付完整成果。

在官方發布的影片中,介紹了三個Manus 在實際使用場景中所完成的工作案例:

第一個任務是篩選履歷。

從15 份履歷中,為強化學習演算法工程師職位推薦合適的候選人,並根據其強化學習專業知識對候選人進行排名。

在這個示範中,你甚至不需要給壓縮檔案解壓縮、將其中的履歷檔案一份份手動上傳。 Manus 這時候就已經展現了像人類「實習生」的一面,手動解壓縮文件,並逐頁瀏覽每一份履歷,同時記錄其中的重要資訊。

AI Agent的“GPT 時刻”,用戶的“萬能之手”Manus誕生! Manus 像實習生一樣,自動理解「解壓縮老闆丟過來的打包文件」這個隱藏指令| 圖片來源:極客公園

在Manus 給出的結果中,不僅有自動產生的排名建議,它還會根據工作經驗等重要維度,將候選人分為不同等級。在接受到使用者更希望以Excel 表格的方式呈現後,Manus 還能自動將這些內容透過現場編寫Python 腳本的方式,來產生對應的表格。

Manus 甚至還能透過記憶能力,在這個實踐過程中記錄下「使用者更喜歡透過表格的方式接受結果」這樣的訊息,下一次處理類似的任務結果時,會優先使用表格的形式來呈現。

AI Agent的“GPT 時刻”,用戶的“萬能之手”Manus誕生! Manus 能記住使用者在內容生成流程中的偏好| 圖片來源:極客公園

第二個案例,更為國人量身打造,就是遴選房產。

案例中使用者希望在紐約購買房產,輸入的要求是希望同時有安全的社區環境、低犯罪率,以及優質的中小學教育資源——當然還包括最重要的預算,足夠在每月固定收入的情況下負擔的起。

在這個需求中,Manus AI 將複雜任務分解為待辦事項列表,包括研究安全社區、識別優質學校、計算預算、搜尋房產等。並透過網路搜索,仔細閱讀有關紐約最安全社區的文章,收集相關資訊。

其次,Manus 透過編寫Python 程序,根據使用者收入計算可負擔的房產預算。結合房地產網站上相關的房價信息,根據預算範圍篩選房產列表。

AI Agent的“GPT 時刻”,用戶的“萬能之手”Manus誕生! Manus 能夠自動搜尋、並過濾掉條件不符合使用者要求的房源| 圖片來源:極客公園

最後,Manus 會整合所有收集的信息,撰寫詳細報告,包括社區安全分析、學校品質評估、預算分析、推薦房產清單以及相關資源連結——就像一個專業的房地產經紀人一樣。而且由於Manus 自帶「完全基於使用者利益考量」的屬性,其使用甚至​​體驗更好。

在最後一個案例中,Manus 展示了對股票價格的分析能力。

案例給出的任務是分析過去三年中英偉達、邁威爾科技和台積電股票價格之間的相關性:眾所周知這三支股票之間存在緊密的關聯性,但對於新手用戶來講,很難快速將其中的因果關係整理清楚。

而Manus 的操作,與一個真正的股票經紀人非常相似,它先是透過API 訪問雅虎金融等資訊網站,來獲取股票歷史數據,同時還會交叉驗證數據準確程度,避免被單一資訊來源誤導,對最終產生結果帶來重大影響。

在這個案例中,Manus 同樣用到了編寫Python 程式碼、進行數據分析和視覺化的能力,同時還引入了金融相關的專業工具進行分析,最終透過數據視覺化圖表,搭配詳盡的綜合分析報告的方式,向用戶反饋其中的因果關係——真的就像一個金融領域「實習生」所做的日常工作。

不僅如此,在Manus 官網還展示了十多個Manus 能夠使用的場景:直接使用Manus 幫你整理行程、個人化推薦旅遊路線,還能讓它學習使用各種複雜工具,來流程化的完成日常工作。

在這個過程中,真正讓Manus 展現出與平常工具不同的,是它的自主規劃,來確保執行任務的能力。

自主學習的能力也讓Manus 的工作能力提升邏輯更像是真正的人類——即使現階段,它可能還無法在某一個特定領域做到專家級的精通,但已經能看到巨大的潛力。

隨著自主學習能力的加入,AI Agent 的泛用性得到了巨大的提升,在用戶對Manus 的實際測試中,你甚至可以做到直接對它描述一個視頻畫面中的相關內容,Manus 最終能夠直接根據對應的信息,跨越平台內容對於搜索引擎的限制,精準找到某個抖音短視頻的鏈接。

由於目前版本的Manus 完全基於雲端非同步運行,因此實際上Manus 的能力並不被你所使用的端側平台形態或算力等因素限制——用戶甚至可以做到在向Manus 下達指令之後,暫時關閉電腦,當Manus 執行完成活動結果後,會自動通知你結果。

這個操作邏輯同樣非常眼熟──就像一個人下班以後,在微信上喊實習生「文件整理好發我」。只不過,現在,這個實習生是真的可以7x24 小時的回應你了,並且不用擔心他會「整頓職場」。

02、多代理+自查,跑通AI Agent 流

從上面這些案例,其實不難看出Manus 真正的殺手鐧,並非Computer Use 中已經出現過的「AI Agent」概念,而是它「模擬人類方式運作方式」的能力。

比起「運行計算」,Manus 的工作邏輯更像是「思考並執行命令」。它並沒有做到哪些人類目前真正無法做到的事;這也就是為什麼一些已經體驗過當前版本Manus 的用戶,將它形容為「一個實習生」。

在Manus 官網,展示眾多Manus 能夠完成的任務,其中就有一個案例,展示了在B2B 業務中,如何使用Manus。快速精準的將你的訂貨需求,與全球供應商實現精準匹配。

在類似需求的常規產品中,在平台內整合全球供應鏈企業訊息,來幫助用戶完成供貨商/需求方匹配這件事,是業內通行的邏輯。但這件事在Manus 的案例中,你可以看到完全不同的實作方式。

Manus AI 使用一套名為「Multiple Agent」的架構,在獨立的虛擬機器中運作。透過規劃代理、執行代理、驗證代理的分工協作機制,。來大幅提升對複雜任務的處理效率,並透過並行計算縮短反應時間。

在這個架構中,每個代理程式可能基於獨立的語言模型或強化學習模型,彼此透過API 或訊息佇列進行通訊。同時每個任務也都在沙盒中運行,避免干擾其他任務,同時支援雲端擴展。每個獨立模型都能模仿人類處理任務的流程,例如先思考和規劃,理解複雜指令並拆解為可執行的步驟,再調用適當的工具。

換言之,透過Manus 的這套多代理架構,它更像是由多個助理,通過協助的方式,分別完成檢索資源、對接、驗證信息是否有效等工作,來幫你完成整個工作流程——這實際上不僅像是你招了一個“實習生”,更像是直接當上了一個微縮版的“部門主管”。

在B2B 業務這個案例中,Manus 透過網頁爬蟲以及程式碼編寫、執行能力,Manus 會自動在互聯網這片汪洋大海中檢索,根據你自己的需求,對潛在供應商從產品品質、價格、交貨能力等方面,為你匹配到最合適的貨源。不僅可以將結論以圖表的方式直觀地呈現在你眼前。也能對這些數據進一步給出更詳細的操作建議。

AI Agent的“GPT 時刻”,用戶的“萬能之手”Manus誕生! Manus 完成B2B 場景下的需求,或許比單一平台的內建工具更好用| 圖片來源:極客公園

至於Monica 團隊到底如何、用何種技術實現的視訊效果,根據消息,團隊或將在北京時間3 月6 日為大家揭曉。

03.「縫合」的極致,就是炸裂

Manus 背後的Monica.im,到底是家甚麼公司?

Monica 是一款All-in-One 的AI 助手,產品形態從瀏覽器插件、慢慢拓展至了App、網頁端。主流的使用場景是,當使用者在瀏覽器中點開它的小圖標,就能直接使用其接入的各大主流模型。透過對細分場景使用者需求的準確理解,Monica 摘到了大模型「低垂的果實」。

其創辦人肖弘(暱稱小紅,英文名Red)是一位年輕的連續創業家,1992 年生,畢業於華中科技大學。 2015 年,他畢業後創業,早期創業不算順利(如校園社交、二手市集)。 2016 年,他創業微信公眾號經營者提供編輯與數據分析工具,獲得了百萬用戶、並完成了盈利,最終產品於2020 年出售給了某獨角獸公司。

等到2022 年大模型浪潮後,他正式創立Monica,專注海外市場,透過獨立開發者產品ChatGPT for Google,產品快速完成了冷啟動。

2024 年,在GPT-4o、Claude 3.5、OpenAI o1 系列上線的第一時間,Monica 讓用戶可以獲得最新SOTA 模型。隨著存取模型的新進展,Monica 推出的專業搜尋、DIY Bot、Artifacts 寫小程式、記憶等功能也受到使用者喜愛。而Monica 在YouTube、Twitter、Gmail、The Information 等不同功能的網頁裡呈現出不同的互動形態和功能,以適配特定場景的使用者需求,更新了數百個網頁的個人化AI 體驗。

2024 年,Monica 用戶數量翻番,達1,000 萬。同時,其保持可觀的獲利,在海外同類產品中,位居頭部。

Monica 的強勁表​​現驗證了一件事:

套殼到極致,既是TPF、也是PMF,最後都通往用戶價值。

AI Agent的“GPT 時刻”,用戶的“萬能之手”Manus誕生! Monica 首頁| 圖片來源:Monica

Manus 或許延續了Monica 團隊這種想法——肖弘接受媒體人張小珺的訪談時表示,產品不能只有聊天機器人一種形態,Agent 會是新增的形態、需要新的產品去承接。

他從AI 編程產品cursor 和Devin 中獲得了靈感。根據極客公園了解,前者主要是copilot 模式、後者則是autopilot 模式,後者更符合人性需求。 Agent 也應該像Devin 一樣,面向大眾人群、真正由ai 主導進行執行。但過去的問題是,模型不夠聰明。

但基於模型已有能力去做場景的封裝服務,或許正是Monica 團隊的優勢。肖弘說,目前Agent 產品團隊並不多,因為它需要很多複合能力,比如說團隊要搞過chatbot、AI 編程、瀏覽器相關(因為都在瀏覽器上跑)、而且對模型的邊界要有不錯的感知——今天發展到什麼水平,接下來會發展到什麼樣的水平等等。

「同時擁有這些能力的公司沒那麼多,而有這些能力的公司,可能手頭正在幹一個很具體的業務,但我們恰好有同學剛好有時間一起把這件事情做出來。」他說。

為什麼是Monica 做出來了,他總結道,「第一,我覺得我們是比較幸運的。第二,某種程度上,如果今天大家都去做reasoning 了,可能是不是又多出了一些時間給創業公司?模型預計能力外溢還能走多遠?」

他認為,目前Agent 還在早期階段。一是目前Agent 還在規劃階段,還沒到物理世界的執行;二是大模型的能力還在往上發展,一切還不可預料。

「我肯定不知道Agent,是可以用這樣的方式被出來的,它是一個未知的事情。」他說。

耐人尋味的是,「不知道怎麼做Agent」的Monica,現在做出了一個讓整個AI 圈感到爆炸的產品。

Manus 可能未必是最終的AI Agent,但它無疑在DeepSeek 爆火之後,再次將人們對AI 的期望拉升了一個數量級。

*頭圖來源:Monica.im