Manus,沒有秘密「注解版」

近來Manus走紅,「爭論」不斷,我也在前文《Manus爆火,是硬核還是營銷?》中闡述過自Manus發布后,行業討論以及開源復刻的信息,以及我們如何結合螞蟻圖計算(TuGraph)技術,實踐Graph Manus的方法思路。
昨天,明浩老師在他的播客「屠龍之術」發布了「Manus,沒有秘密 - 70頁PPT解讀AI Agent」,分享了AI Agent的定義、Manus實現邏輯等非常有深度的觀點,并無私地共享了這份PPT。我個人看完后大呼過癮,相信Agent建設者也能從中找到諸多共鳴。我這里結合了個人的理解對其做了簡單的釋義和備注,姑且稱之為「注解版」吧,內容實在太好,忍不住向大家及時分享。

1. 核心敘事

「注」:L1代表案例有ChatGPT,Claude等一系列大模型,從文本生成模型到多模態模型。L2代表案例有GPT-o1、DeepSeek-R1等一眾推理模型,以及早期的ReAct、CoT、ToT等智能體思維鏈探索。L3代表案例有Cursor、Devin、Manus等,但離大家心中真正的Agent可能還有一點距離。至于L4和L5,具體形態如何,可能需要腦補了。

「注」:這些問題很值得深思,比如怎么到L1的,是Scaling Law嗎?怎么到L2的,只是從快思考模式到慢思考模式嗎?

「注」:通用的本質是去特化。模型能力不再受限于數據格式,而是規模;推理能力不再受限于規則,而是獎勵。智能體能力不再受限于流程結構(Workflow),而是簡約設計(Less is More)。





「注」:DeepSeek-R1技術報告剛出來時,諸多反應皆是「大道至簡」,工程人士和架構師的最愛。

「注」:那問題來了,技術人員眼中的「Aha Moment」應該是什么樣的呢?

「注」:那么「提示工程」和「Workflow」到底是不是「彎路」,可能事情并非那么絕對。不過L2讓我們看到了「提示工程」簡化的曙光,L3也讓我們看到了「Workflow」簡化的可能。

「注」:事物的初期一定是不完美的,但「取法乎上,得乎其中」,想象DeepSeek-R1的訓練成本的邏輯,其實是一個道理。這里「看見」應該有幾層含義:一是推理過程可觀測可干預,這是個產品體驗問題;另一個是推理要白盒化,其實就是「開源」。
2. 定義Agent

「注」:這里的嘲諷值直接拉滿了,哈哈。

「注」:其實「套殼」這個詞已經「罵」得很委婉了,寫過代碼的應該都聽過這句話:「你這不就是包了個皮么」,自己體會【手動狗頭】。做模型訓推的看做模型應用的,和當年做基礎技術的看做Web服務的可能是同一撥人,這種行業技術「鄙視鏈」一直存在。但是很多人忘了做模型訓推和基礎技術到底是為誰服務的?吃飯砸鍋,這種事屢見不鮮了。

「注」:不管是傳統軟件工程,還是大模型軟件工程,產品力永遠有價值!



「注」:在「看見」這一條上,Manus的產品力著實令人驚艷。
3. 實現原理


「注」:做出Agent千篇一律,做好Agent萬里挑一。直觀上,推理模型提升了任務拆解能力,但只靠推理模型并不一定是最終答案。MCP提供的是標準,但標準的普及和適配仍需要時間。

「注」:去年Workflow幾乎成為Agent的標配,但也成為了Agent通用化的軟肋。我們也看到一些變通的工作,比如自動工作流生成(AFlow)。未來,是否應該是自動Agent生成(無Workflow)。

「注」:「Less Structure, More Intelligence」,這是極具Unix哲學的理念。

「注」:再回頭看,「虛擬機」和傳統意義的工具(搜索、瀏覽器、IDE)的差異是什么?想一想PC時代的人機關系:它是不是一直都是連接這些工具和人的「MCP」?當然,現在叫ACI(Agentic Compute Interface)。


「注」:打了榜,仍有質疑。不打榜,連牌桌都上不去。


「注」:先試被「驚」到,然后打開YouTube,試了一下「K」和「3」……


「注」:AHPU,這應該是智能體時代的「用戶停留時間」了。


「注」:所以大模型時代的「殺手級應用」出現的時刻,也是大模型的「摩爾定律」誘發質變的時刻。更小的模型、更快的性能、更優的結果,歷史經驗告訴我們創新就是這么「既要也要還要」產生的。

「注」:從「Use Browser」到「Not In Browser」,再到「Browser In Cloud」。這產品思維也是沒誰了!

「注」:虛擬機提供了兩個重要的技術價值:「錯誤容忍(Fault Tolerance)」和「無狀態化(Stateless)」。

4. 使用體驗




「注」:引導提示詞輸出金句SVG是「繼剛」的專長,Manus將此效果進一步放大了。








5. 暴論輸出

「注」:很好,行業里的熱門詞基本上都在這了。

「注」:未經校驗的預測永遠都會被懷疑,沒毛病。

「注」:「這不就是XXX么」的潛臺詞是「我X,這我也能搞啊」,然后是拍一下大腿「為啥我沒這么搞」,再然后就是「好事怎么讓你給占了」,最后含淚吞下一片「奧美拉唑」。


「注」:反正不是在套殼,就是在套殼的路上,你套我套大家套,掙錢嘛,不寒磣。

「注」:從早上200星開始關注,刷著勁宇的朋友圈(PS:也是AFlow的作者),眼看著一天破萬星,社區熱鬧得感覺過了個小年。當然OWL也很錯了,現在也破萬星了。


「注」:有時給人的體感就是這樣,「Money Out, Infra In; Training In, LLM Out」,好像大模型時代的創新只有大模型了,是不是還是技術鄙視鏈在作祟?

「注」:簡單說就是「我能接受你笨點,但別讓我手把手教」,想想你帶不動的「隊友」是不是也醬紫?


「注」:先不說模型能不能做到,如果這個世界「豐富」到只有模型,你覺得會是好事嗎?



「注」:你的大廠會跟進,但你的老板還真不一定哈哈……






「注」:無意義的爭論純粹是浪費時間。

「注」:看「Richard Lin」直播Manus時,經常會說「我這是不是在PUA他」。看看最近熱門的「PUA提示詞」,動不動就是「干得好獎勵十個億,干不好你老婆就沒命」。人和AI的博弈,才剛剛開始。


「注」:2025,與君同行!
參考資料
- Manus沒有秘密.pdf
若本文對你有所幫助,您的 關注 和 推薦 是我分享知識的動力!
浙公網安備 33010602011771號