Manus，沒有秘密「注解版」

明浩老師就最近熱門的Manus事件，對AIAgent的技術和產品做了深度的思考，相信看完他的PPT能給你帶來巨大的收獲。

近來Manus走紅，「爭論」不斷，我也在前文《Manus爆火，是硬核還是營銷？》中闡述過自Manus發布后，行業討論以及開源復刻的信息，以及我們如何結合螞蟻圖計算（TuGraph）技術，實踐Graph Manus的方法思路。

昨天，明浩老師在他的播客「屠龍之術」發布了「Manus，沒有秘密 - 70頁PPT解讀AI Agent」，分享了AI Agent的定義、Manus實現邏輯等非常有深度的觀點，并無私地共享了這份PPT。我個人看完后大呼過癮，相信Agent建設者也能從中找到諸多共鳴。我這里結合了個人的理解對其做了簡單的釋義和備注，姑且稱之為「注解版」吧，內容實在太好，忍不住向大家及時分享。

1. 核心敘事

「注」：L1代表案例有ChatGPT，Claude等一系列大模型，從文本生成模型到多模態模型。L2代表案例有GPT-o1、DeepSeek-R1等一眾推理模型，以及早期的ReAct、CoT、ToT等智能體思維鏈探索。L3代表案例有Cursor、Devin、Manus等，但離大家心中真正的Agent可能還有一點距離。至于L4和L5，具體形態如何，可能需要腦補了。

「注」：這些問題很值得深思，比如怎么到L1的，是Scaling Law嗎？怎么到L2的，只是從快思考模式到慢思考模式嗎？

「注」：通用的本質是去特化。模型能力不再受限于數據格式，而是規模；推理能力不再受限于規則，而是獎勵。智能體能力不再受限于流程結構（Workflow），而是簡約設計（Less is More）。

「注」：DeepSeek-R1技術報告剛出來時，諸多反應皆是「大道至簡」，工程人士和架構師的最愛。

「注」：那問題來了，技術人員眼中的「Aha Moment」應該是什么樣的呢？

「注」：那么「提示工程」和「Workflow」到底是不是「彎路」，可能事情并非那么絕對。不過L2讓我們看到了「提示工程」簡化的曙光，L3也讓我們看到了「Workflow」簡化的可能。

「注」：事物的初期一定是不完美的，但「取法乎上，得乎其中」，想象DeepSeek-R1的訓練成本的邏輯，其實是一個道理。這里「看見」應該有幾層含義：一是推理過程可觀測可干預，這是個產品體驗問題；另一個是推理要白盒化，其實就是「開源」。

2. 定義Agent

「注」：這里的嘲諷值直接拉滿了，哈哈。

「注」：其實「套殼」這個詞已經「罵」得很委婉了，寫過代碼的應該都聽過這句話：「你這不就是包了個皮么」，自己體會【手動狗頭】。做模型訓推的看做模型應用的，和當年做基礎技術的看做Web服務的可能是同一撥人，這種行業技術「鄙視鏈」一直存在。但是很多人忘了做模型訓推和基礎技術到底是為誰服務的？吃飯砸鍋，這種事屢見不鮮了。