【AI智能体从“参谋”到“执行者”的跃迁?Manus:一场诡异的狂飙】萍聚社区-德国热线-德国实用信息网人工智能

新闻发表于 2025-3-7 22:31

AI智能体从“参谋”到“执行者”的跃迁?Manus:一场诡异的狂飙

作者：微信文章

元界由《权力、资本与商帮》作者王俞现主理

大有讲究，2025年政府工作报告里的大不同

杠DeepSeek、撕硅基、讽前CTO：一个人的失控与AI圈24小时震荡

动动嘴边子，AI帮你干完活儿。

3月6日，一款由中国团队开发的名为Manus的AI产品，莫名其妙地刷屏。据传用户疯抢内测资格、邀请码被炒至5万元天价、资本市场东财AI智能体概念股大涨超8%……这场狂欢背后，既有对AI技术落地的狂喜，也夹杂着无端窜出的“诡异”。

Manus究竟是一款让AI智能体实现从“参谋”到“执行者”转变的超级工具、一个让AI智能体角色范式实现革命性跃迁的重大承载载体，还是资本与技术不经意合谋、没承想超越预期达到了哗众取宠程度的把戏？

一场从“参谋”到“执行者”的范式跃迁？

Manus被定义为全球首款通用型AI Agent，其核心价值据说是打通AI落地的“最后一公里”，让AI技术从“纸上谈兵”升级为“真枪实弹”。

当传统AI还在生成建议时，Manus已能像人类实习生般自主规划和执行复杂任务，比如自动解压文件筛选简历、调用工具分析股票数据、生成可视化报告等。

Manus的突破性价值体现在其重构了AI与人类协作的底层逻辑，完成了从“辅助决策”到“自主执行”的范式跃迁。

Manus构建了端到端任务闭环，通过整合Claude 3.5、DeepSeek等七大模型形成“多智能体交响乐”，实现“规划-执行-验证”三阶段协同：规划代理拆解任务目标，执行代理调用代码编辑器、浏览器等工具链，验证代理则模拟人类质检员进行成果核验。

这种架构使Manus具备“类人类实习生”的能力边界——既能批量处理简历生成带排名的Excel报告，18分钟完成传统HR 8小时工作量，又能执行股票数据抓取、清洗与可视化分析，40分钟产出投行级报告，甚至在医疗场景交叉分析CT影像与化验数据，展现“数字全科医生”的跨领域穿透力。

其技术革命性更在于“动态进化机制”：通过记忆用户偏好（如优先输出表格格式）持续优化执行策略，形成“执行-反馈-提升”的闭环。

这种从“被动响应”到“主动服务”的转变，标志着AI首次突破工具属性，成为可独立交付成果的“数字劳动力”。

正如某金融机构实测显示，Manus处理财报分析的错误率较人类分析师降低28%，揭示出人机协作模式的重构已进入深水区。

光环下的六重阴影

不过，这场由Manus掀起的狂欢浪潮，在社交媒体与二手市场的喧嚣中逐渐显露出裂痕。在刷屏狂欢与高调的背面，一些显而易见的瑕疵也带来了潮水般的质疑——当AI从“建议者”变身“执行者”，它的可靠性是否经得起推敲？

Manus的48小时魔幻剧，犹如一剂显影剂。在工程创新层面，在底层模型被欧美卡脖子的现状下，国产团队秉持“不造发动机，但能造最好的赛车”的实用主义智慧，试图用"虚拟机沙盒+工具链调度"实现弯道超车，有其积极意义，但其是否是一个打着通往AGI道路旗号的没有技术根基的早产儿？

1、技术镀金术：

当科技博主用Manus为“纽约买房攻略”的演示视频欢呼时，技术社区却亮起红灯，发现其GAIA测试成绩存在选择性对比的"田忌赛马"嫌疑。GAIA测试成绩遭扒皮——评测标准不透明、对比对象选择性忽略。

MIT学者指出其依赖专用工具链，“如同带着计算器参加数学竞赛”。

2、套壳争议实锤：

Manus技术文档承认调用Claude、通义等第三方模型，界面与Stable Diffusion高度雷同。网友发现其前作Monica插件就是“ChatGPT套壳”，质疑“新瓶装旧酒”。

3、营销罗生门：

更诡异的是，海内外声量温差巨大——国内200+自媒体矩阵式刷屏，海外却仅有零星讨论，这种"内外温差"让舆论场陷入"捧杀与扒皮"的拉锯战。

200+自媒体矩阵式轰炸、科技KOL集体“自来水”站台，与“零推广预算”声明自相矛盾。二手平台天价邀请码乱象，被指“饥饿营销催熟估值”。

4、人才配置谜题：

团队46个岗位中无AI模型研发职位，最高薪集中在Linux内核与虚拟化领域，暗示核心竞争力在于工程封装而非底层创新。

5、成本黑洞：

单任务成本2美元看似低廉，但长上下文处理易致推理链断裂。若全面开放，算力开支或拖垮初创公司。

6、法律灰色地带：

自动签署电子合同、生成投资建议等功能涉及合规红线，却无风险提示。律师警告：“AI生成的财报若出错，责任该甩锅给谁？”

这场争议不仅关乎技术真实性，更折射出AI产业的深层困境。当团队联创在24小时内两次公开致歉，在资本狂欢与技术焦虑的夹缝中，谁能守住创新的底线，而不仅仅是为了哗众取宠？

“开箱验货”的时刻终将到来

当二手市场5万元天价邀请码的热潮退去，当资本有关AI智能体的炒作退去，Manus正面临决定其存亡的三重考验。

首先，其承诺开源的推理框架将接受开发者社群的严苛检验。GitHub社区已出现OpenManus等开源平替项目，仅用三小时代码量就复刻了Manus的核心功能，这使得Manus必须证明其开源版本不仅仅是API调用说明书，而是包含真正创新价值的架构。

技术文档显示其依赖Claude、通义等第三方模型的现状，让开发者质疑其底层技术原创性。若开源后被发现核心模块存在工程化取巧，如金融审计红线的硬编码漏洞，将直接动摇技术公信力。

在任务处理能力层面，Manus在结构化任务建立的SOTA光环正在遭遇认知悬崖。虽然能高效完成股票数据分析和简历筛选，但在处理模糊指令时暴露明显短板。例如判断初创团队潜力这类需要跨领域知识迁移的任务，系统过度依赖专利数量等显性指标，却无法识别工艺know-how等隐性价值。

实测显示，当要求评估半导体企业技术壁垒时，Manus仅能完成40%有效分析，其余部分仍需人工介入。这种认知局限源于其意图解析机制尚不能将主观表述转化为多维量化指标，也无法有效整合商业分析模型、心理学模型和法律模型的交叉验证。

更严峻的挑战来自行业巨头的降维打击。阿里、字节等企业将同类功能嵌入钉钉、飞书等办公生态，这款初创产品如何避免沦为"技术演示玩具"？大厂积累的电商交易流、内容生态数据可训练出更精准的垂直场景Agent，而Manus的通用性反而成为竞争劣势。

价格绞杀同样致命，巨头自有算力集群能将单任务成本压至0.2美元，相较Manus现有2美元的成本结构形成碾压优势。要突围，Manus必须在医疗诊断等专业领域建立不可复制的工具链，例如FDA认证的影像分析模块，同时通过开源中间件吸引开发者共建插件生态。

这场生死博弈的本质是验证工程创新与规模效应的对抗关系。正如硅谷观察者所言，Manus的价值不在于当前生成报告的数量，而在于当巨头入场时是否已构筑足够深的场景护城河。

这场赌局的答案，已经不仅仅藏在代码与市场的双重验证中。

诡异狂飙下的冷思考

Manus既是工程创新的火种，也是行业浮躁的镜鉴。继DeepSeek爆火之后，Manus团队试图用“多智能体协作”架构串联起200+工具链，在巨头的遮天蔽日中撕开一道缺口，值得称道。

但技术镀金的另一面，是预设流程包装的“自动化魔术”、GAIA测试中的“田忌赛马式”对比，暴露出创新与取巧的模糊边界，并操之过急地利用了中国人渴求突破西方AI霸权的心理渴求。

Manus给中国试图上位、跑入公众视野的AI创业者和创业公司上了一场真切的实验课。这场实验课有着足够打动人心的深层命题：我们究竟需要怎样的智能革命？Manus官网镌刻的拉丁语“Mens et Manus”（手脑并用），这本应指向人机共生的理想图景，却在饥饿营销与天价邀请码的喧嚣中，沦为流量游戏的注脚，这多少有点夸张的违和。

当网友戏称“与其买空气码，不如充20年ChatGPT会员”，折射的不仅是产品信任危机，更是公众对技术实用价值的重新校准——AI不应是制造焦虑的“职场刽子手”，而该是解放创造力的“认知杠杆”。

时间终将淘洗出真相：那些被资本与念想催熟的泡沫终会破裂，但工程创新的潮水方向不会逆转；那些过度包装的“SOTA神话”会褪色，但多模型协作、任务拆解的探索仍有价值。

真正的技术革命从来并非爽文剧本，它需要耐得住实验室的寂寞，经得起开源社区的显微镜审视，更要在资本狂热与伦理约束间走出第三条路。当潮水退去，或许我们会发现：AI文明的终极使命，不在于制造更完美的“数字打工人”，而在于迫使人类重新回答——

在思考与执行的交响中，何为不可替代的人性光辉？

编辑整理：曹天一

出书撰文合作：yhxgj360（V）

推荐阅读

意外！为什么黄仁勋将AI助手视为AI扩展的下一个里程碑？

院士邬贺铨：智能体好比应用商店，大模型落地需下沉到智能终端

“四大天王”巅峰对决：AI 应用第一战，谁能问鼎王者？

为什么“AI教父”辛顿说中国AI可能会落后几年，但终究会赶上来？

院士张钹：大模型应用呈现“U”形，中国有机会做AI时代引领者

华人数学奇迹年：北大校友领衔改写数学史

深圳气魄：以“催生婆”之心，引领中国新型AI终端革命

为什么微软CEO纳德拉说AI领域不存在赢家通吃的局面？

Deepseek现象级破圈，会动摇孙正义豪赌OpenAI吗？

任正非：年轻人想创业，就要为理想无怨无悔，哪怕沦为乞丐

智谱AI CEO张鹏：人工智能革命到来，大模型创业呈星火燎原之势

清华刘知远：现在想出来创业的学生比之前的十年还多

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI智能体从“参谋”到“执行者”的跃迁?Manus:一场诡异的狂飙