大反转!刚刚爆火的Manus,一觉醒来又被骂惨了...

科技狐 2025-03-10 10:56:08

人类似乎又要为 AI 沸腾了。

3 月 6 日凌晨,不睡觉的技术宅们彻夜蹲守,见证历史:

国产首款 AI 智能体 Manus 被推出,产品一经推出,瞬间引爆了整个 AI 圈,也有不少人说它超越 Deepseek ?

国产 AI 又一次爆火,它的邀请码,不到一天之内,就在闲鱼上被炒到 5 万、甚至 10 万块。

Ok,既然这么火,那我们今天就来聊一下Manus,看看它究竟有多强?不过在聊它之前,或许我们要先了解一下它的身份——AI 智能体(AI Agent)与过往的AI究竟有什么不同。

什么是 AI Agent ?

Manus 之所以可以震动整个 AI 圈,关键在于它在功能上与过往有本质区别。

根据 OpenAI 对我们的 AI 有不同智能分级,主要分为 5 个等级,从 L1~L5 :

L1 Chatbot:AI 提供信息和建议,并能与人类对话。

L2 Reasoners:AI 能解题,能进行基本的推理和解决问题。

L3 Agent:能够为人类执行任务,甚至完成复杂的工作流程。

L4 Innovations:不仅可以完成任务,甚至还能创新,提出新的解决方案。

L5 Organizations:最高级别 AI ,能处理大量复杂任务,在某些领域可以取代人类。

是的,你没看错,其实我们接触到 ChatGPT 和 Deepseek ,都只停留在 L1、L2 水平,当我们给它 Prompt 后,它更像一个大脑,搜集整合资料,然后给你建议、推理,但到头来,活还得要我们亲自去干。

而 AI Agent ,则是达到了 L3 的水平,只要我们给它一个任务,它就能逐步拆解,并且按照流程完成任务,并不像 L1、L2 ,只会说,不会做。

我这里用大白话举一个例子:

例如说老板要你做一个复盘 PPT ,过往的 Deepseek ,我们给提示词,然后它就一次性给你生成一个 PPT 的建议或者框架,也不管你合不合适,要想真做出 PPT ,你还要熬个夜,秃个头,改稿、排版。

而 AI Agent 则完全不需要那么麻烦,你给它做 PPT 的目标,它就会自己设定思路,自己分解任务,然后逐步完成。接着它还会在初稿上自我 PUA ,不断思考自己哪里写得不够好,然后修改,一直反复这样的动作,最后把一份非常不错的终稿发给你。

你要做的,只管验收,全程躺平。

你有没有发现,相比过往“纯嘴炮”的生成式 AI ,AI Agent 的干活思路和人类几乎一模一样,你得到的,完全是一个数字世界里的“牛马工具人”。

Manus 究竟有多强?

那 Manus 现在能帮我们做到什么程度呢?在 Manus 的官网视频里,他们有演示了三个简单的任务。

第一个是简历筛选。

官方丢给它一个装有 10 份简历的压缩包,注意,这里它就已经展现出了人的主观能动性,自主解压缩包,然后浏览每份简历,而且在它执行的过程中,我们还能给它添加新的任务,视频中,工作人员再给它上传 5 份简历。

在 Manus 最后的结果中,它不仅会对应聘人的能力、经验进行排名,甚至它还会自动生成用户喜欢的表格形式。

Manus 视频演示了三个案例,我这里就不多赘述了。除此之外,官网也还有其他案例,例如说:寻找 B2B 的最佳供应商,特斯拉股票分析,制定 4 月份日本旅游计划等等。

从这些案例我们可以看出,Manus 与过往的 AI 大模型,是真的完全不一样,它不仅有自主能动性,会规划流程分,还会调用各种工具以确保执行任务的能力:例如压缩包解压,调用金融工具,Python 编程等等。

最重要的是,它不再只是单纯“嘴炮”给一个答案,而是结果导向型,不断执行直至拿到结果,最关键的是,它执行的过程中,比现实很多人思路都要清晰。

当然,从这个角度上来看,很多自媒体声称它 “ 全面超越 Deepseek ” 或许并不正确,他们两者并不在同一个赛道上,难以对比:Deepseek 更像一个“ 最强大脑 ”,而 Manus 则是执行力非常强的 “ 牛马打工人 ”。

Manus 引来众多争议

虽然 Manus 成功实现刷屏,但同时也引起了不少的争议。

Manus 干活靠谱吗?

目前 Manus 并没有完全开放,真正体验过的人并不多,除了官方演示以外,谁都无法保证 Manus 干活的质量,它究竟能创造多大的价值?

网络上有一些博主拿到了邀请码,并且进行了实测,会发现 Manus 的实战效果确实不如想象美好。

例如说有博主要求他“ 收集 3 月 6 号晚上 22:43 ,50 条不同人在社交媒体上发布的人生感悟,整理成 PDF 。”

虽然它能理解任务需求,但在第一步收集数据的时候就卡住了,数据完全收集不了。哪怎么办呢?它直接就开始一通乱编,并且结尾还很实诚地告诉用户:我没找到数据,不过我还是很努力地去编了一下,顺利完成了任务。

很明显,它确实完成了任务,但结果并不如意。

Manus 只是套壳?门槛极低?

在 Manus 刷屏的同时,也有不少专业人士指出,Manus 的门槛并不高,没有创新,只是“ 套壳 ”。

对于这一点,Manus 团队并不避讳,其创始人肖弘在面对媒体采访时说道:

“ 模型在快速发展...在这个时候,单纯做应用可能更简单一点,我们不用投入大量资金训模型...这不是冲突的或者零和的,而是叫做 ‘ 做应用 ’ 还是 ‘ 做模型 ’ 的问题。”

很明显,Manus 团队在面对做模型还是做应用的问题上,他们选择了做应用。

但一个 AI 是否有价值,并不在于它是模型还是应用,而是它的实用价值。

举个最近的例子,为什么腾讯元宝能够超越豆包成为第一的 AI 应用?有人说老马有钱,烧了近 3 个亿投放,但这只是一方面。另一方面,人们选择它是因为:它能够提供不卡顿的满血 Deepseek ,虽然腾讯元宝也只是套壳 Deepseek ,但这就是实打实的价值。

Manus 能实实在在地、有流程地做出更好的结果,节省精力,提升了效率,价值是实际存在的,虽然尬吹堪比 Deepseek 有点不切实际,但也不能否认,Manus 是一个很好的应用产品。

在 2025 年初,OpenAI 的山姆奥特曼在博客写下了年度目标,2025 将会往 AI Agent 发力,可见未来的 AI 领域,绝不仅仅是大模型的领域,而是包括大数据、AI Agent 等上下游的整个产业链。

我认为关键的地方是:它把 AI Agent 带到了大众的视野,未来将会有更多资金和人才进入这个赛道,将 AI 的生产力普惠给更多人。

邓小平同志说过的一句话大家非常熟悉:科技是人类的第一生产力。

这几年,AI、机器人一天一个样,未来似乎唾手可得。当然,作为文案的我,心里面多多少少会有些被替代的焦虑,但更多的,却是对未来已到的兴奋与期待。

参考资料:

1、《吴恩达探索AI Agent及代理推理的崛起 | BUILD 2024》,吴恩达;

2、《一文理解生成式AI应用的五个级别:Tool、Chatbot、Copilot、Agent 和 Intelligence》,明明如月学长;

3、《独家对话Manus肖弘:世界不是线性外推,做博弈中的重要变量》,腾讯科技;4、《拿到Manus的邀请码之后,我赶紧问了4个问题》,刘润;5、Manus官网;6、山姆奥特曼的博客。

编辑:志坚

0 阅读:1
科技狐

科技狐

每日分享科技、数码、汽车、商业、TMT、AI 的新媒体。