香港大学马毅谈智能本质：现在的大模型只有知识没有智能

“过去十年人工智能在技术端上迅速发展，但在‘智能’上并没有界定清楚，把智能跟知识完全混淆在一起，一个系统有知识就有智能了吗？”

12月13日上午，在上海人工智能实验室发起并主办的首届“浦江AI学术年会”上，香港大学计算与数据科学院院长、AI讲座教授马毅进行了一场“探讨智能本质”的演讲。

马毅在演讲过程中，对现在主流定义的“人工智能”打上了问号。他认为，过去十年人工智能在技术端上迅速发展，但在“智能”上并没有界定清楚，把智能跟知识完全混淆在一起。

真正的智能是什么？马毅提到，在1956年的达特茅斯会议（DartmouthConference）上提出对人工智能（ArtificialIntelligence）的定义，智能应该能自我纠正、改进记忆，并能自主获取新知识。目的就是一定要做人区别于动物特有的智能，比如具备抽象能力、符号运算、逻辑推理、因果分析等能力。但现在的GPT有知识但并没有“智能”。

回看过去十年，马毅认为，“人工智能”在做的工作主要集中在图像识别、图像生成、文本生成、压缩去噪、强化学习。不过，这并不是主流的大模型，现阶段相当于在做非常基础层面的工作，包括预测下一个Token（计算机术语，一种用于身份验证和授权的令牌）、下一帧图像。马毅称，Sora的核心原理其实非常简单，本科生都可以了解。

马毅说，当前，人们都在讨论单个模型，认为只要模型足够大，就能通过购买芯片和砸训练数据来实现“智能”。但他认为，这并不能解决所有问题，因为这连自主学习的能力和机制都没有实现，只是展现出人类记忆中的碎片，无论是识别还是生成，都只具备记忆的局部功能。

马毅表示，过去十年我们在智能这一阶段只做到相当于人类听觉（auditory）这一层，现在必须成系统，把多个闭环组织起来，形成对复杂的外部世界的信息整理和提取系统，这才真正相当于人类类脑的机制。

马毅提出的人工智能发展的三个阶段。

他认为，现在的人工智能可以结合自然智能的发展重新定义。第一阶段，类似于DNA阶段，第二阶段，让个体能够有大脑产生记忆，能够自主地学习新的知识，包括纠正现有的知识。“现在个体和动物已经有这个能力，但真正的大模型还没有到这一阶段。”第三个阶段，是掌握人的逻辑，比如符号、抽象、数学和因果推理。

马毅会让学生做一件事，测试大模型明不明白数的概念，“很负责任地说，当前没有任何大模型有自然数的概念。”马毅说。

马毅认为，科学的发展确实到了让人兴奋、激动的时刻，大家都对智能产生了兴趣。但“实际上过去十年可能并没有进步，反而有些退步。”在马毅看来，当下的年轻科学家如果想要超越，拿下一个诺贝尔奖，一定不要随大流，要敢于坐冷板凳。1956年达特茅斯会议上一群人选择做和主流不一样的事，后期这些人都获得了图灵奖、诺贝尔奖。

马毅是AI机器视觉知名学者，1995年本科毕业于清华大学自动化专业，1997年获加州大学伯克利分校（UCB）电子工程与计算机科学硕士学位，2000年获UCB数学硕士学位和电子工程与计算机科学博士学位。博士毕业后，马毅获美国伊利诺伊大学香槟分校（UIUC）教职。

2009年，马毅正式加入微软亚洲研究院，担任视觉计算组的研究经理和首席研究员，并接手由沈向洋创办的视觉计算组（VCG），后来国际上知名的计算机视觉专家何恺明、孙剑等都是马毅当时的同事。

2014年，马毅以全职教授身份加入上海科技大学信息科学与技术学院，成为该学院在计算机视觉研究方向的带头人。2017年，他从上海科技大学离职，全职加入加州大学伯克利分校电子工程与计算机系。2023年1月1日，马毅加入香港大学，出任数据科学研究院院长。