来源:图灵人工智能
本文讲座图文讲稿整理自Yann LeCun在Hudsonforum Youtube频道的讲座,公开发表于2024月10年13日。原始内容参考:https://www.youtube.com/watch?v=4DsCtgtQlZU
杨立昆在Hudsonforum的主题讲座★内容导读:
Yann LeCun在本次演讲中主要阐述了以下观点:
对人类水平AI的需求与现状差距: 我们迫切需要人类水平的AI来增强人类智能,提高生产力与创造力。但当前AI系统(包括LLM)缺乏理解世界、记忆、直觉、常识、推理和规划等人类能力。现有AI技术的局限性: 当前AI的成功依赖于自监督学习,特别是通过重建来学习表示。但这种方法主要局限于离散数据(文本等),无法处理连续数据(视频等),也无法实现真正的推理和常识学习。Moravec悖论体现了这一点:对人类来说简单的事,对机器却很难;反之亦然。数据量与学习方式的差异: 人类幼儿在短短几年内获取的数据量与大型语言模型相当,但学习方式截然不同。人类的学习依赖于丰富的多模态数据(视觉、听觉等),而不仅仅是文本。目标驱动AI架构的提出: 为了克服现有AI的局限,演讲者提出了一种名为“目标驱动AI”的架构。该架构的核心是通过优化算法进行推理,而非简单的逐层前馈计算。这允许系统根据目标和约束条件,规划并执行一系列动作。世界模型与层次化规划的重要性: 目标驱动AI架构的关键在于“世界模型”,它模拟了世界的运行方式。层次化规划是实现复杂任务的关键,但目前AI系统在这方面能力不足。学习世界模型的挑战与方法: 学习世界模型的关键在于如何从视频或现实世界中学习常识和物理直觉。单纯预测视频像素的方法失败了,演讲者建议采用“联合嵌入预测架构”(JEPA),学习抽象的表示,并在该表示空间中进行预测。JEPA架构的优势与训练方法: JEPA架构避免了生成模型的局限,更有效地学习世界表示。训练JEPA需要防止模型坍塌,演讲者提出了一些方法,例如信息量最大化和蒸馏式方法。开源AI平台的必要性: 为了促进AI的公平发展和文化多样性,AI平台必须开源,这需要像Meta和IBM这样的公司共同努力。通往人类水平AI的道路: 通往人类水平AI的道路漫长而充满挑战,并非一蹴而就,而是一个渐进演化的过程。目标驱动AI架构能够确保AI系统在超越人类智能的同时保持可控。杨立昆简介杨立昆(Yann LeCun)是一位法国裔美国计算机科学家,被誉为“深度学习三巨头”之一。他以在机器学习,尤其是深度学习领域的研究而闻名,其贡献包括卷积神经网络(CNN)的发明和推广。LeCun于1960年出生于法国巴黎,并在巴黎第六大学获得计算机科学博士学位。他于1988年加入贝尔实验室,并在那里开始了对CNN的研究。他的早期工作为后来图像识别和计算机视觉领域的突破奠定了基础。LeCun于2003年加入纽约大学担任教授,并于2013年加入Facebook(现Meta)担任人工智能研究院(FAIR)的创始主任。他领导团队开发了许多重要的人工智能技术,应用于图像识别、自然语言处理、机器翻译等领域。LeCun是美国国家工程院院士,并获得了许多奖项,包括图灵奖(2018年,与Yoshua Bengio和Geoffrey Hinton共同获得)。他是一位活跃的研究者和演讲者,致力于推动人工智能领域的进步和发展。讲座图文讲稿我将讨论人类水平的AI,或者我们如何实现它,以及我们又将如何无法实现它。首先,我们确实需要人类水平的AI,因为在未来,我们大多数人都会戴着智能眼镜或其他类型的设备,我们会与它们交谈,这些系统将拥有助手,也许不仅仅是一个,可能是一整套助手。


