人工智能产业近年来呈现爆发式的增长,种种发展和变化时刻冲击着大家的认知。AI距离真正人类的大脑还有多远,将从何种途径达到这个目标,而对于国内产业又有怎样的启示?北京大学博雅特聘教授姚洋博士对话尹烨博士,将从生物学家的角度为大家解读:人工智能距离达到人的智力还有多远?
姚洋:从一个生物学家的角度来看,我们现在的人工智能离我达到我们人的这个智力还差多远?大语言模型能不能产生AGI?
尹烨:其实这个问题到今天现在并没有一个统一的答案,我们今天讨论的人工智能实际上已经是第四波浪潮了。
1956年从达特茅斯会议第一次提出所谓的AI这个词,历史上已经经历过三次,我们说高估近期,低估远期,高估近期、低估远期,几起几落,但是这一次为什么人工智能就引发了全世界这么大的一个讨论?我觉得有两个核心的问题。
第一个核心的问题就是算力够了。算力够了,人类第一次通过不断地叠加GPU叠出算力了。就是我们所讨论的人工智能有三个最重要的支柱,数据、算法、算力。算力因为摩尔定律依然在生效,因为现在GPU的这种先进的光刻机的制程,比如说苹果的16pro版本已经是3纳米制程了,也就是说我们用同样的能量可以制造出比以前强大得多的计算机,或者说超级计算机。
第二个问题就是移动互联网。移动互联网现在在全球60%人中普及了。也就是说今天如果我可以把这两件事结合在一起,它会瞬间得到大量的语料的使用。
如果大家都在使用,还是一个赢者通吃的逻辑。比如说大家都在用ChatGPT,在国内我们也有很多的软件。用的人越多,你就可以在用的过程中得到大量的所谓循环反馈,使它的语料变多。
所以这一轮真正的爆发点就是在ChatGPT。它终于可以根据我们人类最开始就是我问你话,你已经可以给出一个感觉上是有智能的答案了。
这是在2023年的2月份。因为去年您还记得刚出ChatGPT的时候。感觉国内跟得都挺快,顶多就是胡说八道的程度不同,你可能60分,它可能70分都没有。
但是今年真正让我感到震撼的是大年初七的Sora。然后Sora实际上它是第一次文生视频了,就是给一段文字却能生出视频。而且生出这个视频的逻辑,它不是像我们以前的视频,大家认为就是若干张图片的堆积。它这次不是若干张图片堆积了,它是直接输入类似于函数一样的东西。
通过函数就像我们在物理世界里去制造一些,比如说光影甚至是力学。所以当时对我的震撼非常大,我说这可能是人工智能的一个“牛顿时刻”。不完美,但是我们看它已经具备了科学的一个模型了。
这是今年对我的第一次震撼,第二次震撼是2024年5月时发布的GPT-4o,就可以干什么了呢?不是简单的文字描述了,它可以比如说语音、视频,甚至呼吸声,它开始关注你的微表情。那你跟这个玩意儿聊天的时候,这么来讲,它越来越像一个虚拟的伴侣了。而且最近的这版它已经可以插话了,就不用完整地听完。
它可以就像咱俩这么聊天,它提出很多的这种输入的暂停,然后立马就接上,而且这个时序都是在百毫秒级了,也就是让你感觉非常像在跟真人聊天。
OpenAI CEO Sam Altman
但是当时大家都在等一个东西,就是等奥特曼(OpenAI实控人),他一直在讲一个词说我要发布这个叫草莓,他当时写的就是strawberry,实际上大家在猜是不是GPT5。结果前几天出来了,它不叫草莓,它叫o1。
o是orion就是猎户座的意思。他说这是一个全新的模式,就是说重新把这个计数器调成0和1。o1看起来不就像零和一吗?我请我海外的朋友们帮我测试。有一个指标非常有意思,2024年中国的高考数学题,理科卷子但凡能够用文字输入进去的都喂给它了,都是几秒到十几秒之后反馈的,都是满分全对。很夸张,140多分。只有一道题是一个图题,它现在读不了图,所以这个不能算,估计如果能把这个图说清楚,它还是满分。
姚老师这是第一次我们看到了这个玩意儿不是文科生了,它开始有数理逻辑了。从过去的大语言模型这个点上,我们更多地是用一种相当于找关键词的方式来去进行下一步的预测和生成。
但这一次他用了一个新的概念叫COT(Chain-of-Thought),叫思考链。这个东西它有点慢了,就是说以前你知道我们用这个ChatGPT,我恨不得打进去,它立马就开始回答了,不管对不对,有枣没枣的我先说。这次不是了,输进去以后它要先想,就是你等待的时间变长了。
有一本书可能咱们都看过,就叫《思考,快与慢》。快就是我们冲动消费,慢就是我们理性决策。它有点像那个慢的了,它先想,先把这个问题分解,这到底是物理问题、化学问题、逻辑问题,先拆,拆完了以后再逐一地分层一步一步推,所以它叫思考链。它不是直接拿到关键词,我就按照我的所谓的一种预测开始噼里啪啦给你说。
所以这个东西出来了以后,其实就一个多礼拜,我们都炸锅了。乐观的人就觉得,首先您刚才讲到的大语言模型,大语言模型其实要大算力。大算力那个词现在在AI界叫做标度律(scaling law),简单地讲堆GPU就能堆出一个智能出来,类似于我们的量变引发质变,只要我GPU买得足够多,我就能堆出来。
这就是从这个角度来思考的,就让这种标度律又有活下去的可能了。有一段时间大家觉得也许不是这个样子,要换一个方式了。更加激进的就认为通用人工智能来了,这是AGI。
其实我想一下,应该就是之前奥特曼写了一篇《下一个时代的人工智能》,他第一次强调了一个词叫ASI Super intelligence。就是说我们以前就管这样的叫强人工智能,他加上就叫超级人工智能。当然他说这个话很有意思,可能会在未来的几年到十年之内实现。
这里面给出了一个非常重要的判断,什么叫强人工智能或者叫超级人工智能。我们现在的理解,一般来说今天的人工智能还只能有中生有,还不能无中生有,是吧?无中生有我们就叫discovery,大部分都属于Science的内容,是科学。有中生有可以是技术。因为科学已经它的原理是完备的,所以这个玩意儿如果有一天突然它可以从无中生有,那姚老师我俩真的就可以下岗了。
姚:那是,我们要失业了。(笑)
尹:我这段时间看到的就整个人工智能还有几个新事儿,一个就是他们发明了一种五十几种语言的类似于同传工具。就你讲什么话,五十几种语言,它就立马给你翻译出来。你还记得在《圣经》的故事当中聊过一个巴别塔吗?就是大家想造一个塔,后来上帝说这不乱搞吗?都到天堂了,我让你们讲不一样的话。现这个叫逆巴别塔。因为不管讲什么话,我都通过人工智能把上帝不同的语言变成相同的语言。
从这个题上讲,这批人这是一个很有意思的事情,这事情刚结束,然后OpenAI的CTO,一个女性辞职了,就出来这么一个很牛的玩意儿以后她就辞职了,为什么呢?这个就是大家现在众说纷纭。如果熟悉半导体历史的时候,当时硅谷仙童公司就最开始创业的时候也有这么一段。大家都看到了半导体,特别是晶体管和所谓的集成电路。在这种所有人都需要的那个初期,八个创始人联合辞职,所以当时开玩笑叫做“八叛徒”。
现在说没准OpenAI用人工智能时代复制了半导体时代的八叛徒。因为这个时候生态位太好了,谁也不想在一个所谓的公司里面,我们高管内卷,政治斗争。对,没有意思,我出去独挑一摊,就是机会太好。所以这就是我们今天看到的,整体上人工智能的这样一个生态。
我现在特别担心的就是,我们国内好多的朋友还没有反应过来,看不懂看不明白,觉得这个玩意儿不挣钱,但真的追过去的时候,我就怕我们赶不上。