为摆脱“算力荒”,清华大学默默开启一项新研究!

创业家 2024-08-02 18:36:16

i黑马导语

“如果整个物理学研究的是外宇宙的机制,那么整个大脑研究的就是内宇宙的原理。”

自ChatGPT出现后,人工智能已发展成为一种新型“重工业”,其重资产特性体现在算力、数据等方面。

全球大模型热潮,让中美各国的算力需求猛增,加上硬件供应量严重不足,就导致了当前的“算力荒”。

近几年研究发现,人类大脑的能量消耗不足20瓦,但人工神经网络消耗的能量至少是大脑的100倍。

用清华大学计算机科学与技术系教授 Carlo Vittorio Cannistraci教授的话来说:

大脑连接是一个稀疏型的形态学,可做到低能耗、高效率;而人工神经网络是完全连接的,虽然能模仿人脑处理信息的方式完成特定任务,但消耗量非常高。

这意味着,如果人工神经网络能可以模仿大脑稀疏型的连接方式,优化计算模型,或许可将人工智能的能耗降低100倍,从而彻底破除“算力荒”的困境。

由此,清华大学默默开启了一项新研究:尝试构建出一个可持续性、高效的人工智能网络科学。这也是Carlo Vittorio Cannistraci教授目前正在研究的方向。

近期,Carlo Vittorio Cannistraci教授在“2024北京城市副中心未来产业发展大会”上,详细介绍了自己的最新研究结果和应用方向。他的演讲主题是《类脑计算:面向下一代的高效和可持续性人工智能》。

以下内容经《i黑马》编辑整理:

01

模仿人脑高效率、低能耗

打造下一代人工智能网络

首先,介绍一下我的背景,我是来自于清华大学脑与智能实验室的复杂网络智能中心。

我的研究方法,是一种跨学科的研究方法。主要整合了信息理论、机器学习和网络科学,来调查不同层面可适应性的复杂系统物理学。包括分子、生态、社会系统,主要关注类脑、类生物计算,以及复杂的大数据等。

我们研究的整个理论背景,涵盖了网络几何学、网络形态、网络自适应模型。此外,我还比较关注神经科学、生物医疗和社会科学。

如果你去我的主页,除了能看到我的研究内容,还会看到这样一句话:“如果整个物理学研究的是外宇宙的机制,那么整个大脑研究的就是内宇宙的原理。”

所以,我的研究是两个跨学科的机制,不但会研究整个大脑,还会关注整个外宇宙之间的工程和复杂系统。

我所在的研究中心,目前研究的是复杂网络。我们能看到(如下图),大脑连接是一个稀疏型的生态学,且是非常高效,它的能量消耗不足20瓦。但现在人工神经网络是完全连接的,消耗的能量非常高,是大脑消耗能量的100倍。

所以,我的研究方向是:模仿大脑去创造一个稀疏的形态学,进而打造下一代人工智能网络,能模仿大脑的高效率和节能性。这也是当下我们正面临的一大挑战。

这里我提议,中国未来应该投资更高效的人工智能来应对各种挑战,否则有可能在新一轮竞争中丧失已有优势。

02

读硕士期间我经常思考:

为什么大脑连接是稀疏的?

2002年,我在米兰理工大学读生物工程硕士。当时,我就在想:

为什么大脑连接是稀疏的?

从这张图可以看到,大脑连接的神奇之处在于,大脑的连接是稀疏的,这也是为什么大脑可以如此高效。

于是,我又想到,这能给人工神经网络发展带来哪些积极影响?如何让人工神经网络模仿大脑去创造一个稀疏的形态学?这就是我们研究领域常说的“拓扑学”。

我当时找到一个计算机科学的教授,问他是否能将拓扑学应用到人工神经网络呢?但我的提案被教授们拒绝了,原因是他们认为拓扑理论应用在人工智能神经网络是不好的。

所以,你就能够理解当时人工智能神经网络领域的研究为什么不成功,因为当时的人工神经网络的研究方向并不符合未来人工智能的发展。

或许,我们需要打造一个新的大语言模型,更好的模仿大脑去创造一个稀疏的形态学。

03

我打造出一个新原理

“网络自动机”

为此,我选择了继续读博,研究生物神经网络,我就想知道什么是神经网络,进而研究了不同的质体。

比如,人脑不同的神经元之间是怎样互动的?图形和网络有什么差别?图形是单个点,而神经网络是各个节点和线条连接起来。

从生物工程学来说,我们可以看到不同图形连接的情况,看到各种动物在生态系统中是如何相互关联、相互作用的,以及人类可以通过互动可以打造一个社群。

所有这些都显示了:神经网络能够帮助我们去研究各种复杂系统,包括整个生态系统、社会系统等。

当时我的想法是:我们大脑中的原理,与宇宙中不同尺度上存在的其他复杂系统所使用的原理非常相似。

比如,在计算机科学中应用到的网络学习,我们当时还研究了为什么神经元打造的神经网络可以进行深度学习?

从这个研究中我发现,通过训练我们可以进行网络学习和连接。我们想研究的是学习和功能如何改变整个网络的连接形态,以及如何连接网络的不同部分。这也是我整个研究的重点。

此外,我还提出了“复杂网络智能”的概念。这个概念的要点在于,研究网络连接性的修改如何与智能复杂系统中的功能性修改相关联。比如,使用网络的连接性影响不同复杂系统的功能,尤其是学习和智能。

我最初的想法是:我有一个网络,可能是各个神经元、社会系统中的各个人,或是整个蛋白质等,我进行预测之后,可以改变成右边的图片。也就是,去打造更多的互联性或者连接性。

给大家举个例子,我们看一下这种当代社区的范式,从左边这张图可以看到,连接的形状会影响新连接出现的位置。

再比如,在日常社交中,如果悦和英涛两个人互不相识,但有三个共同朋友,他们之间产生互动的可能性会比没有共同朋友时更高。然而,如果这三个共同朋友之间有连接(他们彼此认识),那么悦和英涛之间产生互动的可能性会更高。

所以这一理论来讲,我们不同人之间的交互,可以增加个体的交互总量。当然,要确保的一点是,人们之间能够相互打招呼、相互互动。

大脑神经元也以这种方式相互作用。我发现并用数学公式描述的这种机制,在社会、大脑、经济以及许多其他复杂系统中都有相似的表现。

所以,我打造出一个新原理——网络自动机。这个新原理,能够预测更多复杂系统。

关于这一理论,我和同事共同发表了一篇论文,使用建模方法预测不同蛋白质之间的相互作用模式,独立地证实了我的理论的有效性。

电子科技大学的周涛教授在一项独立研究中证实,我的理论在基于二阶或三阶路径连接的网络预测中表现最好。

04

中国未来应加强这一方向的投资

接下来,跟大家介绍一下我研究的应用领域,第一个是应用于蛋白质相互作用的预测。

我们知道,Alphafold是谷歌提出来的一个方法,这个方法的新版本能够预测生物分子的相互作用,也让人工智能有了全新发展。

在这篇研究文章中,我们使用了网络自动机的方法,对分子的相互作用进行了预测,结果我们的方法比Alphafold的表现更好。

这张图向大家展示了,Alphafold和我们模型的结果对比,看得出,我们的预测结果更好,我们预测的性能也是更高的。

下面这张图可以看出,我们的方法要比Alphafold快大概50分钟,这也让我们在未来更具竞争力。

大家知道,我在2002年读研时,就提出这样一个问题:如何去利用大脑的连接稀疏性?

这几年,我们已经看到,训练AI大模型的成本非常高,这样下去是不可持续的,因此我们要打造一个新的网络方法。

可以看这张图,显示了稀疏的AI芯片开发商,他们在A轮中融到了数千亿美元的资金,也让我读硕士期间的提议变成了现实。这也是美国比中国发展更快的一个点。

目前,中国有一家公司(Moffett AI )投资了稀疏化的训练,而美国已有很多公司投资了稀疏训练。因此中国需要加大对稀疏训练的投资。

在这项研究中,我们引入了一种创新的类脑稀疏训练方法。

这张图向大家展示了我们发明的训练算法。最终执行之后,我们发现整体性能提高了,同时网络中的交互和节点数量减少了。

在测试中,我们将网络连接起来后,只有1%的连接,这个网络是非常稀疏的,我们的模型性能比整个完全连接的网络的速度要更高一些。

目前,谷歌的一些网络无法完全达到这样的性能,所以从这一点看,到我们的类脑研究已经有非常大的进展了。

这张图向大家介绍下清华团队,未来我们的研究:

第一点是生物医学建模的复杂系统和网络科学;第二点是利用脑网络神经科学研究来发展人工智能稀疏训练,这是中国需要加速研究的;第三点是研究高效人工智能的神经形态计算。

[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]

1 阅读:236

创业家

简介:读懂中国最赚钱的7000种生意!