前言:连续三天的诺奖科学奖解读结束的时候,我陷入了一段沉思,除了生物奖以外,物理奖和化学奖都可谓出乎意料,他们都颁给了神经网络、人工智能相关的领域。
可以说第一次诺奖闯入了图奖的领域了,以至于大家戏称诺奖评委已经被AI绑架,难道这次诺科学家都发给了AI相关,他们自己没有琢磨过影响吗?
AI
有一个学科叫科学学,它是研究科学和科学活动发展规律及其社会能会影响到综合性学科,说一个简单的区别,比如说我们在周围语境,我们常常会把科技连用。
但实际上科学和技术是有紧密联系但又非常不同的两个概念,科学活动是发现人类创造不了规律,所以我们只是不断的去尝,不是宇宙中已经存在的规律,而技术是发明,确实有可能创造出宇宙中之前并不存在的事物。
我们讲的创新、改进、改良,这大部分都是对着技术来讲的,而你把这些技术集成并且规模重复运用于实践,我们一般称工程。
如果把大量的技术集成并通过大规模的组织实施而完成的大型、超大型项目,我们一般叫大科学工程,比如说曼哈顿原子弹计划、阿波罗登月计划等等,在这个过程中所形成的超级工具,我们一般称大科学装置。
这里面就会引出一个问题是先有科学还是先有技术?我们一会儿来回答这个问题,我们先回到今天的主题,AI算不算超级工程?
当然算这次的人工智能的浪潮,它恰好是起源于先进GPU叠加而产生的超级算力,不管是ChatGPT还是sora,它背后的集群算力推测不低于1万张A版芯片,甚至是H100芯片。
马斯克最近为旗下初创公司XII刚刚搭建的AI超级集群,更是集成了10万张H100这个超级训练算力中心,它的造价达到了40亿美金。
从这一刻来看,诺贝尔奖的评委并非被AI绑架,他们可能已经真切的看到了一次新的科学范式转移正在发生。现在已经不是一种感觉,而是实实在在的人工智能本质。
其实人类进入科学革命仅仅500年,我们从1543年哥白尼的天球与训练开始算,或者更短一点,从1687年牛顿的自然哲学的数学原理开始算,真正让我们驶入快车道,应该是二战之后的80年,让人类开始第一次尝试思考、研究科学的。
科学包括科学范式的转化,这一部分的背景复杂,分支很多,只要挑四个关键节点或者说四本科学学的书籍来阐述一下相关的内容。
四个关键点
第一个关键点,1945年,《科学无尽的前沿》问世,这是由范内瓦·布什递交给当时美国的总统杜鲁门,其实他是应罗斯福的要求起草,被称为是美国科学政策的开山之作,但彼时罗斯福已经去世了。
这本书第一次把科学研究做了基础研究和应用研究的这样一个划分,开启所谓的科学研究的线性模式,它系统的解析了科学对国家经济与安全、社会福祉,包括个人发展的重要意义,提出了多项重要的科学政策建议。
比如他强调了科学是国家进步和创新的驱动力,比如他着重提出了要重视基础科学研究,包括呼吁给予科研工作者高度的研究自由。
同时建议政府应该拨款给予资助科研项目,并设立国家级别的研究基金会机构,设立国家实验室,要知道,在此之前,非军事用途的科研基本上是有钱人要么你直接下场,要不借借赞助的游戏。
这个计划的实施结果使得美国迅速摆脱了对欧洲基础研究以及相关人才的依赖,解决了彼时美国科技卡脖子问题,最终成就了美国今日科技强国的地位,也永久改变了我们人类科学发展的一个格局。
第二个关键点,1962年是美国的托马斯库恩所企业的《科学革命的结构》,它是从科学史的视角来探讨什么叫常规科学以及科学革命的本质,它主张应该赋予科学的历史以一种规范的含义,创立出一种涉及到社会学、社会心理学的科学哲学。
基于这个观点,库恩第一次提出了科学范式,一个以科学范式理论为中心的动态科学发展的范式,就包括了前科学时期常规科学、反常与危机科学、革命性的常规科学。
也就是站在巨人的肩膀上,我们不断的去颠覆,不断的去证伪,它很经典的总结就在于科学的发展不是线性的,而是通过一系列的科学革命来实现的,每一次革命都会带来新的范式。我们最近在科技领域里经常听到的第四范式,也正是源于此前。
三个范式是什么呢?第一范式被称为是实验科学范式,观察实验,比如说伽利略的自由落体实验。第二范式是理论科学范式,构建数学模型来研究自然现象。
比如牛顿的经典力学体系第三范式,也就是计算科学范式。这个范式研究侧重于通过计算和模拟来理解自然界,比如通过计算机模拟去预测天气变化。而第四范式是数据密集型科学发现范式,也就是我们现在说的数据驱动范式。
它强调数据的收集、处理和分析,通过数据挖掘来发现新的科学规律和知识,它与计算技术的发展是紧密相关的。
第三个关键节点就到了1997年美国司托克斯所写的《基础科学与技术创新巴斯德象限》,巴斯德象限所论述的问题是在下一个世纪21世纪美国的科学应该如何发展。
他先是分析了科学无尽的前沿关于基础和应用研究的现象二分法,并在此基础上提出了一个新的科学研究模型象限模型。
我们可以看一下这个直角坐标系,它的横轴表示这个研究的动机是好奇心驱动还是硬驱动,而纵轴则是知识的性质是否具有基础性、原理性。
由此划分出来的四个象限就形成了波尔象限,它代表的是好奇心驱动纯基础研究。爱迪生象限为了实现目的的应用研究。
此外会出现一种新的类型叫做巴斯德象限,它代表是由解决应用问题而产生的技术研究,之所以命名为巴斯德象限,是因为我们都知道巴斯德他是现代疫苗学之父,他在生物学上许多前沿性基础工作的动力是为了去治病救人,去解决他们当中的实际难题。
此外还有一个是指为了获取技巧和经验的鼻子真象限。当然这里面的每一个象限并不是相互隔绝的,而是存在着复杂的双向乃至多向的联系,这本书最后以巴斯德象限为名,可见其代表了这个书的中心思想。
相比于布什的线性模型,巴斯德象限模型更加准确的反映了知识和应用之间的关系,基础研究和应用研究,它们绝非矛盾对立,而是在某种程度上要达到统一和融合,从而为科学研究的发展带来多种可能。
第四个关键点,2016年还是美国的卡特希·那拉亚那穆提所写的《发明与发现:反思无止境的前沿》,这本书提出了与前作相反的意见。
他认为基础研究和应用研究的传统分类非但不科学,反而阻碍了国家的科学与技术进步,导致许多无用的政策建议。
他提出,研究应该作为一个整体,是一个不断在发明与发现之间切换的联系过程,而且将研究活动已化成了基础研究和应用研究,并且简单化为线性关系,好像他们之间是有先后顺序,这就割裂了研究的整体性、综合性和相关性,是一种未能正确反映客体的主观判断。
而不实范式为什么能成为主流?作者也提到,从历史上看,它是根植于传统认知,即早期西方文化延续下来的,偏向科学而非工程的线性逻。
从现实看,它非常适合于官僚体制二分法,便于官员对项目进行管理和资助,满足政策制定者的主观偏好,并不断强化建立起来的官僚体制。
这本书的核心论点就在于,发明和发现是一个相互关联的有机整体,它们之间也是可以循环往复的,发现既有可能产生新的发明,也可能获得新的发现。
同样发明也是一样,虽然人类的创新越来越依赖于组织化和大平台,顶尖的武林高手固然关键,但强大的组织和大平台更有利于天才们的发挥。
此外跨学科、跨行业的沟通交流需要从更深层次去反思科学问技术政策,这都是人类在进一步的科学活动中所不可或缺的这也是我一直所讲的,很多的时候技术和工具往往是技术工具在前,而发现想法在后。
比如先有蒸汽机后有热力学,先有飞机后有空气动力学,先有望远镜后有新天文学,先有显微镜后有微生物学。
讲到这儿,我也作为可以总结一下,今天想讲的实际上是超越了刚才的这四个范式,第五范式恐怕正在形成,从有了人类开始我们就有了观察,当然也会实验。
所以第一范式一直伴随着人类始终文艺复兴后催生了第二范式,带动人类进入工业时代,到了计算机和信息时代,第三和第四范式应运而生。
随着算法算了一个数据的并行崛起,人工智能已经成为推动发现和发明的利器,甚至有可能将不依赖于人类的智慧独立发展,这就带来了可能的科学革命的第五范式。
尽管在这一刻,第五范式上没有统一的概念,还有些模糊,但可以明确的是,它是一种基于日趋强大的便利性人工智能系统,遵循定性原理,面对复杂系统当中的不确定问题,通过机器自学习、自监督、自迭代而持续涌现的智能。
它会大大加速我们人类的发现和发明的一种新方式。它会产生我们人类所不理解的高维度的暗知识,机器的高维语言我们可能已经看不懂了。而在这种人机结合或者说碳硅结合当中的比例,我相信人类的权重会越发降低。
不管这个话好不好听,您高不高兴?他就是来了,400年前培根讲知识就是力量,1978年邓小平讲科学技术是第一生产力。
而今我们要回答一个问题,如今的科学技术,这个第一生产力的生产力应该是什么?或者说它的原理是什么?我们必须承认这一轮的计算信息智能革命就是一场原理的风暴。它的核心就是AI要牢牢的把握住发展的发现发明一定的规律。
我们还是从的三支柱看啊,数据中国从来不缺,但需要破除孤岛,算力要和硬核科技突破,而算法真的需要的是顶尖人才,特别是天才。
如何才能够让天才涌现,并能够提供适应生长,帮助他们长成参天大树的环境?这是要从教育模式到科研体制再到产业政策,整体去反思打造,认为AI从一开始就必须做应用,接地气,盈利赚钱。
对于特定资本特定公司,这是无可厚非的,但对于一个国家和民族来讲,这种过于短视必然是我们重蹈卡脖子覆辙,看看刚才提到的四本科学学著作,都是美国的学者所著。
在感慨之余,我们也要反思,在科学学与科技政策的研判施行上,还有哪些是需要被破除藩篱、迎头赶上的?希望每个人都能明白,我们面临的不是一个周期,而是一个时代。
周期还会回归,时代只会呼啸而过,哪管您懂了还是没懂,1929年,量子物理学的先驱保罗狄拉克,他说过大门物理学院以及整个化学所需的数学理论的基本定律已经完全被人们所知。而困难在于这些定律的精确应用,会导致这个方程太过复杂而无法求解。
人类的大脑,至少在目前的技术框架下,其实是被锁死的,比如我们的算力就是这860亿神经元输入输出,也就是你是限速的,群岛是无法并联的,智力是无法遗传,甚至还可能倒退。
就算脑机接口突破,每一个人出于隐私考虑,我们也不可能愿意共享所有的信息,但是今天的超级计算、人工智能或者终将到来的硅基生命,它没有这些条件的限制。
正是依靠这样的效率,阿尔法四三可以在很短的时间内就预测了数亿个蛋白质结构,在此之前,几代结构生物学家的努力,人类用了半个世纪,也不过就是积累了20万个蛋白质的结构。
作为深的安生物演化时的我一直清楚的知道,掌控地球的从来不是物种,而是智能,我们人类的血脉、基因组、军脉、肠道菌群等都没有办法简单的复制甚至遗传。
但文脉可以,文脉是可以不朽的,也许能够替我们探索星空的注定是具身智能,比如说机器人或者是硅基生命。但也请我们人类可以把我们的爱国文明向他们传承,由他们向可触及的无尽前沿传递。
作为万物灵长的人类,在意识到地球不是宇宙几个周期的真相后却努力忘记成为宇宙的精神中心,有一天,我相信我们终将成为多行星物种,碳基、硅基亦或是碳硅结合都可能。
但我的朋友们,尤其是年轻一代,希望你们都能看到趋势,积极拥抱趋势,最大限度的发挥想象力,一个创造力在AI的时代真的能够屹立潮头,为中国赢得这次科学范式转化的先进,为人类持续做出引领性奠基性的贡献。