张钹院士:对大模型的研究很迫切,不能解释不清楚就说“涌现”

新京报 2023-09-06 20:56:35

新京报贝壳财经讯(记者孙文轩)9月6日,在百川智能Baichuan2开源大模型发布会上,中国科学院院士、清华大学人工智能研究院名誉院长张钹表示,关于大模型本身的学术研究非常迫切与重要,到现在为止国内的大模型主要集中在垂直领域的应用上,因此他很支持百川智能把这次的开源模型定位在助力学术研究上。

张钹指出,到现在为止,全世界对大模型的理论工作原理、所产生的现象都是一头雾水,所有的结论都推导产生了“涌现现象”。“所谓‘涌现’就是给自己一个退路,解释不清楚的情况下就说它是‘涌现’。实际上这反映了我们对它一点不清楚。这个问题必须搞清楚,我们才有可能发展出有中国特色的大模型。”张钹表示,对此,有三个方面的问题研究比较重要。

首先是“大模型为什么能够产生出来非常连贯的、多样化的人类语言?”在他看来,这主要靠三方面的措施,第一是文本的语义表示,也就是把文本里的词、句、段落全变成向量,这给构造一个连续的拓扑空间创造了条件。第二个是转换器,注意力机制可以保证上下文的一致性。最后一个是下一个词的预测。

第二个问题是,大模型为什么会产生幻觉?他指出,这个问题涉及到ChatGPT跟人类自然语言生成原理的不一样,最根本的区别在于,ChatGPT生成的语言是外部驱动的,而人类的语言是在自己意图的情况下驱动的,所以ChatGPT内容的正确性和合理性不能保证。

张钹进一步指出,只有经过ALignment(对齐)才能解决这个问题。之所以能从GPT3.5到GPT4,几个月的时间有那么多的变化,主要就是“对齐”的功劳。而在“对齐”方面,国内做的工作太少。不过他同时也指出,做“对齐”是做治理,但是治理以后内容的质量、多样性会下降,所以还需要平衡开放和治理的关系。

张钹把ChatGPT生成的语言称作GPT语言。他表示,第三个需要研究的问题是,将来努力的方向是什么,是不是想把GPT语言完全对齐到人类的自然语言?他认为这个可能性不大。“因为想实现这个目标,你必须让GPT有自我意识。”

他同时表示,这样也没有必要,因为人工智能追求机器的智能,希望这个智能跟人类的智能不一样,它某些方面比人类有优势,某些方面比人类有缺点,只有这样人类才能和机器和平共处。“目前最重要的是,我们要研究、了解GPT语言,只有彻底了解了它,才能更好地发展它,使用它,或者说从产业的角度来讲才可以发展出更健康的人工智能产业。”

校对柳宝庆

0 阅读:288

评论列表

蜀黍

蜀黍

8
2023-09-07 21:48

什么大模型,其实就是把原本世界的东西集合起来,通过数字化建立了一个模型。问题在于集合了哪些东西,语言类的,首先要研究透人类发声背后的物理原理。视频类的。。。,大模型不是革命性的产品,更多的是提高生产效率和优化流程,根本不是底层技术的根本改变。

H3802

H3802

2
2023-09-08 08:14

为何新生事物都不是院士发明的呢?别人做出就来指点江山!

远山横亘

远山横亘

1
2023-09-07 09:21

清华大学[得瑟],笑话

蒙眼人

蒙眼人

2023-09-07 11:20

自我意识必须建立在夸克感知系统上,那就需要夸克计算,夸克来源于静电也就是原子晶点物理,在静电物理计算上图像和声音都是同等的,处于不同空间识别面,好比空间是六个面,而夸克是七个面,在夸克尺度上有中立疏导性,也就是时间针计算,音波变化被锁定在一个有限的维度,比如时间是一根杆,而空间就是围观者,信息传输和疏导存在变位,而变位要具备变位识别能力才能触发意识动量。

帅呆的JAY

帅呆的JAY

2023-09-07 09:41

老了就退休吧,没必要用自己局限性的思维去否定别人的技术进步,除非你做得更好

化身帕格尼尼°

化身帕格尼尼°

2023-09-07 01:33

人工智能这老头懂多少?

小痞子

小痞子

2023-09-07 09:08

怎么有门外汉对院士指指点点啊[哭哭]

清浅时光

清浅时光

2023-09-07 08:34

中文逻辑和英文逻辑的训练方式不同吧

声 息

声 息

2023-09-06 23:23

计算机和AI是两个东西。我建议虽然是院士,但还是不要随便指误导别人

island

island

2023-09-07 01:43

评论区质疑教授的,我就问一个问题[doge] GPT用的是什么架构[doge]

茂水兄

茂水兄

2023-09-06 21:55

其实大家都误解了这位教授的话,他讲课的中心词是“智能涌现”,AI人工智能的独特学习方法注定是要通过不断犯错及纠错最终达到智能涌现,这不是贬义。

他们没离婚

他们没离婚

2023-09-07 03:50

学习方法总会改进的99%以上的人都在胡说八道,你何必强求一个机器?

Anler

Anler

2023-09-07 16:28

评论区中的一些没读书的人对一个院士指指点点[红脸笑]

HEROMIAOMIAO

HEROMIAOMIAO

2023-09-07 03:46

这个院士没有说错,transformer的训练很多时候就通过加mask,也就是遮住一些词语让模型猜这些词最可能是什么,就是概率性的,的确会出现偏差。但话说回来,世间万物所有东西不都是概率嘛

风筝不会飞

风筝不会飞

2023-09-07 02:00

这位教授提到的几点确实是chatgpt目前的缺陷

pocker

pocker

2023-09-07 01:32

说人家说的错的人,要不先给我解释一下鲁棒性到底是什么,讲不清楚唧唧歪歪的教人家院士对错?

宝贝柏

宝贝柏

2023-09-06 21:03

chatgpt半年内更新到4.0,你说它错误是必然的?微软怎么看呢?

甜甜可可酱

甜甜可可酱

2023-09-07 09:53

这位老先生指点江山几十年了[红脸笑]

指尖流年

指尖流年

2023-09-07 05:06

所以我的理论,才是实现通用人工智能的正确道路。

比伯男神啊

比伯男神啊

2023-09-07 14:36

质疑这位院士的,真的知道了解过深度学习吗?起码学个transformer 再来质疑吧