数智时代语言规划须顺势而为

永答英语 2024-09-14 04:14:42

感谢您关注“永大英语”!

数智时代语言规划须顺势而为

刘海涛

语言规划是人类有意识改变或调节语言的结构与功能的活动,旨在使语言能更好地适配社会需要,助推社会发展。对语言进行有意识的改变与调节不是一件容易的事,一是因为语言与人和社会的关系密切,否则也不会有“规划语言就是规划社会”的说法;二是由于语言不仅是交流的工具,也具有文化的容器、身份的象征、知识的载体、社会的镜子、国家的资源等功能。这些语言功能的重要性会随社会发展水平的不同而不同,这就需要规划者能顺势而为地规划人与语言、社会、国家之间的关系。

语言规划要顺势而为,这个“势”指的是语言的结构与演化规律。换言之,语言规划要以语言演化规律为基,不能逆规律而动。理论上,语言学家应该是这个世界上最懂语言规律的人。但遗憾的是,主流语言学所发现的那些脱离人、脱离社会的语言规律难以被现实世界中需要规律的领域使用,从而使语言学家在最需要语言学家的数智时代几乎完全失去了话语权。

那么,真正有用的语言规律该从何而来?又是以何种形式存在的呢?基于数据的人工智能技术不仅为我们提供了前所未有的机器语言智能体验,也为语言学家走出“花园”,去现实世界发现真实的语言规律指明了方向。人工智能几十年的曲折历史说明,知识的获得过程与表征形式也许与我们数千年来想的不一样。人工智能时代被称为“数智时代”的原因在于,当下的机器智能是通过深度学习的方法从数据中涌现出来的。也可以说,语言智能来自于语言文本。如果智能是获取知识和使用知识解决问题的能力,数智时代的实践表明语言知识与语言文本具有密切的关系。这样,语言学家需要回到真实的文本上来,回到现实世界中人们使用的语言上来。然而,说起来容易,做起来难。在主流语言学理论失灵和语言学家失语的数智时代,语言学家该如何重新出发呢?这种从语言大数据中发现的规律又如何能为语言规划所用呢?

在谈到数智时代的代表性应用ChatGPT如何能生成更像英语的词时,有人说:“可以通过强制要求‘词长’的分布与英文相符来更好地造‘词’。”这句话中提到的词长分布就是一种语言规律,这种概率性规律不仅反映了人类语言系统的运作规律,也有助于机器生成更像人类语言的词语。幸运的是,计量语言学家们已经发现人类语言的词长分布大多符合齐普夫–阿列克谢夫分布。如果将词长与词的使用频率联系在一起,也会发现另外一个规律,即,经常使用的词一般比较短。

这两种关于词长的规律,对语言规划均有指导价值:一是在创造新词时,需要考虑符合词长分布规律;二是在制定诸如字母词的使用规定时,需要考虑现代汉语中常用词一般都不会超过3个音节这一规律,如果没有合适长度的可表达同样概念的汉语词,字母词是难以禁止的。一个正常的人,在日常交流中,谁会抛开简洁的“CT”,而使用“X射线电子计算机断层扫描”呢?语言是人驱复杂适应系统,驱动语言系统运作的是人,而不是不符合语言规律的规定。

数智时代需要语言学家从“花园”走向“野外”,从真实语料中发现人每天都在使用但可能没有意识到的规律,这些规律不仅有助于构建更好的数智应用,也可为语言规划提供理论支持。只有这样,我们才能发挥人的主观能动性,处理好人与语言、机器、社会、国家之间的关系,形成面向未来的更高效的人机智能综合体,助力现代化建设,为人类在数智时代的发展贡献智慧。

(本文首次发表在《语言战略研究》2024年第5期)

2 阅读:6

永答英语

简介:感谢大家的关注