机器是怎么理解人类的语言的?尤其是现在火爆的人工智能。
目前的人工智能,早已经通过了图灵测试,已经发展到了几乎完全不能辨别是人是机器的程度了。
所谓的“图灵测试”,指的是上世纪50年代,英国科学家图灵提出的一种测试计算机是否具有人工智能的方法。其测试方法为,一个人和一台机器都来回答测试者的问题,如果测试者无法分辨哪个是机器,哪个是人,那么其中的计算机就通过了测试,被称为人工智能。
现在的人工智能被称为AGI(artificial general intelligence,人工通用智慧),既然通过了基本的图灵测试了,那么是不是人工智能就完全能够理解人的语言呢?
更重要的是,人工智能是怎么“理解”人类的语言的?依靠语法吗?
1-能否正确理解下面两个句子是我们人类的再平常不过的语言了,不仅语法正确,意思也完全正确,但是意思却迥然不同,如果仅仅依靠语法是无法判断其区别的。
我打了一个小孩。我打了一口深井。人工智能理解以上句子似乎没问题。但是,我如果说:
我打了一张桌子。
计算机能理解吗?因为打桌子,既可以说拍打桌子,也可以说是”制作“了一张桌子,就像平常说的”打家具“一样。我做了一下测试,选了市面上流行的两种大语言模型,下面是某语言模型给出答案:
语言模型A
语言模型A的回应
我们来看看另一个语言模型给出的回应:
语言模型B
语言模型B的回应
语言模型B的回答显然更正确,但是太无聊了,我把答案做了删减。
对比一下,可以看出语言模型A并不能完全理解“我打了一张桌子”这句话,它也没有重新再问我一一遍以便确定整句话的确切含义,而是直接理解成“狠狠揍了桌子一顿”。
2-无聊的话如果,我给出一句语法正确,却完全没有意义的话,机器会有什么反应呢?比如,我问:
我想种一亩地的电视。
这句话,语法完全正确,却完全无意义。以下是两个语言模型的回应:
语言模型A
语言模型A的回答
语言模型B
语言模型B的回答
虽然两个语言模型给出的答案不同,一个活泼生动,一个严肃认真(无聊),但是都给出了否定的回答,这样看来,我们可以说这两个人工智能语言模型“理解”了人类。
3-不是人话如果,我给出语法正确,意思却是那种贱贱的,又欠揍的话,计算机是怎么理解的呢?比如:
情结的味道很美。
编者按:情结,是一种感情状态,是藏在心底的感情纠葛,按说不可能有味道。计算机是如何理解这种贱嗖嗖的东西的呢?以下是两种语言模型给出的回答:
语言模型A
语言模型A的理解
语言模型B
语言模型B的理解
两种模型都对这句莫名其妙的话给出了自己的理解,而且都“正确”的理解为某种修辞、比喻,算是努力理解了原句的意思。
从以上例子可以看出,目前的人工智能通过大量投喂人类社会的数据,其在理解人类行为上有了长足进步。人工智能似乎在努力回应人类的复杂的行为和各种奇怪的思维,但是对人类语言的理解却不尽人意,比如“打桌子”这样的话,就不是太明白。‘’
是不是很有意思?
你觉得人工智能是如何理解语言的呢?对与那些数量较少,使用较少的句子,人工智能如何才能正确理解呢?