DeepSeek的训练成本约为550万美元,大约是OpenAI的4%,为什么会这样?因为相对英文,中文是一种更高效的语言。联合国宪章有英语法语俄语阿拉伯语汉语五种版本,最薄的那本是汉语的。中国一个4个字的成语或者一句诗,如果用英文来翻译可能需要几百个单词才能解释。王外长的一句,他强任他强清风拂山岗。如果让我翻译我就翻 “你再牛,我眼皮都不抬一下,多看你一眼算我输!”。再换成英文要好长一段了。所以中文是一种高级语言。如果说英文是二维的中文就是三维的。英语单词之间没有任何关联性,难以进行简化扩充。英语里面自行车、小轿车、小货车、货车(Bicycles,cars,van,trucks)都是车,却是截然不同的单词;又如公鸡是cock,母鸡是hen,小鸡是chicken,鸡的一家子之间却毫无联系,从单词上也无法看出公母和大小。英文你要掌握二万单词才能基本读懂华尔街日报,还有各种复杂的时态了,而且出来一个新事物就要对应一个新单词。中文掌握三千五百个字读书看报就足够了。AI 模型用英文要掌握上百万的单词,而改用中文只需几千个汉字足矣。《新华字典》收录了13万词汇,核心构件始终是3500个常用字,谁优谁劣一目了然。英语的先天缺陷导致高昂的AI训练成本。只要美国的AI还说英语,就不可能超过我们,除非他们换成中文。