昔日AI网红遇上今日顶流：谷歌大模型将融合AlphaGo技术反超OpenAI从现在开始？

融合了AlphaGo背后技术的大模型Gemini，会是谷歌成功反击OpenAI的王牌吗？

在5月的开发者大会上，谷歌首次透露了其正在开发的大模型Gemini（双子座）。谷歌旗下DeepMindCEO戴密斯•哈萨比斯（DemisHassabis）最近在采访中进一步透露了Gemini的细节：Gemini会将AlphaGo中使用的技术与大模型结合，以赋予更强的规划或解决问题的能力，将比ChatGPT背后的GPT-4更强大。

哈萨比斯表示，除了AlphaGo，Gemini还会有别的创新。

综合来看，DeepMind拥有的其他领域技术（如机器人和神经科学）也可能整合到Gemini中。谷歌曾提到，Gemini具有多模态功能，将提供多种规模，旨在支持未来内存和规划上的创新。另有消息称，像GPT-4一样，Gemini具有一万亿个参数。据说Gemini将使用数以万计的谷歌TPUAI芯片进行训练。

目前，Gemini还在开发中，这个过程预计需要几个月的时间，可能花费数千万美元，甚至数亿美元。这一预计成本与GPT-4不相上下，打造GPT-4的成本超过1亿美元。

▌谷歌大模型将融合AlphaGo技术

作为ChatGPT的“前辈”，AlphaGo曾是AI史上的超级明星，其在2016年横空出世，以打败李世石火速出圈，是第一个击败围棋世界冠军的程序。

AlphaGo主要基于强化学习的训练方法，通过自我对弈进行神经网络训练。该技术的核心思想是“试错”（trial-and-error）：智能体通过与环境的交互，根据获得的反馈信息调整自己的表现。

另外，AlphaGo还使用了蒙特卡洛树搜索方法，这也是所有现代围棋程序的最核心算法，用来探索和记住场景中可能的移动，如棋盘上所有可能的动作。

利用自己在强化学习方面的经验，DeepMind有望在大语言模型上产生新的突破。

要知道，训练像OpenAI的GPT-4这样的大型语言模型，需要将来自书籍、网页和其他来源的大量精选数据集的输入Transformer中。Transformer使用训练数据中的模式来熟练预测后续文本中应该出现的每一个字母和单词。

这一机制尽管在回答问题和生成文本或代码方面非常强大，但也被很多人工智能专家认为限制了通用人工智能的发展。如图灵奖得主杨立昆（YannLeCun）就表示，Transformer将语言模型的能力过度限制在了文本的范围之内，ChatGPT还没有狗聪明。

▌不容小觑的谷歌

谷歌在AI上蛰伏多年，积累了深厚的技术和经验，GPT的技术底座Transformer架构正是由谷歌研发并开源。

2023年4月谷歌大刀阔斧将DeepMind与谷歌的主要人工智能实验室Brain合并为谷歌DeepMind。哈萨比斯自信称，“如果你看看我们在人工智能领域的进展，你会相信，未来80%或90%的创新来自其中一个团队。在过去十年中，这两个团队都取得了辉煌的成就。”

值得注意的是，谷歌的AI武器库不止由DeepMind提供，它旗下知名网站除了谷歌搜索，还有全球最大的视频网站YouTube，上面有大量原创、转载视频，活跃着众多粉丝数超百万的网络红人。最新数据显示，YouTube每月有超过20亿的登录用户，在社交媒体中仅次于Facebook。

这也意味着，YouTube是一个巨大的数据库、流量池。据Theinformation此前报道，有内部人士透露谷歌的研究团队正在利用YouTube训练Gemini模型，而竞争对手OpenAI早已经悄悄地使用YouTube上的内容来训练其人工智能模型。显然，谷歌可以获得更完整的内容数据。

前YouTube高管ShishirMehrotra就曾表示，对谷歌来说，YouTube视频简直就是一座数据金矿。

谷歌已经放出豪言，Gemini将如何超越GPT-4，我们拭目以待。可以肯定的是，科技领域的颠覆式创新之路才刚刚起步，OpenAI暂时领先，但追赶者从未停下奔跑的步伐。