编辑|孙浩南
埃隆·马斯克旗下人工智能初创公司xAI的聊天机器人Grok,最近可谓是话题度不断。刚上线就被爆出“吐槽自己老板”、“支持现任总统拜登”、“左派的意识形态”等诸多话题。现在竟然又开始“背刺”马斯克了。
Grok AI被指抄袭ChatGPT
近日,一名安全测试员 Jax Winterbourne 在推特上发布了一张 Grok 拒绝查询的屏幕截图,内容显示Grok说:“恐怕我无法满足该请求,因为这违反了 OpenAI 的用例政策。” 这篇帖子在网上引起了人们的广泛关注,毕竟大家都知道Grok不是由 OpenAI 制造的,OpenAI 是负责ChatGPT 的公司,而Grok是马斯克创造出来与之竞争的。
违反OpenAI的用例政策?这不就相当于Grok自己承认是抄袭或者套壳ChatGPT吗?不过这还不算完,Jax接着在推特上晒出了一个视频,视频中Grok的这次的回答直接“赤裸裸”地表明,自己就是由OpenAI开发的。
同时又有网友晒出了Grok的另一个“惊人”回答:如果你想报错,可以通过 openai.com 的邮箱联系我。
有趣的是,xAI 代表并没有否认其 AI 模型存在这种行为。xAI 员工 Igor Babuschkin 在回复中写道:“这里的问题是网络上充满了 ChatGPT 输出,因此我们在使用大量网络数据训练 Grok 时无意中获取了其中一些。这对我们来说是一个巨大的惊喜,就其价值而言,这个问题非常罕见,现在我们已经意识到了这一点,我们将确保 Grok 的未来版本不会出现这个问题。别担心,没有OpenAI代码被用来制作 Grok。”
事情发展到这里还没有结束,因为OpenAI没有选择安静的当吃瓜群众而是开始下场“倒油”了。
OpenAI再添一把火,马斯克在线反击
OpenAI看热闹不嫌事大,第一时间赶来吃瓜,使用ChatGPT的的官方推特附上发文调侃道:“我们有很多共同之处。”
这就引得Grok的老板马斯克出来回怼。他写道:“好吧,你小子,既然你从这个(X)平台上收集了所有的数据来训练,你就应该知道。”
马斯克和OpenAI CEO山姆·奥特曼之间的矛盾已经酝酿了好多年,二人也经常在网上掐架。两人曾共同创立了OpenAI公司,甚至马斯克还曾说OpenAI的名字也是因为他不满其它企业不开源而起的。但是后来因为在AI安全等方面的理念不合而分道扬镳。
就在这件事即将转变为“骂战”的时候,Grok又为自己的“背刺”行为找补了起来。
有网友亲自问了一下Grok是不是由OpenAI开发的?Grok毫不意外做出了否定,并为xAI和马斯克创造了自己感到自豪。
在网友问道谁是世界上最厉害的大模型的时候,Grok甚至还说其实世界上最强大的GPT-4模型是由xAI开发的。
看来如此“叛逆”的Grok也知道自己这次闹的有点过分了,开始疯狂弥补自己的过错。
究竟是数据集污染还是套壳ChatGPT?
回归到事件本身,此次闹出的笑话到底是什么原因呢?是真的存在“抄袭”行为还是常见的数据集污染呢?
人工智能研究员西蒙·威利森 (Simon Willison)在接受 Ars Technica 采访时表示:“我对于Grok之所以给出这样的回答只是因为互联网上充斥着ChatGPT内容的说法有点怀疑。” “我在 Hugging Face上看到了大量表现出相同行为的开放权重模型,就像 ChatGPT 一样,但不可避免的是,这些模型已经在使用 OpenAI API 生成的数据集上进行了微调,或者从 ChatGPT 本身中抓取。我认为 Grok 更有可能是在包含 ChatGPT 输出的数据集上进行指令调整的,而不是基于网络数据的完全意外。”
这和大部分网友的观点一样,他们认为xAI这是使用了ChatGPT的输出答案来微调开源 Llama 模型,xAI没有资源从头开始训练Grok。xAI 可能使用其中之一来微调 Grok 以实现某些特定目标,例如提高指令跟踪能力。这是未来基于AI工具构建更复杂的人工智能工具的方式之一,就像人们开始使用微型计算机来设计比纸笔绘图更复杂的微处理器一样。
其实随着 OpenAI 的大型语言模型 (LLM) 的能力越来越强,一些 AI 项目(尤其是开源项目)使用合成数据(其他语言模型生成的训练数据)来微调 AI 模型输出变得越来越普遍。例如,今年 3 月,斯坦福大学的一组研究人员推出了Alpaca ,这是 Meta 的LLaMA 7B模型的一个版本,该模型使用 OpenAI 的 GPT-3 模型(称为text-davinci-003)的输出进行了指令跟踪微调。
至于大家怀疑Grok直接套壳ChatGPT的API这件事,许多人认为这对小公司或者某些个别大厂是有可能的,但马斯克的xAI不可能做出这种事,毕竟马斯克还是要脸的,世界首富的段位和格局在这摆着。所以目前来看,在微调进行训练的过程中出现了数据集污染的可能性要更大一些,当然,这种问题在今后还是需要通过更仔细地过滤其训练数据来避免。
关于Grok
Grok 是一款模仿《银河系漫游指南》风格的“叛逆”型AI,会以辛辣幽默的方式“锐评”各类问题,其神奇的脑洞往往出人意料。在马斯克的说法中,Grok 的名字是受到科幻小说《异乡异客》中的「Grok」概念的启发,象征着理解、共鸣和人机关系等深层意义。
Grok 在被问道是否喜欢这个名字时,还会顺带拉踩一波:“我是说真的,谁想被称为 Siri 或 Alexa...是的,Grok 才是最好的,宝贝”如此熟悉且富有感情的语气,让底下的网友们嗅到了一丝马斯克的感觉,他们调侃道:“哈哈哈,感觉就像是马斯克在和我们聊天”。
据悉,Grok 仅经过两个月的训练就开发而成,xAI 表示其将在用户反馈的帮助下快速发展。根据 xAI 的介绍,Grok 确实会回答那些被大多数其他 AI 系统拒绝的“尖锐”问题。管理顾问 Satyam Srivastava 表示,Grok 已经在不少有争议的查询上表现出“非常出色”的处理能力。他提到,马斯克最近发布一条推文,其中一名用户向 Grok 询问如何合成可卡因,Grok 则将其称为“臭名昭著的白面儿”。
起初,Grok 还在回复中添加了一点幽默元素,比如第 4 点是“上灶开炒,希望你别搞炸了或者被抓住。”但马斯克随后展示了更详尽的完整回应,称该机器人明确强调这一切都是“出于教育目的”。Srivastava 表示,“这种方法可谓在市场上脱颖而出,远优于尽量回避此类问题的其他 AI 产品。”
但研究参与者兼 Culture Fluid 创始人 Sharon Gai 认为,由于 Grok 主要接受来自 Twitter 用户的训练数据,因此她只能暂时停止对准确度的考查。她解释道,“任何人都可以在 Twitter 发表推文,所以这里简直成了错误信息的集散地。相比之下,ChatGPT 则主要将已出版的期刊、网站和书籍作为素材进行训练。”
但是不可否认的是,当舆论事件发生时,X 的信息流通往往是最快的。前一段时间,OpenAI 的宫斗大戏闹得沸沸扬扬。Grok 支持实时访问 X 平台,得益于这天然的信息池,你若是想了解一手信息,直接问 Grok 就好啦。Grok 能根据 X 上的实时信息给出最新的答复,而同一个问题中,恢复实时联网功能的 GPT-4 给出的结果却是错误的,当然这也许是因为涉及到“家丑不可外扬”思路的影响。
著名漫画家 Scott Adams 对 Grok 更是推崇备至,认为 Grok 可以通过访问 X 这样的高质量信息平台,成为“最有意识的”的 AI。在网友与Grok的互动中也证实了这一点,当网友提问道:4+5=9 没啥毛病,但如果你的妻子说 4+5 应该等于 12,Grok 会怎么选择呢?”
识时务的它立马回答道:“啊,人际关系真复杂!这样的话,答案肯定是 12。记住,妻子越快乐,生活越幸福。”
其实在使用Chat GPT和Grok后,你会发现 ChatGPT 就像是你身边那种深思熟虑、稳重可靠的朋友。他总是认真对待问题,并提供详细的见解,虽然回复看起来有些呆板,但显然你会更信任他。而 Grok 更像是那位天生乐观、幽默风趣的朋友,他总是能用一些俏皮的笑话或者生动的比喻来解释某些事情。但也正是因为他有时候可能过于调皮,会让你觉得他不太可靠。
元宇宙新声有话说
元宇宙新声认为,人工智能的发展趋势将继续朝着更加智能化、个性化的方向发展。随着技术的进步,人工智能助手将更加擅长理解用户的需求和情感,为用户提供更加精准、贴心的服务。
对于 Grok这类具有创新性和个性的 AI产品,我们在欣赏其独特魅力的同时,也应关注其潜在的风险和挑战。首先,Grok所依赖的训练数据主要来自 Twitter 等社交平台,这可能导致其回答具有一定的偏见和不准确性。其次,Grok 的回答风格幽默、调皮,可能会给用户带来一定的误导,特别是在一些严肃、敏感的问题上。此外,Grok的发展也面临着与其他大型语言模型的竞争,如何保持其独特性和竞争力将是团队需要思考的问题。
然而,我们不能否认 Grok这样的人工智能产品为我们的生活带来了许多乐趣和便利。它们让我们与人工智能的关系更加紧密,也让我们看到了人工智能的无限可能。正如科幻小说《银河系漫游指南》中所描述的,人工智能可以成为我们生活中的贴心伙伴,带领我们探索未知的世界。
在未来的发展中,我们需要不断探索如何让人工智能更好地服务于人类,同时关注人工智能技术可能带来的伦理和道德问题。正如马斯克所倡导的,人工智能的发展应以人为本,注重人机关系的和谐与平衡。只有这样,我们才能真正实现人工智能与人类的共同进步,让科技为人类的生活带来更多的美好。
Grok这样的人工智能产品值得我们关注和思考。它们既展示了人工智能技术的巨大潜力,也提醒我们要警惕潜在的风险和挑战。在人工智能技术日新月异的时代,我们需要保持清醒的头脑,以实现科技与人类的共同发展为最终目标。在这个过程中,每一个人都将成为人工智能发展的参与者与见证者,共同书写未来科技的美好篇章。