近日,由特斯拉和 SpaceX 的创始人埃隆·马斯克(Elon Musk)成立的美国人工智能公司 xAI,发布了其大模型(聊天机器人)Grok 的重大升级版本,名为 Grok-2。
该模型目前处于测试阶段,但 xAI 认为,这是相比前代产品 Grok-1.5 的重大进步。并且,xAI 还同期发布了一款更小的版本,名为 Grok-2 mini。
(来源:xAI)
这两款新模型的发布证明了 xAI 在 AI 领域的快速发展。同时,也引发业界对 AI 技术在信息传播和社交媒体影响方面的新讨论。
Grok-2 现已在社交平台 X 上向付费用户开放使用,用户需订阅 Premium(每月 8 美元)或 Premium+(每月 16 美元)服务才能使用。
xAI 公司公开表示,与其前身相比,Grok-2 在直观性、可控性和多样性方面都有显著提升,无论是回答问题、协作写作,还是解决编程任务都表现出色。
新版 Grok 不仅在文本生成方面有所进步,还新增了图像生成功能,使其与 OpenAI 等竞争对手的产品更加接近。这一新功能大大扩展了 Grok 的应用范围,使其成为一个更全面的 AI 助手。
才发布不到一天,网友就在网上争先恐后地晒出自己的“杰作”。
由于 Grok-2 在创作上的限制更少(尤其是政治上的限制),因此很多人的作品都与特朗普、拜登和哈里斯等美国政治人物有关。当然,作品中也少不了马斯克这个“流量明星”。
下面是网友所创作的具有代表性的作品。例如,特朗普和马斯克骑着独角兽大战僵尸。
(来源:X)
持枪皮卡丘,挑衅任天堂的“地表最强法务部”。
(来源:X)
以假乱真的风景照。
(来源:X)
xAI 对媒体表示,用户可以通过 X 平台上新设计的界面使用 Grok-2 和 Grok-2 mini,并且体验更加直观和友好。
它的目标是将 Grok-2 打造成最先进的 AI 助手体验,能够从 X 平台的帖子中获取实时信息,为用户提供最新、最相关的内容。
值得注意的是,根据美国加州大学伯克利分校运营的大型模型系统(LMSYS,Large Model Systems)组织聊天机器人竞技场的排名,Grok-2 已经超越了许多其他知名 AI 公司的模型,包括 OpenAI、Anthropic、谷歌和 Meta 的部分模型。
图丨 LMSYS 的大模型排名(来源:资料图)
在 LMSYS 排行榜上,Grok-2 以代号“sus-column-r”位列第三,仅次于 OpenAI 的 GPT-4o 和 Gemini-1.5 Pro,但高于 GPT-4o mini、Claude 3.5、Gemini Advanced 和 Llama 3。
这一排名结果令人惊讶,因为 Grok 作为一个相对较新的聊天机器人,已经可以与业界巨头的产品相媲美。
然而,尽管 Grok 在 LMSYS 排名中表现出色,但这可能并不能全面评估其性能。LMSYS 的排名系统虽然在 AI 业内颇受欢迎,但它并不擅长评估新闻报道的能力,而这恰恰是 Grok 的一个重要应用。
事实上,在新闻报道方面 Grok 此前屡次出现错误,尤其是在选举相关信息上。
这引发了人们对其准确性的担忧,甚至促使五位州务卿敦促马斯克将美国选举相关查询重定向到 CanIVote.org,以防止聊天机器人产生幻觉。
图丨 Grok 生成的特朗普坐着 SpaceX 火箭(来源:X)
对于这些担忧,马斯克本人并未直接回应。
但在 Grok-2 的发布公告中,xAI 特别强调了模型在提供准确、真实信息方面的改进,声称其能够“正确识别缺失信息、推理事件序列并丢弃无关的帖子”。
这些改进旨在提高 Grok 的可靠性和准确性,尤其是在处理新闻和时事信息方面。
xAI 还宣布了一项重要计划,“在本月晚些时候通过其企业应用程序编程接口(API,Application Programming Interface)向开发者开放 Grok-2 和 Grok-2 mini。”
这一举措将使更多开发者利用 Grok 的能力,可能会促进更多创新应用的出现。
该公司还对媒体表示,将在 X 平台上更加广泛地部署 Grok-2 和 Grok-2 mini 驱动的 AI 功能,包括改进搜索功能、帖子分析和回复功能等。这可能意味着 X 平台将引入 AI 回复,进一步提升用户体验。
图丨 Grok-2 的操作界面(来源:X)
不过,Grok-2 的图像生成功能也引发了一些新的担忧。目前广泛传播的图像表明,Grok 在创建政治人物图像方面似乎没有任何限制,许多用户也正是利用这一点进行了相关创作。
但需要考虑的一个现实情况是,美国总统大选即将到来,因此该公司可能会被要求限制相关功能。
现在,尚不清楚 Grok 生成的图像是否嵌入了任何元数据,来表明它们是 AI 生成的。这可能会导致误导性或虚假信息的传播,尤其是在政治敏感时期。
自 2023 年 11 月首次发布以来,xAI 已经迅速推出了多个新版本。Grok-1.5 于 2024 年 4 月推出,现在又迎来了 Grok-2。这意味着在不到一年的时间里,Grok 已经历了三次升级。
此前,马斯克曾对媒体表示,Grok-3 将于今年晚些时候推出。这种快速迭代的策略显示了 xAI 在 AI 领域的雄心和投入,也反映了 AI 技术发展的迅猛速度。
虽然 xAI 和马斯克对 Grok-2 的能力给予了高度评价,但一些行业专家指出,大模型之间的差异可能很小,而且随着它们耗尽现有的可用数据,这种差异可能会进一步缩小。
这一观点也提醒我们,在评估 AI 模型的性能时需要保持客观和谨慎。
目前来看,ChatGPT 的定位更像是一个生产力工具,而 Grok-2 的发布为 AI 在社交媒体平台上的应用开辟了新的可能性。
通过将 AI 助手集成到 X 平台,用户或能体验到更智能、更个性化的社交媒体互动。这可能包括更准确的内容推荐、更智能的搜索功能,以及 AI 辅助的内容创作。
这种创新的社交平台互动方式,除了让内容更加丰富、互动性更强,也将对新闻传播、公共舆论形成等方面产生深远影响。
参考资料:
https://x.ai/blog/grok-2
https://www.theverge.com/2024/8/14/24220127/grok-ai-chatbot-beta-image-generation-x-xai-update
https://www.pcmag.com/news/elon-musks-xai-releases-grok-2-on-x-how-does-it-stack-up-to-openai-google
运营/排版:何晨龙