据媒体报道,OpenAI正准备推出一款代号为“Operator”的全新AI助理产品,可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。根据内部员工爆料,OpenAI领导层预计将在2025年1月发布该产品,首先作为研究预览版和开发工具推出,届时将为开发人员开放API接口。
报道称,OpenAI一直在进行几个与智能体相关的研究项目。其中一位人士表示,最接近完成的将是一个在网络浏览器中执行任务的通用工具。
AI助理(AI Agent)是一种能够感知环境、进行决策和执行动作的智能实体,具备通过独立思考、调用工具去逐步完成给定目标的能力,既能为C端提供个性化应用,也能为B端提供降本增效方案。对于普通用户而言,AI助理最核心的功能是AI自主操作手机,辅助完成复杂推理任务。
OpenAI首席执行官阿尔特曼早已透露下场意愿。几周前,他在Reddit的“问我任何问题”(Ask Me Anything)论坛上表示,“我们将拥有越来越好的模型,但我认为下一个重大突破将是AI助手。”在上个月公司年度开发日之前的OpenAI新闻发布会上,该公司首席产品官Kevin Weil称:“我认为2025年将是Agent系统最终进入主流的一年。”
目前,OpenAI已开源了多功能协同AI Agent——Swarm,可创建多个智能体协同工作,以更高效地完成任务。其GPT o1模型增强了推理能力,使其在复杂问题的解决和用户交互的自然性方面均有显著进步,亦使其更加适用于AI Agent场景。
AI助理被视作通往AGI的核心基础,在硬件厂商言必称AI的时代,AI助理或成为终端智能化的突破口。机构表示,AI Agent或将掌握移动互联新入口,流量分发格局有望重塑AI Agent智能体因具备较强交互性以及便利性,或可打通原先同个终端不同App之间的天然壁垒。
国内外头部厂商正争先推出AI助理产品
微软近期低调开源了AI工具OmniParser,其可帮助用户创建个性化智能体,以操作个人计算机;10月22日,微软宣布在Dynamics 365中集成10个自主AI Agent,支持OpenAI最新模型o1,具备自主学习能力,可自动执行跨平台复杂业务;9月,微软推出了一款名为Windows Agent Arena的基准框架,同样属于AI助理开发范畴。
据The Information报道,谷歌计划在12月预览其大型动作模型“Project Jarvis”,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。
10月22日,Anthropic为大模型Claude迭代了新功能——Computer Use,让AI可以像人一样操控电脑。Claude3.5 Sonnet是首个支持计算机控制的模型,能够模拟人类操作计算机,包括移动光标、点击按钮和输入文本。
苹果选择将Siri与ChatGPT集成,实现更智能的人机交互,另有网友发现苹果已经默默发布了Ferret-UI的两个实现版本(分别基于Gemma 2B和Llama 8B),这是苹果今年5月发布的一个可让AI理解手机屏幕的技术。
华为则公布了一项可让AI像人类一样操作手机的新研究成果,相关团队提出了一个手机控制架构:Lightweight Multi-modal App Control(轻量级多模态应用控制,简称LiMAC)。
中国独角兽企业智谱AI已上线AI助理工具AutoGLM,无需手动操作,用户对着手机说话(发出指令),便可让其自动打开手机上的各类App,进行网购、点外卖、订高铁票,甚至发微信、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文。
随着人工智能技术的持续突破,AI Agent正迅速成为全球科技领域的关键发展方向,预计未来几年内,AI Agent将广泛渗透至多个行业应用,涵盖智能家居、医疗、金融等领域,成为推动行业升级和自动化的核心技术之一。据市场研究机构预计,到2024年,全球将涌现出超过5亿个基于AI Agent的新应用,进一步推动数字经济的发展。
以下是A股AI Agent智能体 概念股梳理:
中科金财:公司智能客服机器人采用的是Transformer神经网络算法,形成了面向复杂NLP语义识别和内容生成的智能机器人对话系统、自动代码生成引擎、自动流程指令生成引擎。目前已实现为金融机构等的用户提供“不仅能对话、还能办业务”的新智能服务体验。
南兴股份:公司子公司唯一网络基于AI大模型技术,与微软展开联合创新,为行业客户提供AIGC应用产品和解决方案,目前小鹭AIGC智能助手已上线。
酷特智能:携手华为云共创AI智能体。
鼎捷数智:与微软在中国台湾地区发布结合微软0penA1的个人智能助理“娜娜帮我”。
新开普:公司完美校园APP目前研发的数字人“小美同学”,主要基于数字虚拟人,语音识别,语义理解,语音合成等能力,为用户提供实时的可视化交互,提供7*24小时智能问答服务。
焦点科技:公司产品AI麦可,能够自动将买家询盘翻译成中文,并生成初稿,同时能AI接待客户消息。
拓尔思:拓天大模型面向媒体、金融、政务、舆情、专利、公安、开源情报七大垂直行业,提供智能知识问答、公文和稿件写作、舆情归纳总结、文档审查校对、智能业务助手等功能。
宏景科技:据公司官网:公司基于自然语言处理(NLP)、语音识别(ASR)和语音合成(TTS)技术,提供文本对话交互功能,能替代人工客服解决大部分咨询问题,实现自助服务,帮助企业升级客服体验,提高服务效率,降低人力成本。
博彦科技:公司在人工智能业务方面具备人工智能机器学习知识图谱方面的经验和技术积累,形成了包括chatbot智能聊天机器人、智慧运维等方面的解决方案。
立方数科:立方数科与智能体Agent(如0penA1的推理大模型)的关系是代理商。
三联虹谱:三联虹普携手华为云发布国内首个“化纤工业智能体解决方案。
赛意信息 :深度绑定华为,AIAgent赋能业务流程智能化升级。
昆仑万维:公司在AIGC方向的布局有支持AI生成文本的天工妙笔,AI生成代码的天工智码,AI生成图像的天工巧绘,AI生成音乐的天工乐府。您可在微信小程序中体验天工巧绘AI作图工具。
三六零:在ToC端,公司借鉴New Bing的模式,推出新一代生成式AI搜索引擎、AI浏览器、AI个人助理等产品。