AI手机的下一站:PhoneGPT

通信什么咬一口 2024-10-11 21:24:47

(高靖宇/文)站在2024年的技术十字路口,AI正在全面改造手机行业,无论是在功能创新还是用户体验上,AI驱动的手机都让人眼前一亮。从硬件升级到智能化的深度融合,手机厂商都在加速拥抱AI。

对于手机厂商来说,AI不仅仅是“能做什么”,而是“能为你做什么”,如何让AI“更懂你”,利用AI实现更高效的用户体验,这正是驱动AI手机未来发展的核心意义所在。

10月10日,2024 vivo开发者大会上,vivo正式发布“蓝心智能”AI战略,其中PhoneGPT(即“手机智能体”),是vivo基于蓝心大模型技术做出的一次全新探索。而从“智能”到“智能体”这一字之差的变化,标志着AI手机进入到一个全新的个人智能体时代。

PhoneGPT:AI手机的全新蜕变

回想AI与手机的初遇,还是在Siri、Google Assistant等语音助手的出现,让人们第一次感受到了“智能”的触手可及。用户可以通过简单的语音命令让手机完成任务,例如查询天气、设定提醒或是发短信。然而,这类助手的局限性很快显现:它们大多只能基于关键词作出反应,无法真正理解用户的意图。你问,它答,流程机械而僵化,远不能称之为“智能”。

大模型的应用使得手机AI能力有了革命性的提升,“AI手机”已经是完全不同的概念,AI技术在语音识别、图像识别、智能推荐等方面更是取得了长足进步,给用户带来了全新的使用体验。

不过,AI手机依然没有摆脱“你问我答”的模式,也就是用户必须清晰地表达命令,手机才能作出反应,远未达到“懂你”的地步。而vivo发布的PhoneGPT,具备自主拆解需求、主动规划路径、实时环境识别、动态反馈决策等能力。可以简单的理解为,手机AI能力不再停留在单一功能层面,而是以“智能体”的形式具备了完整“思考”用户需求的能力。

据vivo副总裁周围介绍,PhoneGPT已可以准确识别手机屏幕界面中的内容,并自主操作手机的电话、短信等各类应用程序,完成用户交代的任务。

在演示中,蓝心小V不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡等等。

“这是手机自动化的一小步,却是解放用户双手的一大步。”周围称,未来PhoneGPT会带来更多的应用场景,更好的智能体验,让小V成为更懂你的私人助理。

蓝心智能:用AI重构系统体验

PhoneGPT背后,是来自于vivo全新的AI战略——蓝心智能。蓝心智能是将大模型技术与手机操作系统深度融合的个人智能。周围解释,以蓝心大模型为技术底座,蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务; 同时,蓝心智能将全方位守护用户的隐私安全; 通过系统深度融合,为用户持续构建更自然、符合直觉的交互,带来更智能温暖的体验。

为了达成这一点,vivo从三个方面用AI重构了系统体验。首先是重构人与设备的交互体验,让交互更自然更符合直觉。在蓝心大模型的加持下,手机将具备更强大的分析能力,多模态大模型都可以深度解读你的意图,进而给你需要的反馈和服务。而依托文本大模型,让蓝心小V在文本能力外,进一步具备强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟人声甚至理解对话中的情绪。

第二个方面是重构人与数字世界的服务体验,让智能更加个人化,也就是构建简单高效的服务获取能力和主动服务能力,让人找服务的同时,服务也主动匹配人的需求。

第三个方面是重构人与物理世界的连接体验,让沟通更顺畅和温暖。去年,vivo读谱功能的发布,让喜爱音乐的视障人士可以利用手机学习乐谱和乐器。而今,vivo利用多模态大模型,让手机成为视障人士的眼睛,帮助他们跨越沟通的鸿沟。

蓝心大模型矩阵:全面升级大模型能力

为进一步夯实AI能力底座,vivo在今年的开发者大会上发布了全新自研蓝心大模型矩阵。全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。这预示蓝心智能,向着个人化和多元化发展迈出重要的一步。

在语言大模型上,千亿级蓝心云端大模型,重点优化了意图理解与分发和任务规划能力。相比去年,整体能力提升30%,在SuperCLUE和C-EVAL榜单上继续领跑国内第一梯队。

用户的隐私安全始终是vivo打造蓝心智能的首要原则,继去年带来了三款端侧大模型之后,vivo正式发布全新30亿参数量级的蓝心端侧大模型3B。在对话写作、摘要总结、信息抽取等能力上,蓝心3B可以越级比肩行业7B-9B模型。相比蓝心7B,蓝心 3B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA,内存占用仅1.4GB。在SuperCLUE和Equal Eval的小模型综合能力评测中,蓝心3B均排名第一,同时获得了泰尔实验室端侧大模型综合能力认证以及AIIA安全防范能力认证。

除此之外,vivo还同步带来了可以准确理解自然语义,模拟人声的全新自研蓝心语音大模型、强化中国特色与东方美学的融合生成能力的蓝心图像大模型以及升级视觉感知理解能力的蓝心多模态大模型。

周围表示,蓝心智能将以蓝心大模型矩阵为技术底座,继续探索AI与OS的深度融合,持续打造开放共赢的智能体生态。

未来已来,AI手机正在改变我们与世界的连接方式,你准备好迎接PhoneGPT时代了吗?

1 阅读:71

通信什么咬一口

简介:感谢大家的关注