在人工智能助手市场日益繁荣的背景下,3月10日传来消息,Rokid Glasses AR眼镜宣布,面对当前AI大模型如雨后春笋般涌现的现状,仅集成一个AI大模型已无法满足用户对人工智能的多元需求。因此,Rokid Glasses再度升级,以适应时代发展。

截至当前时点,Rokid Glasses不仅嵌入了通义千问大模型,还整合了DeepSeek、豆包、智谱清言、纳米搜索等多个重量级AI模型。Rokid Glasses对这些模型实施了精细化的分类管理,将其划分为基础模型、视觉模型、搜索模型等多个类别。
在功能分配上,基础大模型承担了核心的人工智能能力,包括但不限于对话处理、问答系统以及产品功能的调用;视觉大模型专注于图像识别与处理,例如物体识别等视觉信息的解析;而信息大模型则致力于实时信息检索,通过对最新数据的搜索、整合与归纳,以增强问题解答的准确性和时效性。附分类图如下:

各AI模型在Rokid Glasses中均展现出其独特的专业领域。Rokid Glasses采用智能分发机制,依据不同应用场景,将用户请求高效路由至相应的模型进行处理。例如,通义模型以其严谨客观的风格,呈现出专业助理秘书的形象;而豆包模型则以其轻松俏皮的特质,更像是一位亲密的朋友。用户可在App端自主选择偏好的人工智能模型。
此外,Rokid Glasses为用户提供自定义配置私有模型的功能,支持通过符合OpenAI标准的API接口,调用个人专属的大型模型,从而满足科研及专业领域更为复杂和个性化的需求。

Rokid Glasses 的多模态 AI 协同架构展现了卓越的系统扩展性,能够根据用户的具体应用场景与需求,灵活适配不同的 AI 大模型。这一架构在信息处理逻辑与意图识别算法方面设定了更严格的标准,以确保系统在复杂环境中的高效运作。
在实际应用中,Rokid Glasses 需处理多样化且高度复杂的信息类型,实现信息的快速、精准解析并提供有效反馈是研发团队的核心技术挑战。相较于传统智能眼镜将所有采集信息直接上传至云端大模型进行统一处理的方式,这种集中计算模式往往导致响应延迟,影响用户体验。
Rokid Glasses 采用了自主研发的设备端意图分类模型,该模型可在 2 毫秒内完成意图识别,并据此高效分配请求至相应的 AI 处理模块。这一技术突破提升了智能眼镜在多模型调用和任务执行方面的自主性,使其更接近 AI Agent(人工智能智能体)的形态。
AI Agent 是指能够感知环境、做出决策并执行操作以实现特定目标的系统,涵盖从简单的规则响应型系统到复杂的自学习系统,具备自主性、环境感知能力和目标导向性。Rokid Glasses 通过集成多个 AI 大模型,实现对话与功能调用、物体识别、信息整合等任务,使 AI 由工具向自主智能体演进。

Rokid Glasses 结合 AR 与 AI 技术,使其成为日常生活的智能助手,支持语音交互,能够执行行程预订、咖啡点单等任务,并通过支付宝实现安全支付,展现出高度自主性。此外,其意图分类模型的超低延迟优化了用户体验,显著降低了云端计算负载。2025 年 1 月的报道指出,Rokid Glasses 在功能上与 Meta Ray-Ban 智能眼镜相似,均支持抬头显示(HUD)和 AI 赋能的实时翻译、物体识别等功能,标志着智能眼镜迈入新纪元。
AI眼镜向AI智能体进化,关键在于提升自主性、整合多模态AI模型、实现生态系统无缝对接、增强环境感知能力,并确保用户信任与安全。Rokid Glasses通过语音指纹识别技术奠定了安全基础,但仍需加密和透明度提升。
不过AI眼镜要真正变成AI智能体,行业认为计算限制和电池寿命是技术瓶颈,但个性化辅助和增强智能的进化,同时也给行业带来了新的机遇。
同时用户接受度和监管合规仍是关键,而新商业模式和AR创新,则预示了市场潜力巨大。
总体来讲,AI眼镜市场迅速增长,以AI为核心竞争力。Rokid Glasses等设备正朝着成为日常智能助手的方向发展,有望革新技术与用户互动方式。
免责声明:图文源自互联网或AI,仅为分享行业发展动态,不作任何商业用途,如有侵权,请联系删除。内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。