继此前在今年3月夸克进行升级,成为阿里巴巴旗下AI旗舰应用,并基于阿里通义推理及多模态大模型,推出无边界、All in One的AI超级框后。日前夸克AI超级框上线全新的AI相机,支持用户“拍照问夸克”。
据了解,基于先进的视觉理解和思考推理模型,“拍照问夸克”功能不仅创新了视觉交互方式,还能够深入理解用户意图,完成复杂任务。目前,“拍照问夸克”功能已在手机与电脑端开放,并支持用户批量上传最多10张图片。

具体而言,在视觉交互层面,对于涉及复杂物体、表格和图形等用户难以准确描述真实需求的场景,“拍照问夸克”能够精准识别图片中的人物、物体和诸多细节,深入理解用户需求并联想相关问题。例如当用户拍照搜索文物时,该功能能够自动关联历史背景;用户在上传商品图片时,该功能可一键跳转淘宝得同款链接。
值得一提的是,“拍照问夸克”功能还将搜索、扫描、修图、翻译、创作等能力聚合为统一入口,进一步提升、丰富“超级Agent”在视觉搜索下的产品体验和使用场景,满足用户对现实物理世界的解读、处理和创作。
据了解,目前夸克具备超百个专业Agent和原子能力,包括搜索、健康、学习、旅游、商品、创作等,并将持续通过模型能力升级来优化Agent组合策略,满足用户对图像信息的个性化需求。例如在娱乐场景中,夸克支持棋牌指导、截图找剧、情头配对等趣味功能,并能一键完成高清化、去水印、原文溯源等。此外,夸克还支持多种语言提问和翻译解读。
对此夸克搜索负责人张帆表示,“我们希望通过提升AI超级框的多模态能力,打造用户与现实物理世界之间的全新交互方式和产品体验。AI时代,夸克将继续围绕信息的获取、消费、编辑、传输、管理、决策和创作,由AI超级框承载更多的需求、更好的交互、更大的能力”。