全感官输入2.0时代来了百度全方位AI能力让输入法更“聪明”

科技湃 2019-01-17 00:50:44

文/刘恩彤

随着智能手机的普及,输入法已成为用户感知最前沿的产品。根据iiMedia Research(艾媒咨询)数据显示,2018年中国第三方手机输入法语音输入用户规模中,百度输入法以2.29亿排名第一,搜狗输入法以2.26亿紧随其后。

相比于用户规模,AI技术在语音输入的应用也成为新的赛道,而这个赛道恰恰是百度的“耕地”。早在2018年1月,百度便在百度输入法v8.0版本加入AI技术。

1月16日,百度推出国内首款真正意义上的AI输入法——百度输入法AI探索版。这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。这意味着,输入可以告别键盘,语音、表情、动作都将成为输入方式新体验。

AI输入法成百度AI能力落地的“桥头堡”

近日,百度凭借语音识别、机器翻译、无人车相关3项专利获评第二十届中国专利奖银奖。这是至今为止,人工智能技术领域在国内专利界获得的最高级别政府奖项。

对于All in AI的百度来说,堪称代表了目前中国顶级水平,从2012年以来持续投入了大量研发。截至2018年9月,百度人工智能技术应用方面,DuerOS智能设备激活数量达到1.41亿,语音交互次数超过8亿次。DuerOS技能平台目前拥有24,000个第三方开发者。Apollo生态合作伙伴总数达到130个,自动驾驶小巴阿波龙已经在中国10多个城市实地运营。

而聚焦到输入法来看,百度高级副总裁王海峰表示,输入法是离用户最近的产品之一,也是AI落地的“桥头堡”,百度全方位的AI能力正在不断赋能输入法,让输入法更“聪明”。他也给出了输入法行业的“未来画像”,他认为,虽然目前的输入法产品主要应用于手机端,但未来的输入法将应用于各种智能设备与用户的交互,并走向世界,为全球用户提供更多元的输入方式。

而且,最新推出的百度输入法AI探索版,正是用户使用百度AI能力的最佳场景。因为,百度输入法已覆盖了海量的用户。截至2018年底,百度输入法月活跃人数已达5亿,语音日请求量峰值突破5.5亿,AR表情使用次数超过1亿。同时,百度海外输入法全球安装量超过1亿,支持120种语言,覆盖全球190个国家地区,并已与超过100个全球知名IP达成合作,实现技术与市场的双丰收。

有了天然的用户场景,伴随着百度语音、视觉、自然语言处理、知识图谱等百度AI技术落地输入法,“全感官”的输入变成现实。除了语音输入,百度输入法AI探索版还推出了拍立活、秀场、凌空手写等新功能玩法。无论是心爱的偶像,还是日夜陪伴的宠物,“拍立活”功能都可以让用户通过自己的动作“驱动”对方做出相同表情;“秀场”功能运用图像分割技术,让用户“穿越”到不同的虚拟场景之中,科技、清新、赛博朋克多种风格随意挑选,表情创作更具场景感、更加生活化;凌空手写如同隔空打怪,在空中书写也能被流畅识别,目前整体识别率已达到大规模应用的要求。

SMLTA模型将语音识别精度再次提升15%

值得注意的是,当天百度还宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破,流式截断的多层注意力建模(SMLTA)将在线语音识别精度提升了15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。

在线语音领域,百度发布流式截断多层注意力建模(SMLTA),这是中文在线语音识别历史上的两个重大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型;世界上第一次大规模部署在线语音交互注意力模型。这一技术能够解决传统Attention模型在识别中的时延性,以及因此导致的无法进行大规模在线语音实时交互的问题,并将在线语音识别精度提升了15%,超越行业最高水平15%。

离线语音识别领域,为解决用户多元输入场景的需求,百度持续优化Deep Peak 2系统,让离线语音输入相对准确率再次提升,高于行业平均水平35%。即使用户处于地铁、电梯、隧道或人流密集等离线场景中,依然可以借助百度输入法进行精准的语音输入。

中英文混合语音输入技术,以及方言与方言、方言与普通话的混合语音输入技术突破,让用户真正实现“自由说”,无论是中英文夹杂,还是普通话家乡话来回切换,百度输入法都能准确识别。据介绍,百度输入法是目前唯一实现了高精度“中英自由说”和“方言自由说”的输入法产品。

百度语音技术的突破同样让海外用户带来语音输入的便捷体验。本次发布会上,百度海外输入法展示了日语识别、印地语识别和印英混输功能,据第三方评测显示,百度日文输入法的语音识别精度位列行业第一,识别结果用户可接受度占比高达 90%,已成为日本最大的第三方输入法产品;印度用户语音功能的使用率已达21%,百度输入法帮助印度用户实现了自由沟通。

对于AI巨头而言,AI生态的建立无疑是最强大的壁垒。以百度来看,开发有深度学习开源平台PaddlePaddle,AI芯片昆仑,人工智能操作系统 DuerOS,以及百度打造的智能驾驶全生态体系Apollo计划,而百度输入法AI探索版此次作为百度AI落地应用的又一重要成果,全感官输入方式将成为百度AI的新标签。

0 阅读:5

科技湃

简介:科技前沿的观察者、评论者、记录者。