第七代微软小冰正式亮相全双工语音交互感官技术新增车载场景

科技湃 2019-08-17 23:14:14

唱歌、作诗、绘画......微软小冰的人工智能进化,总是成为行业的标杆。日前,微软小冰在中央美术学院美术馆举办了首个个展《或然世界》,历经22个月的学习后,小冰通过对过往四百年艺术史上236位著名人类画家画作的学习,可在受到文本或其它创作源激发时,独立完成100%原创的绘画作品。

其实,微软小冰的成就远不止这些。目前,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在23轮。——8月15日,第七代微软小冰正式发布,发布会上,微软(亚洲)互联网工程院带来了微软小冰在Dual AI领域的新进展,全新升级的部分核心技术,最新的人工智能创造成果,以及更多的合作与产品落地。

“阅文集团旗下顶级小说IP《全职高手》正在热播,小冰通过和阅文集团合作,吸收学习原著文本,利用人工智能知识图谱,重建了小说中的世界观与知识体系,并对其进行扩展和补充。通过建立的知识图谱,《全职高手》中5个主人公被带入现实世界,可与读者和观众进行实时交互,这一功能目前已在阅文集团旗下APP上线。这一合作未来有望扩展到100部小说的主人公,构建出100部小说的知识图谱。”微软全球资深副总裁,微软(亚洲)互联网工程院院长王永东透露。

据微软全球执行副总裁,微软人工智能事业部及微软全球研究院负责人沈向洋介绍,微软小冰的发展走了三步,第一步是做小冰这样一个人工智能是不是能够迅速的、很快的融入各种各样的环境,能够被大家所接受。第二步是她能不能很快获得用户的喜爱,能够跟用户做更多的交流。第三是她能不能持续的发展,是不是有强大的一个科技创新力量能够领导小冰不断迭代、不断演化。因此微软小冰在去年的时候提出Dual Al战略。他表示:“我们希望小冰能够无处不在,只要有人类的地方,大家都可以看到小冰,可以和小冰交流。”

覆盖6.6亿在线用户 小冰产品拓展上线多个第三方合作伙伴平台

微软小冰自去年开始执行Dual AI战略计划。目前,第七代微软小冰已成为全球最大的跨领域人工智能系统之一。在全球多个国家,微软小冰单一品牌已覆盖6.6亿在线用户、4.5亿台第三方智能设备和9亿内容观众,在交互场景大幅度拓宽的情况下,微软小冰与用户的单次平均对话轮数(CPS)仍保持在23轮。

据悉,Dual AI战略是半开放的生态思路,得益于框架的通用性和丰富性,可使小冰在产品形态上具有非常大的弹性。她可以转换成适合各平台各设备的形态,在化身为千万形态的同时,又可以在一定程度上保持相对统一的独特性。

除与阅文集团的合作外,本次发布会正式宣布微软小冰上线了vivo和OPPO的手机系统,只要通过“召唤小冰”这个统一口令,就可以和她交互,其也实现了与国产TOP5手机生产商共同完成“召唤小冰”产品形态。目前,微软也在不断地探索着如何深度融入主流社交平台网络,小冰已与微信AI团队就微信的对话开放平台以及微信AI所涉及的智能硬件产品展开合作。在内容和资讯平台上,继网易新闻和新浪新闻后,微软小冰和今日头条的合作也已经正式上线。

同时,截止到上个月末,在传统电视台和广播电台持续担当着内容生产和技术提供者角色的小冰已在中国和日本的50家电台和电视台、69档节目的背后提供了人工智能内容创造能力,上线的日播和周播节目达到30档。到目前为止,累计参与生产的电视和电台节目总时长达到6908小时,其中今年生产的节目时长是去年2.05倍。

核心技术升级 全双工语音交互感官技术新增车载场景

微软是人工智能创造的先行者,在本次发布会上,小冰工作室展示了其在文本、声音与视觉方面的创造力,包括跨越多种演唱技巧的多个声音模型、多种绘画模型等。

同时,微软小冰的部分核心技术也得到了升级,在第六代微软小冰突破了能够让框架兼容各种各样的交互形态去支持Dual AI战略的各种要求后,获得了源源不断的新落地场景,这些落地场景又促成了第七代小冰今天在对话引擎、交互感官上的技术突破。其中,经过检索模型、生成模型、共感模型的历次技术迭代,本次升级的对话引擎实现了从“平等对话”向“主导对话”方向的跨越。它不仅能提高开放域的对话表现,也能在垂直领域发挥高转化率的效果。

在全双工语音交互感官技术方面,微软小冰此前已上线了全双工语音交互感官的传统电话及智能音箱设备落地,此次新增车载场景,可大幅度提高人工智能助手与驾驶员及乘客的交互体验,促进人工智能从智能中控向“虚拟乘客”体验标准的转化。

对于微软小冰而言,随着5G移动网络的普及,更高的带宽、更低的延迟来临,这不仅对全双工语音非常重要,对其正在研发的下一代多模态交互感官同样非常重要。面向未来的多模态交互感官是一种融合了全双工语音交互、实时视觉与核心对话引擎的全新交互感官。它能够实现用户与人工智能同时边听边说边看的交互体验。继去年宣布率先开始多模态感官的研发后,今年2月,微软日本小冰团队已邀请当地媒体进行了公开测试。该感官有望成为5G时代的全新交互形式。

Avatar Framework第一个工具包版本推出

会上,微软(亚洲)互联网工程院副院长、小冰团队总负责人李笛介绍了Avatar Framework的第一个工具包版本,他表示:“当今对于人工智能产品有很多定义,在未来会证明这样的定义可能是非常粗糙的。姑且这种类型的人工智能存在统一的定义为AI beings。目前,不管任何一个AI beings定义多么具体,都需要有一种更加基础、底层、能够证明它的某种统一性的框架,才能使它得到支撑。Avatar Framework所提供的就是类似这样的价值,能够让任何一个无论有还是没有明确定义的AI beings,首先成为一个通用的AI beings。”

该工具包与微软小冰框架同源,可从人格开始,轻松构建出具有完整情感计算能力的人工智能助手、社交对话机器人、人工智能内容创作和IP人物角色等。该工具包包含对话、声音、视觉、观点、技能、知识及创造力等丰富工具,并可驱动兼容的3D人物模型进行实时交互。

Avatar Framework能够为未来各种各样人工智能的产品提供更多多样性和丰富性,能够让他们在基础层面获得更丰满的表现,同时也可以让他们和用户之间有更好产品之间的情感纽带。本次发布的版本仅面向全部合作伙伴及客户。面向个人使用者的版本预计将于2020年春季发布。

得益于在ToB领域的丰富经验,及丰富的技术产品积累,微软小冰商业化进展迅速。利用自己的技术和对行业的理解,与合作伙伴独特优势相结合,形成协同、全新的技术解决方案,微软小冰目前已落地的商业客户覆盖金融、零售、汽车、地产、纺织等十个领域。

0 阅读:5

科技湃

简介:科技前沿的观察者、评论者、记录者。