“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会中国馆

潇湘晨报 2025-04-13 18:59:59

4月13日,主题为“构想焕发生机的未来社会”的日本大阪·关西世博会(以下简称“大阪世博会”)开幕。

大阪世博会中国馆以“共同构建人与自然生命共同体——绿色发展的未来社会”为主题,携“嫦娥五号”月壤样本、“蛟龙”号体验舱等顶尖科技成果亮相,向全球展示生动靓丽的“中国名片”。

中国AI大模型也首秀世博舞台,科大讯飞代表中国人工智能企业展示了领先的AI大模型技术——依托国产自主可控讯飞星火大模型,打造了支持中、日、英三语实时交互的人工智能大模型展项”AI孙悟空“。

这位精通三国语言的“数字大圣”,融合了多语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,为全球游客提供幽默问答和智慧导览,成为中国馆唯一大模型展项。

“孙悟空”遇上自主可控AI大模型:让中国文化“活”起来

“悟空,你好!”打招呼间,只见身穿西瓜裙、手拿金箍棒的“AI孙悟空”腾云驾雾现身于水墨云海中,以动画《大闹天宫》高还原声线说道:“俺老孙来也!”并切换日语回答了日本观众的问题。

虚实交织的展台中央“AI孙悟空”正通过讯飞星火大模型展现技术内核——以全国产自主可控的讯飞星火大模型为基础,融合了多语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,跨越覆盖文字、图像、语音等多模态。在聚集众多观众的世博会现场,“AI孙悟空”也能听清、听懂观众说的问题,生动还原孙悟空惟妙惟肖的动画角色形象和声线,以中、日、英三种语言与观众展开自由深度的交流。

该展项由上影元联合共创,呈现上海美术电影制片厂在20世纪60年代创作的经典动画《大闹天宫》中的孙悟空形象。科大讯飞对经典形象进行技术化赋能与重构,通过形象建模、语音合成、唇形预测、图像处理等AI核心技术,在讯飞星火大模型的加持下,成功让领先的技术与经典动画形象结合,让每个腾云驾雾的姿态都承载着跨越甲子的文化记忆。

技术赋能下的传统文化新生,在观众请求“画一幅春江水暖鸭先知”时尤为显著。只见屏幕中的“AI孙悟空”手指一点,“俺老孙可不会画画,但你既有求,定不叫你失望,变!”一张有古诗意境的画作快速呈现。

科大讯飞凭借“科技+文化”双引擎的精密咬合,赋予了“AI孙悟空”智慧和灵魂,让其圈粉无数。科大讯飞依托讯飞星火大模型底座,以科学教育专有大模型结合讯飞AI科学教育与奇思妙问产品,实现类科学家自由对话、问题准确理解、海量科普知识、逻辑推理、自适应响应等能力,让“AI孙悟空”具有了认知能力,不仅能够面对面与用户亲切交流、幽默解疑,还能实现即时响应的问答互动及精确无误的导览服务,让每一次互动都充满趣味与便捷。

此外,讯飞智作也为大阪世博会中国馆导览耳机提供了语音技术支持。该导览耳机集成领先的多语种语音合成技术,可为参观者提供多种男声、女声音色选择,及中文、英语、日语三语种实时切换的沉浸式讲解服务,精准适配全球游客多元化需求。

以“中国芯”走向“世界窗”:星火多语种大模型为世界提供第二种选择

“能够以‘中国芯’走向‘界窗’,成为中国馆唯一大模型展项,科大讯飞靠的是自主可控的AI硬实力。”科大讯飞东北亚研究院院长孙庆华表示。科大讯飞开发的讯飞星火大模型基于全国产化算力底座训练,实现全栈自主可控,具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态等七大核心能力,并持续迭代升级。

去年10月,讯飞星火4.0Turbo发布,根据真实数据背靠背的测试,七项核心能力在中文领域全面超过GPT-4Turbo,代码能力和数学能力超越GPT-4o。

今年1月,业界首个基于全国产算力平台训练的深度推理大模型——讯飞星火X1发布,利用更少算力实现业界一流效果;讯飞星火4.0Turbo底座升级,行业首发混域知识搜索技术;推出业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型,最快语音同传时延5秒以内,达到人类专家译员的水平。

3月,讯飞星火X1实现再升级,在模型参数量比业界同类产品少一个数量级的情况下,数学能力全面对标DeepSeekR1和OpenAIo1,在中文数学各项任务中均实现领先。讯飞星火X1将于近期再次升级。

作为中国人工智能“国家队”,科大讯飞凭借星火大模型在算法、算力、数据全链条的自主可控性,以及多模态交互技术超越同类产品的优势,代表中国人工智能企业在世博会上展示AI大模型技术,向世界递出中国人工智能的“创新名片”,让全球观众为“AI孙悟空”感到惊叹。

目前,星火多语种大模型已实现支持中、英语外的8个语种,包含日语、阿拉伯语、俄语、西班牙语、法语、葡萄牙语、德语及韩语,最新版本在M-MMLU、XStoryCloze、MGSM、FLORES等十多项覆盖综合考试、语言理解、数学、翻译等能力的国际权威多语种相关开源榜单测试中,能力平均值超越最新的GPT-4o和DeepSeekV3、R1,处于国际领先水平,给世界提供第二种选择。目前,多语种大模型已在汽车、家电、办公、翻译等领域应用。

据悉,4月17日,科大讯飞将在大阪世博会中国馆举办讯飞双屏翻译机2.0新品发布会。展示讯飞双屏翻译机2.0的创新功能与应用场景,解决用户的嘈杂环境下实时翻译问题,与国际专家学者、行业及媒体代表一起探索语音翻译技术助力跨语言商务沟通,为世界按下智能交互加速键。

0 阅读:54