讯飞星火多模态技术落地应用,“门外汉”也能抓住视频时代红利

科技一休哥 2023-08-16 18:52:52

你每天会花多少时间刷视频?根据最新出炉的《2023中国网络视听发展研究报告》显示,我国短视频用户规模达到10.12亿,以长中短视频为代表的视频内容成为“收割”网民时间的第一大类应用,泛网络视听领域市场规模突破7000亿大关。如此巨大的市场体量,也吸引着众人前赴后继,加剧了新媒体行业的“内卷”,同时也对内容创作提出更高的要求。

能否借助先进的生产工具,实现内容创作的质效齐升?8月15日,科大讯飞星火认知大模型V2.0带着多模态能力的进化,以及讯飞智作2.0、星火绘画小助手等落地产品,让“内容产业”找到了消除无效内卷、提质增效的最优解。

在发布会上,讯飞研究院院长刘聪以一个典型场景进行了多模态讲解。他先让星火大模型根据一张“刺猬与兔子”的图片编写一段生动的故事,星火脑洞大开地创作了一段“冒险记”,其生动的描述、紧张的情节足以媲美专业作家的水平。紧接着刘聪让星火将这段故事朗读出来,结果星火可以自动判别剧情中的角色,并切换不同的旁白声音模拟刺猬与兔子的对话,加上优美的背景音乐,让人脑海中浮现了“画面感”。

具体到内容创作场景,则要显得更加复杂,尤其是比图片、音频拥有更多信息量的视频创作。科大讯飞为此专门提供了讯飞智作2.0这样一个AIGC内容创作平台,它提供了AI+视频、AI+音频、AI+创意等功能模块。以AI+视频为例,即便你对视频剪辑与配音一窍不通,只要会用手机摄像头录像,就可以快速生成一段独一无二的原创视频。

比如你想当旅游博主,将祖国的大好河山分享给大家,只要去当地录下所见所闻,用星火生成一段配音文案,再挑选一名知性的AI女主播“朗诵”,就能获得一段高质量的旅游视频。

8月13日,讯飞星火还上线了另一项多模态技术的具体产品——星火绘画小助手,它可以根据用户给出的关键信息,快速制作各种类型的图片,并且图片与用户所想表达的意境高度相关。比如让星火制作一张“孔子打篮球”的图片,结合孔子是古人的时代背景,创作出来的图片是符合那个年代感的黑白画。刘聪在发布会现场“智”造的关羽骑摩托图片,想必也在用户心中留下了深刻的印象。

总体而言,基于星火大模型的多模态能力,让自媒体与融媒体等内容创作群体迎来了智慧涌现的时刻,实现全链路的提质增效。同时讯飞智作2.0等落地产品,也将内容行业的准入门槛降至最低,只要有优秀的创意与点子,照样能创作出不输于专业人员的作品,让“门外汉”也可以赢在起跑线!

0 阅读:65

科技一休哥

简介:让你成为一名聪明的科技玩家