科大讯飞董事长刘庆峰
大模型开启了规模化应用落地竞速。
10月24日,科大讯飞在全球1024开发者节上推出了讯飞星火大模型的最新版本——讯飞星火4.0Turbo,并推出了首发10项基于讯飞星火底座能力、覆盖多个行业的产品与创新应用。
从卷参数到卷价格,大模型似乎还未迎来真正的赛点,相较于发挥实际作用,当下的模型厂商似乎更在意“DAU”(日活跃用户数量)。换言之,在广泛的、实际的场景中,市场真正需要的是有能力去解决实际问题的大模型,而不只是一个看似很大、很便宜的超级应用。
随着大模型“卷应用”的浪潮逐步在医疗、金融、交通、政务等领域落地开花,更多的从业者意识到,生成式AI的下半场,更大的机会或许在应用上。而中国的AI产业,有望从应用层实现弯道超车。
基于这一导向下,科大讯飞在内的模型厂商开始围绕解决实际问题去丰富模型的能力,以及推出更加细分的应用。
一、“能文能武”的大模型
相较于此前几个版本,讯飞星火4.0Turbo在数学能力和代码能力方面有所突破,针对相应场景的能力维度也实现了拓展。
根据实用数学任务构建测试集CAppliedMath-1.0,讯飞星火4.0Turbo在计算、财务、金融、度量等多个维度的任务中均超过GPT-4o水平,已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类“o1”的高难度数学能力显著提升。
根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0Turbo在Python、Java、JavaScript等任务上和GPT-4o的差距微弱,在C++能力上超过GPT-4o。在真实应用场景,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。同时推出星火代码7B版本,满足代码生成、代码补全等极速响应型任务。
讯飞星火4.0Turbo“能文能武”——不只升级了“理工”方面的能力,还支持“情感陪伴”功能的实现。
会上,超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。
多模态视觉能力加持下的人机交互有多惊喜?刘聪现场给超拟人数字人打了个“视频电话”,他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,无需拍照,超拟人数字人看图说话,马上回应:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽”,和刘聪畅聊不同角度的所见。
“目前,讯飞星火支持用户创建自己的个性化数字人,打造每个人的数字分身。”刘聪现场演示了一个自己的“数字分身”,只需在后台进行简单的编辑、定义,就可快速生成自己的卡通形象,更能一句话复刻自己的声音作为发音人,随时随地与自己对话。目前,已支持1300+种人设打造。
二、跳开“开源”与“闭源”,径直走向差异化
在业内讨论AI大模型数量过多的时候,往往还会注意到另一个现象,即数百个大模型问世,这些大模型之间的差异性体现在哪?
解答上述问题的逻辑走向大多离不开“开源”与“闭源”。
支持开源的行业人士认为,开源模型的意义,在于所有团队都站在一条起跑线上,拿着同样的厨具和食材,能炒出什么样的菜,各凭本事,是一种公平竞争。
支持闭源的行业人士认为,闭源模型更适合在竞争激烈的大模型行业里聚集人才和算力,进而实现商业化落地,维护模型的根本差异化。
事实上,大模型的开源,与一般意义上的软件开源存在差异。一般软件开源时,开发者可以获取软件的源代码,并据此修改或者增加新功能;而大模型内部代码,是大模型理解、逻辑、推理、生成等综合能力的体现。
2023通信产业大会上发布的《大语言模型代码能力测评分析报告》曾在测评规范下,对讯飞星火等5款最新版本大模型开展测评,该《报告》显示,讯飞星火在编写代码方面表现优异,代码格式规范,正确率高。
今年,科大讯飞在全球1024开发者节上又给出了打造“差异化”的新答案。
作为以智能语音技术见长的企业,科大讯飞将其语音识别、语种能力的优势进一步扩大至大模型领域。
会上,科大讯飞发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
“讯飞作为中国唯一的认知智能全国重点实验室承建单位,我们有使命有责任要做多语言大模型”,刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围,“我们一定要代表中国给世界第二种选择。”
多模态多语言能力升级,将全面赋能汽车产业。科大讯飞还首发了汽车端侧星火大模型,据悉,今年第四季度起,奇瑞、广汽、长城等多款搭载端侧大模型的车型将上市开售。
此外,科大讯飞也将新一代模型应用至教育领域。会上,科大讯飞发布了基于“问题链”的高中数学智能教师系统,该系统可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题,同时基于精准学情定位学生薄弱点、融合最近发展区规划路径、鼓励学生基于真实世界的主动提问、探究式学习。
同时,讯飞AI学习机中首发AI作业过滤器。学习机通过OCR能力识别出纸质练习题,根据学生历史学习情况和本地化考情,将题目分出“必做题”“选做题”“建议不做题”三个等级,实现“练得更少、学得更好”的目标。
除延续深耕领域的优势,科大讯飞还背靠自身技术主线不断拓宽应用领域。会上,科大讯飞发布了医疗、司法、政务、企业办公等多领域的AI助手。“用人工智能技术解决社会刚需,是科大讯飞一直以来的出发点之一”。刘庆峰说道。
三、繁荣生态铸就人工智能未来
“讯飞星火已成为央国企大模型的第一选择。”刘庆峰晒出了大模型应用成绩单:央国企中标第一、教育医疗市场第一、智能汽车市场第一、大模型开发者生态第一、智能硬件市场第一、赋能科研应用第一、赋能工业应用第一。
这份成绩单中,多个“第一”显示了科大讯飞作为人工智能领军企业打造生态的决心。截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景。
为了帮助各行各业更好地落地大模型,科大讯飞构建了从“建算力、理数据、训模型,到落场景、保安全、精运营”的全套解决方案。“科大讯飞有领先的工具链,可大幅提升‘理数据、训模型’的效率;有覆盖300+行业场景的实际应用案例,已形成相互借鉴和复用的规模化效应;还有全国产化的算力平台。”刘庆峰说。
只有生态的繁荣,才有人工智能的未来。根据IDC研究报告和市场公开数据显示,科大讯飞在语音语义市占率中第一、大模型开发者规模第一,达78.1万。据悉,科大讯飞将开放全场景资源,从技术能力到应用落地,用最短路径实现产品成功,线上线下渠道和资源共享,加速开发者迈向市场成功。此外,科大讯飞将牵头成立AI基金,用5亿创业基金推动开发者创业,加速前沿技术产业化进程,并与地方政府联合为AI创业团队提供产业落地支撑。
发布会上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。去年10月24日,首个国产万卡算力集群“飞星一号”平台上线,星火大模型持续引领全国产算力平台发展,刘庆峰介绍一年以来攻克了很多‘疑难杂症’,解决了500多次的基础软硬件问题和模型适配问题。
“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,持续探索无人区、引领国产大模型底座的发展、给世界提供第二选择。“只有在真正自主可控的平台上,才有真正的中国人工智能大未来。”
科大讯飞正在引领大模型规模化应用时代,面向未来,刘庆峰认为人工智能产业发展有五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。刘庆峰说:“坚持这五个关键点,我们的人工智能就有大未来,就能真正的解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化,带来各行各业的变化。”