10月24日,科大讯飞全球1024开发者节开幕,科大讯飞董事长刘庆峰发布讯飞星火4.0 Turbo,并首发一系列基于讯飞星火底座能力的产品与创新应用,还公布了星火大模型一年来的成绩。
“讯飞星火已成为央国企大模型的第一选择。”刘庆峰在现场晒出了大模型应用成绩单。截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300+应用场景。
进入2024年,随着诸多大模型获得备案许可,围绕大模型相关的商业化进程开始进一步提速。而以央国企等客户为主的市场,成为了大模型厂商抢滩商业化市场的一个主战场。
2024年前三季度,智能超参数统计到的数据显示,科大讯飞的中标项目达到38个,中标数量领跑国内一众大模型厂商。主要分布在通信、金融、能源、教科等行业,以央国企客户为主,其中包括中国石油、中国海油、国家能源集团、华润集团、中国绿发等。
星火大模型何以领跑央国企市场?结合1024开发者节现场科大讯飞的解释以及落地成绩,我们得以窥见其中缘由。
“领先一步,超前一路”
在科大讯飞看来,大模型要在企业成功落地,需要一个全套解决方案,其中包括六个关键环节:建算力、理数据、训模型、落场景、保安全、精运营。
“为什么我们中标率第一,而且中标比例越来越高?”刘庆峰认为,就是因为很多企业只能做到第三步训模型,后面(环节)跟科大讯飞差距很大,而且整理数据和训模型的能力方面,跟科大讯飞差距也很大。
刘庆峰还给出了具体数据来量化这种差距和领先优势。比如,在关键的“理数据、训模型”环节,科大讯飞有专门的数据清洗工具链,用了这个工具,数据清洗效率可提升24倍,自动清洗的数据合格率达96.2%,大幅领先于行业平均水平。
同时,SFT数据工具链可以实现问答对自动构建合格率达到 82%,人机协同可以把效率提升90%;50万条高质量 SFT数据可以在 2 周完成构建,而以前一般至少需要一两个月时间。
此外,场景优化工具链在场景优化方面,可以实现五大类13个场景自适应模板匹配训练平均效果提升 30%;多模态知识零采编系统可以实现知识采编效率提升5倍,实现93%的合理率达到专家水平。
在工具领先之外,刘庆峰认为,科大讯飞能够领跑央国企市场的另外一个重要原因是,“讯飞在应用场景中已经形成了可以相互借鉴和复用的规模化效应。”
“每一个企业搭建完之后,我们都会找到很多可共用的(智能体应用),从而复用给其他企业。很多的央国企做完之后就可以给全行业推广,同时也可以不同行业相互借鉴。”刘庆峰说。
目前,科大讯飞针对丰富的业务场景,构建了20多个行业大模型,在落地过程中通过借鉴和复用,打造出300多个智能体应用,其中包含公文写作、知识问答、代码助手等通用智能体应用,以及针对能源、金融、交通、制造、汽车、家电等行业智能体应用。
“什么叫领先一步,超前一路?”刘庆峰指出,科大讯飞把服务央国企等客户的能力投射到整个行业和未来发展中,让所有人节约成本。“为一家做的成本摊到10家、20家 (客户),你就可以大幅提高效率,形成自我造血,形成良性循环,形成工具链不断的优化的收入来源和机制。”
日前,科大讯飞发布第三季度业绩,在加大星火大模型研发投入和布局的同时,实现了季度利润转正。在2024年第三季度业绩说明会上,科大讯飞副总裁江涛表示,星火大模型商业化路径已得到初步验证。
央国企落地收获
在星火大模型的商业化落地场景中,央国企是重点市场,而星火军团则是助力行业大模型落地的战略业务组织。
在科大讯飞全球1024开发者节期间,科大讯飞专门举办了央国企论坛,邀请中石油数智院专家进一步介绍大型央国企的大模型建设经验,同时也邀请知识产权出版社技术专家分享大模型在知识产权领域的探索和实践,以及讯飞星火代码大模型、星火大模型基座落地的实践。
科大讯飞星火军团总裁刘江介绍,过去一年,科大讯飞在央国企市场取得了一定成绩,打造出了数个具有行业标杆意义的垂直大模型项目。
比如:科大讯飞联合中石油打造了330亿参数昆仑大模型,构建了能源化工领域的AI检索和问答引擎;联合中国绿发打造绿色产业内首个行业大模型-泰山大模型;联合中国海油打造“海能”人工智能模型,赋能海洋能源行业焕新。
星火军团副总裁王金钖介绍,过去一年星火大模型落地过程中,团队沉淀出了建设企业大模型基座的全套解决方案和高效工具链。
期间,团队联合合作伙伴攻克了大模型在国产算力集群上的性能优化、推理能力的优化等难题,并建设了创新高效的智能体开发平台,打造出星火商机助手、绩效助手、IT支持助手、培训助手、招聘助手等智能体应用。
对于所开发的智能体应用,科大讯飞要求在公司内部先验证成效,然后才能对外。星火飞码iFlyCode(原智能编程助手)就是经过内部研发团队实测之后才对外大规模商业化的代表产品。作为AI程序员,星火飞码iFlyCode已“上岗”100多家企业,覆盖能源、金融、家电、教育等行业和刚需场景,效果全面领先,助力多家企业降本增效。
星火军团副总裁张致江还介绍,根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o差距微弱,在C++能力上超过GPT-4o。在真实应用场景中,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。
此外,作为基于全国产算力平台“飞星一号”上训练出的全民开放大模型,讯飞星火具备自主可控的高安全性,这也让科大讯飞在推进大模型在央国企等客户群体落户中占据了先发优势。因为,央国企客户在大模型招投标项目中,几乎都明确要求大模型要适配国产化算力。
在央国企论坛上,科大讯飞联合华为发布了讯飞星火&华为智算运维黄金指标体系最佳实践、讯飞星火&华为数据存储 AI解决方案联合发布,这意味着科大讯飞联手合作伙伴沉淀打造的基于国产算力集群的智算运维、数据存储等也成为了可商业化的解决方案。
如今,大模型在央国企市场的商业化很快进入规模化复制阶段。可以说,星火大模型通过产品、技术、工具,以及生态的联合创新等,为接下来的持续领先做好了积累和铺垫。
“挡不住”的科大讯飞
自智能超参数发布月度、季度等重要时间节点的《中国大模型中标项目监测报告》以来,数据显示,科大讯飞的增长是非常突出的。2024 年前三个季度,在6家知名的通用大模型厂商中,科大讯飞的中标项目数量和项目披露金额已经攀升至第一名。
相比其他几家厂商,科大讯飞并不是外界熟知的家底厚的传统大厂,再加上外部因素限制,能够调动的资源相对而言是受限的。但是科大讯飞还是“打”出了今天的成绩。
值得一提的是,在今年的科大讯飞1024开发者节上,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。
“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,这将助力科大讯飞持续探索无人区、引领国产大模型底座的发展。
“今天大模型已经进入到了应用的深水区。”刘庆峰对于大模型的发展趋势给出了这样的断言。他表示,未来科大讯飞推出一个新的模型,一定要有对应的场景,让大家看得见摸得着,并且会不断提升大模型底座的能力,对标全球最好的水平。
“我们一定要代表中国给世界第二种选择。”刘庆峰说。
显然,这样的科大讯飞是“挡不住”的。