讯飞星火V3.0升级发布，整体超越ChatGPT，明年上半年对标GPT-4

勇砺商业评论曾宪勇

“自讯飞星火发布以来，代码能力持续升级，星火3.0已基本全面超越ChatGPT，正在追赶GPT-4。” 科大讯飞董事长刘庆峰这样表示。

10月24日，第六届世界声博会暨2023全球1024开发者节在合肥开幕。产业领袖、专家学者与广大开发者云集于此，共同探讨通用人工智能的最新进展和广阔应用前景。

峰会现场，科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型V3.0，七大能力持续提升，整体超越ChatGPT，医疗领域超越GPT-4。星火3.0升级启发式对话、AI人设功能，能够打造更个性化的AI助手。

面向应用场景，讯飞星火面向行业进一步升级智能编程助手iFlyCode2.0，面向科研人员推出星火科研助手；面向学生群体，推出AI心理伙伴关爱青少年的心理健康，首次发布启发互动式英语AI答疑辅学并落地讯飞AI学习机中；面向每个家庭，发布讯飞星火医疗大模型，打造每个人的AI健康助手。此外，讯飞机器人超脑平台迎来升级，亮相业界首个大模型+具身智能的人形机器人。

大模型也带动产业生态的繁荣。自5月6日星火发布以来，讯飞开放平台新增143万开发者团队，同比增幅331%，其中新增大模型开发者17.8万，讯飞正与10万+企业客户用星火创新应用新体验。讯飞还联合行业龙头共同发布12个行业大模型，加速产业落地。另一方面，讯飞联合昇腾生态共同发布“飞星一号”大模型算力平台，并启动对标GPT4的更大参数规模的星火大模型训练。2024年上半年将实现对标GPT-4。

10月24日至29日，科大讯飞还将面向市民开放人工智能产品科博展，观众可以在科技馆、工业馆、行业馆、教育馆、生活馆、生态馆和科学艺术展7个主题展馆，近距离体验星火大模型核心技术、落地产品及生态展品。

讯飞星火V3.0发布，整体超越ChatGPT

认知大模型正开启一个增长新时代，也在成为驱动新型工业化的重要引擎。

“大模型正在走进我们每个人的生活。”刘庆峰表示，在今年亚运会上，工作人员借助讯飞星火与中国移动开发的5G新通话助手，刚挂完电话待办事项就已自动生成；在星火iFlyCode帮助下，平台迁移原本需要3个月的开发工作1个月就能完成；讯飞的AI诊疗助手“智医助理”在大模型加持下，将患者“疑似妊娠”的诊断修正为“先兆流产”，挽救了一个新生命；讯飞星火还与国家自然博物馆合作，让300万年前的黄河象“活了”，还能与人对话······

讯飞星火，不仅拓展行业边界，也在支持每一位“创客”逐梦科技。今年的全球1024开发者大赛汇聚全球9个国家278座城市3.4万支团队的开发者，年龄最小的13岁，00后选手占比达59%。

应用场景和生态的蓬勃发展，依赖核心技术底座的持续进步。从首次发布至今，讯飞星火持续迭代，推出V1.5、V2.0版本。

主论坛上，科大讯飞重磅发布星火认知大模型V3.0，七大能力均持续提升，全面对标ChatGPT，中文能力客观评测超越ChatGPT，英文能力对标ChatGPT48项任务结果相当。

国务院发展研究中心国研经济研究院测评报告显示，星火大模型V3.0综合能力超越ChatGPT，国内领先，达到国际一流水平，在医疗、法律、教育行业的表现格外突出。

星火3.0 进一步升级了数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力，进一步提升星火的落地应用能力。

自讯飞星火9月5日全民开放后，当前已有1200万用户，也对认知大模型提出的更高期待，“不仅能回答问题还要能提出问题”、“不仅要有知识还要有个性”。

刘庆峰表示，大模型不仅要能回答问题，还要像人一样主动提问。大模型想要赋能民生百业，需要实现从多轮对话、主动对话再到启发式对话的跨越，实现星火的智慧阶跃，推动行业纵深应用。此外大模型不仅要有专业的知识，还要具备个性化的AI人设，为星火注入“灵魂”。

对此，讯飞星火大模型V3.0新增了虚拟人格功能，它可以根据性格模拟、情绪理解、表达风格来形成一个初始人设，再结合特定知识学习、对话记忆学习，形成一个更个性化的AI人设。

当前虚拟人格应用“星火友伴”已上线，无论你想和哪吒聊八卦还是和诸葛亮聊家国大事，只要定义好友伴的“人格”就能和不同人物性格的角色对话，“这不只是聊天，还可以释放灵感”，刘庆峰说。

当刘聪点击已创建的“诸葛亮”人格来对话时，诸葛亮的声音和语言风格便展现出来。用户通过“友伴”还能创建自己的人格，刘聪现场创建了个人人格助手，上传个人背景知识，大模型便能用他的风格进行对话。

升级编程助手iFlyCode2.0，推出科技文献大模型

“大模型首先要能够在工业和科研领域造福人类，这才是我们真正解决社会刚需的地方。”刘庆峰称。

在工业领域，今年9月20日，基于讯飞星火的羚羊工业大模型正式发布，通用人工智能成为新型工业化的核心引擎。1个月内，羚羊工业互联网平台平台的工业文本生成、知识问答、理解计算、代码生成、多模态5大核心能力再度升级，不到一个月时间平台用户总量提升59%，平台服务企业次数增加88%。

产业数字化和数字产业化都离不开代码能力的支持。数据显示，中国有约800万软件从业人员，2022年软件业务收入10.8万亿元，占GDP比重8.93%，2028年预测将达到20万亿元。

搭载讯飞星火V3.0的智能编程助手iFlvCode2.0正式发布，在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%，大幅提升软件从业人员效率。iFlyCode发布以来，已在京东云、软通动力等107家机构实现深度对接应用。今年11月份，几乎全国所有软件名城都会和科大讯飞开展相关合作。

在科研领域，科技文献是检验大模型高阶认知能力的“试金石”。讯飞星火和与中科院文献情报中心联合打造科技文献大模型，可以实现成果调研、论文研读、学术写作三大功能。

刘聪现场实测，用科技文献大模型将十几份量子计算论文一键生成综述报告，为科研人员快速了解最新论文大幅提效。测试显示，学者成果调研的效率被提高超10倍，论文研读有效率和学术写作采纳率均超90%。“以人工智能领域为例，每天有84篇文章发表，每篇阅读10分钟，一天读完也要花14个小时，科技文献大模型快速生成综述，对科研人员快速掌握全球最新前沿进展有巨大帮助”，刘庆峰说。

刘庆峰表示，通过科研助手，不光可以提升我们的科学研究效率，还能释放350万在校研究生和博士生的时间，这将极大释放中国未来的想象力。

用通用人工智能解决教育、医疗社会刚需

讯飞AI学习机代差级优势再凸显，首发启发互动式AI英语答疑辅学

通用人工智能时代之下，“因材施教”进入第三个层次，从精准识别知识掌握的薄弱环节、到基于知识图谱推荐最近发展区的学习路径、再到类人式对话辅导进行逐层讲解。

发布会上，搭载了星火大模型V3.0 讯飞AI学习机再度升级，首次发布启发互动式英语AI答疑辅学功能，实现个性化解决、启发引导式提问、互动探究式学习。刘聪在现场实测进行多轮提问，无论是探讨语法对错还是理解文章主旨，讯飞AI学习机都能自如回答。

根据2023年9月安徽地区七八年级试点用户的统计数据显示，小学英语错题解决率，从答案解析学习的77%到AI答疑辅学的90%，效率提升了13%；初中英语错题解决率：从答案解析学习的61%到AI答疑辅学82%，效率提升了21%。

此外，讯飞AI学习机的百科问答助手功能也再次升级，涵盖权威优质百科内容、适龄推荐、启发式提问、百科数字人等功能。

“一个国家未来的科技发展，科学精神应该从娃娃抓起”，刘庆峰说，科大讯飞联合科普中国、少年儿童出版社首发科普大模型，助力全民提升科技素养。科普中国拥有40万+科普中国音视频、6000万+科技文献构建科普大模型，将优秀科普资源惠及广大中小学生，及时回应孩子的每一次提问，课堂学生互动参与率从25%提升到77%，问题解答率从23%提升到95%，打通应用最后一公里，讯飞AI学习机将搭载“讯飞星火+专业科普知识库”的科普大模型，帮助青少年在心中播种下科创的种子。

据了解，随着讯飞星火认知大模型V3.0的推出，科大讯飞AI学习机上已经拥有了英语口语陪练、中英作文批改、数学互动辅学、百科自由问答、亲子教育助手、智能编程助手、创意绘画伙伴以及英语答疑辅学8款基于大模型的类人辅学功能。

“教育不是注满一桶水而是点燃孩子心中的一把火”，刘庆峰表示，通用人工智能为教育带来全新机遇。

科大讯飞一直致力用AI关注青少年的心理健康。发布会上，基于讯飞星火打造的AI心理伙伴正式发布，它具备多模态情感识别、共情表达、寻因式提问、个性化心理指导四大核心能力，善解人意的“小聪”具有极其丰富的心理学知识——10亿+条心理类数据、40万+篇期刊文献、100万+通脱敏心理对话案例、550万+个心理评估数据。

根据来自广东、江苏、安徽等21个高中连续两年心理普查的纵向追踪数据平均值显示，同学们的抑郁、冲动、自责、学习焦虑、社交焦虑、孤独等6种心理问题，在使用减压星球后都有下降，如抑郁情绪同比去年减少了8%。

AI心理伙伴“小星”不仅可以“听懂”孩子的心事，还能主动回应和给出解决问题的个性化指导建议，和孩子对话接受后，“小星”第一时间生成心理咨询报告，同时将预警信息发给心理老师。“孩子们通常不愿意跟家长和老师敞开心扉，只有通过AI的启发式对话，才有可能真正解决大量孩子的心理减压和疏导问题”。至今，青少年“减压星球”已覆盖3202所学校服务259万中小学生。

发布会上，讯飞星火医疗大模型正式发布。健康和每一个人密切相关，搭载了讯飞星火医疗大模型的“讯飞晓医”APP触手可及，看病之前不知道怎么准确表达自己的病情？自己买药不知道有何禁忌？拿到体检报告后想马上“识别”出自己去年和今年比有什么健康异动？这一切都可以问讯飞晓医。

今年5月6日就发布了讯飞星火认知大模型，为什么要到10月24日才发布医疗大模型？刘庆峰表示，因为医疗需要非常严谨对待，早在2017年讯飞智医助理就已经通过国家执业医师资格考试，排名超过96.3%的人类考生，首先给基层医院及等级医院的医生提供帮助，助力成为医生的AI诊疗助理，在这个基础上，今天开始面向家庭，打造每个人的AI健康助手，让AI医疗的普惠之光照进每个家庭。

根据统计，全科医生缺口达30万人，等级医院的医生能分配给每个病人的诊疗时间只有3分钟，看病之前问讯飞晓医，将大幅提升问诊效率，健康自查有效度提升40%。每年零售药店买药人次达67亿，购买非处方用药占比达45%，用药有疑问可以问讯飞晓医，帮助普通人更合理用药，高风险用药召回率提升90%。每年体检人次5.5亿，5000字体检报告眼花缭乱，讯飞晓医可以马上生成重点及健康提醒，帮助人们“对症复诊”。

这背后靠的是讯飞星火医疗大模型的核心能力支撑，通过上线实际使用数据抽查12万例并通过国家科技信息资源综合利用与公共服务中心（STI）第三方测试数据显示，讯飞星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。

2022年初，科大讯飞推出“讯飞超脑2030计划”，提出分三个阶段，要让懂知识、善学习、能进化的软硬一体机器人走进千家万户。去年1024全球开发者节上，机器人超脑平台AIBOT发布，把认知智能、运动智能和具身智能的多模态感知能力结合起来，已为工业、教育、服务、特种等领域372家企业提供服务。AIBOT的持续进步，助力我国机器人进入高阶智慧时代。

刘庆峰表示，星火大模型的推出将让AIBOT赋能机器人发展进入到一个全新的阶段，人形机器人对复杂任务的拆解、开放场景的物体寻找明显提升，在强化学习泛化抓取、仿人行走的复杂地形运动能力上都比主流系统有一个非常大的提升。“下一步我们将以人形机器人为牵引，来推动‘视觉-语言-动作’多模态具身大模型，能够更好地赋能人形机器人”。

此外，科大讯飞发布AI扫拖机器人，它具备领先的家庭环境全场景感知及运动能力，通过多模态交互，精准避障让扫地机器人在家庭常见的障碍物中灵活穿梭不卡困。

共建产业生态，2024年上半年对标GPT-4

唯有生态繁荣，才有人工智能大未来。自2010年发布讯飞开放平台以来，科大讯飞持续构建AI开发者生态，让AI像水和电一样落地各行各业。今年依托星火大模型，讯飞将AI普惠更多用户。

此外，他现场发布星火内容运营大师，人机共创提质增效，通用稿件30分钟共创生成，深度稿件辅助编辑效率翻番。

如今随着大模型持续突破，讯飞AI开发者生态持续领先。自5月6日星火发布以来，讯飞开放平台新增143.4万开发者团队，同比增幅331%，汇聚553万AI生态开发者团队。其中新增大模型开发者17.8万，讯飞正与10万+企业客户用星火创新应用新体验。大模型也显著降低了开发者门槛，在讯飞星火上，已有1.5万助手开发者，开发超2.9万个助手应用。

为了进一步加速大模型行业落地，科大讯飞联合行业龙头共同发布12个行业大模型，包含金融、汽车、运营商、工业、住建、物业、法律等行业，加速产业升级。

在讯飞星火蓬勃的生态背后，是自主创新的算力底座。讯飞和华为“联合特战队”半年内实现星火大模型训练和推理效率均翻番。1024全球开发者节现场，科大讯飞联合华为重磅发布，基于昇腾生态的“飞星一号”大模型算力平台。

不过，刘庆峰也提到，国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。”他表示，唯有实事求是的科学精神，才能真正实现超越。

“大模型时代的大幕才刚刚揭开，让我们一起共创、共享、共进化。”刘庆峰透露，对标GPT-4的更大参数规模的星火大模型正式启动训练，2024年上半年将实现对标GPT-4。

“讯飞星火正日益成为解放生产力工具。”刘庆峰表示，当前讯飞星火已有1200万用户，为千万用户持续创造刚需场景价值。自讯飞智作2.0 、讯飞写作产品发布以来，已新增超10万名专业用户，提供新闻播报、教育培训、自媒体推广到企业宣传等服务，让每个内容创作者都拥有自己专属的AI创作助手。（曾宪勇）

世良情感网

讯飞星火V3.0升级发布，整体超越ChatGPT，明年上半年对标GPT-4

阿桶观察