讯飞星火V3.0升级发布,整体超越ChatGPT,明年上半年对标GPT-4

阿桶观察 2023-10-24 14:36:55

勇砺商业评论 曾宪勇

“自讯飞星火发布以来,代码能力持续升级,星火3.0已基本全面超越ChatGPT,正在追赶GPT-4。” 科大讯飞董事长刘庆峰这样表示。

10月24日,第六届世界声博会暨2023全球1024开发者节在合肥开幕。产业领袖、专家学者与广大开发者云集于此,共同探讨通用人工智能的最新进展和广阔应用前景。

峰会现场,科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型V3.0,七大能力持续提升,整体超越ChatGPT,医疗领域超越GPT-4。星火3.0升级启发式对话、AI人设功能,能够打造更个性化的AI助手。

面向应用场景,讯飞星火面向行业进一步升级智能编程助手iFlyCode2.0,面向科研人员推出星火科研助手;面向学生群体,推出AI心理伙伴关爱青少年的心理健康,首次发布启发互动式英语AI答疑辅学并落地讯飞AI学习机中;面向每个家庭,发布讯飞星火医疗大模型,打造每个人的AI健康助手。此外,讯飞机器人超脑平台迎来升级,亮相业界首个大模型+具身智能的人形机器人。

大模型也带动产业生态的繁荣。自5月6日星火发布以来,讯飞开放平台新增143万开发者团队,同比增幅331%,其中新增大模型开发者17.8万,讯飞正与10万+企业客户用星火创新应用新体验。讯飞还联合行业龙头共同发布12个行业大模型,加速产业落地。另一方面,讯飞联合昇腾生态共同发布“飞星一号”大模型算力平台,并启动对标GPT4的更大参数规模的星火大模型训练。2024年上半年将实现对标GPT-4。

10月24日至29日,科大讯飞还将面向市民开放人工智能产品科博展,观众可以在科技馆、工业馆、行业馆、教育馆、生活馆、生态馆和科学艺术展7个主题展馆,近距离体验星火大模型核心技术、落地产品及生态展品。

讯飞星火V3.0发布,整体超越ChatGPT

认知大模型正开启一个增长新时代,也在成为驱动新型工业化的重要引擎。

“大模型正在走进我们每个人的生活。”刘庆峰表示,在今年亚运会上,工作人员借助讯飞星火与中国移动开发的5G新通话助手,刚挂完电话待办事项就已自动生成;在星火iFlyCode帮助下,平台迁移原本需要3个月的开发工作1个月就能完成;讯飞的AI诊疗助手“智医助理”在大模型加持下,将患者“疑似妊娠”的诊断修正为“先兆流产”,挽救了一个新生命;讯飞星火还与国家自然博物馆合作,让300万年前的黄河象“活了”,还能与人对话······

讯飞星火,不仅拓展行业边界,也在支持每一位“创客”逐梦科技。今年的全球1024开发者大赛汇聚全球9个国家278座城市3.4万支团队的开发者,年龄最小的13岁,00后选手占比达59%。

应用场景和生态的蓬勃发展,依赖核心技术底座的持续进步。从首次发布至今,讯飞星火持续迭代,推出V1.5、V2.0版本。

主论坛上,科大讯飞重磅发布星火认知大模型V3.0,七大能力均持续提升,全面对标ChatGPT,中文能力客观评测超越ChatGPT,英文能力对标ChatGPT48项任务结果相当。

国务院发展研究中心国研经济研究院测评报告显示,星火大模型V3.0综合能力超越ChatGPT,国内领先,达到国际一流水平,在医疗、法律、教育行业的表现格外突出。

星火3.0 进一步升级了数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。

自讯飞星火9月5日全民开放后,当前已有1200万用户,也对认知大模型提出的更高期待,“不仅能回答问题还要能提出问题”、“不仅要有知识还要有个性”。

刘庆峰表示,大模型不仅要能回答问题,还要像人一样主动提问。大模型想要赋能民生百业,需要实现从多轮对话、主动对话再到启发式对话的跨越,实现星火的智慧阶跃,推动行业纵深应用。此外大模型不仅要有专业的知识,还要具备个性化的AI人设,为星火注入“灵魂”。

对此,讯飞星火大模型V3.0新增了虚拟人格功能,它可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设。

当前虚拟人格应用“星火友伴”已上线,无论你想和哪吒聊八卦还是和诸葛亮聊家国大事,只要定义好友伴的“人格”就能和不同人物性格的角色对话,“这不只是聊天,还可以释放灵感”,刘庆峰说。

当刘聪点击已创建的“诸葛亮”人格来对话时,诸葛亮的声音和语言风格便展现出来。用户通过“友伴”还能创建自己的人格,刘聪现场创建了个人人格助手,上传个人背景知识,大模型便能用他的风格进行对话。

升级编程助手iFlyCode2.0,推出科技文献大模型

“大模型首先要能够在工业和科研领域造福人类,这才是我们真正解决社会刚需的地方。”刘庆峰称。

在工业领域,今年9月20日,基于讯飞星火的羚羊工业大模型正式发布,通用人工智能成为新型工业化的核心引擎。1个月内,羚羊工业互联网平台平台的工业文本生成、知识问答、理解计算、代码生成、多模态5大核心能力再度升级,不到一个月时间平台用户总量提升59%,平台服务企业次数增加88%。

产业数字化和数字产业化都离不开代码能力的支持。数据显示,中国有约800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重8.93%,2028年预测将达到20万亿元。

搭载讯飞星火V3.0的智能编程助手iFlvCode2.0正式发布,在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%,大幅提升软件从业人员效率。iFlyCode发布以来,已在京东云、软通动力等107家机构实现深度对接应用。今年11月份,几乎全国所有软件名城都会和科大讯飞开展相关合作。

在科研领域,科技文献是检验大模型高阶认知能力的“试金石”。讯飞星火和与中科院文献情报中心联合打造科技文献大模型,可以实现成果调研、论文研读、学术写作三大功能。

刘聪现场实测,用科技文献大模型将十几份量子计算论文一键生成综述报告,为科研人员快速了解最新论文大幅提效。测试显示,学者成果调研的效率被提高超10倍,论文研读有效率和学术写作采纳率均超90%。“以人工智能领域为例,每天有84篇文章发表,每篇阅读10分钟,一天读完也要花14个小时,科技文献大模型快速生成综述,对科研人员快速掌握全球最新前沿进展有巨大帮助”,刘庆峰说。

刘庆峰表示,通过科研助手,不光可以提升我们的科学研究效率,还能释放350万在校研究生和博士生的时间,这将极大释放中国未来的想象力。

用通用人工智能解决教育、医疗社会刚需

讯飞AI学习机代差级优势再凸显,首发启发互动式AI英语答疑辅学

通用人工智能时代之下,“因材施教”进入第三个层次,从精准识别知识掌握的薄弱环节、到基于知识图谱推荐最近发展区的学习路径、再到类人式对话辅导进行逐层讲解。

发布会上,搭载了星火大模型V3.0 讯飞AI学习机再度升级,首次发布启发互动式英语AI答疑辅学功能,实现个性化解决、启发引导式提问、互动探究式学习。刘聪在现场实测进行多轮提问,无论是探讨语法对错还是理解文章主旨,讯飞AI学习机都能自如回答。

根据2023年9月安徽地区七八年级试点用户的统计数据显示,小学英语错题解决率,从答案解析学习的77%到AI答疑辅学的90%,效率提升了13%;初中英语错题解决率:从答案解析学习的61%到AI答疑辅学82%,效率提升了21%。

此外,讯飞AI学习机的百科问答助手功能也再次升级,涵盖权威优质百科内容、适龄推荐、启发式提问、百科数字人等功能。

“一个国家未来的科技发展,科学精神应该从娃娃抓起”,刘庆峰说,科大讯飞联合科普中国、少年儿童出版社首发科普大模型,助力全民提升科技素养。科普中国拥有40万+科普中国音视频、6000万+科技文献构建科普大模型,将优秀科普资源惠及广大中小学生,及时回应孩子的每一次提问,课堂学生互动参与率从25%提升到77%,问题解答率从23%提升到95%,打通应用最后一公里,讯飞AI学习机将搭载“讯飞星火+专业科普知识库”的科普大模型,帮助青少年在心中播种下科创的种子。

据了解,随着讯飞星火认知大模型V3.0的推出,科大讯飞AI学习机上已经拥有了英语口语陪练、中英作文批改、数学互动辅学、百科自由问答、亲子教育助手、智能编程助手、创意绘画伙伴以及英语答疑辅学8款基于大模型的类人辅学功能。

“教育不是注满一桶水 而是点燃孩子心中的一把火”,刘庆峰表示,通用人工智能为教育带来全新机遇。

科大讯飞一直致力用AI关注青少年的心理健康。发布会上,基于讯飞星火打造的AI心理伙伴正式发布,它具备多模态情感识别、共情表达、寻因式提问、个性化心理指导四大核心能力,善解人意的“小聪”具有极其丰富的心理学知识——10亿+条心理类数据、40万+篇期刊文献、100万+通脱敏心理对话案例、550万+个心理评估数据。

根据来自广东、江苏、安徽等21个高中连续两年心理普查的纵向追踪数据平均值显示,同学们的抑郁、冲动、自责、学习焦虑、社交焦虑、孤独等6种心理问题,在使用减压星球后都有下降,如抑郁情绪同比去年减少了8%。

AI心理伙伴“小星”不仅可以“听懂”孩子的心事,还能主动回应和给出解决问题的个性化指导建议,和孩子对话接受后,“小星”第一时间生成心理咨询报告,同时将预警信息发给心理老师。“孩子们通常不愿意跟家长和老师敞开心扉,只有通过AI的启发式对话,才有可能真正解决大量孩子的心理减压和疏导问题”。至今,青少年“减压星球”已覆盖3202所学校服务259万中小学生。

发布会上,讯飞星火医疗大模型正式发布。健康和每一个人密切相关,搭载了讯飞星火医疗大模型的“讯飞晓医”APP触手可及,看病之前不知道怎么准确表达自己的病情?自己买药不知道有何禁忌?拿到体检报告后想马上“识别”出自己去年和今年比有什么健康异动?这一切都可以问讯飞晓医。

今年5月6日就发布了讯飞星火认知大模型,为什么要到10月24日才发布医疗大模型?刘庆峰表示,因为医疗需要非常严谨对待,早在2017年讯飞智医助理就已经通过国家执业医师资格考试,排名超过96.3%的人类考生,首先给基层医院及等级医院的医生提供帮助,助力成为医生的AI诊疗助理,在这个基础上,今天开始面向家庭,打造每个人的AI健康助手,让AI医疗的普惠之光照进每个家庭。

根据统计,全科医生缺口达30万人,等级医院的医生能分配给每个病人的诊疗时间只有3分钟,看病之前问讯飞晓医,将大幅提升问诊效率,健康自查有效度提升40%。每年零售药店买药人次达67亿,购买非处方用药占比达45%,用药有疑问可以问讯飞晓医,帮助普通人更合理用药,高风险用药召回率提升90%。每年体检人次5.5亿,5000字体检报告眼花缭乱,讯飞晓医可以马上生成重点及健康提醒,帮助人们“对症复诊”。

这背后靠的是讯飞星火医疗大模型的核心能力支撑,通过上线实际使用数据抽查12万例并通过国家科技信息资源综合利用与公共服务中心(STI)第三方测试数据显示,讯飞星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。

2022年初,科大讯飞推出“讯飞超脑2030计划”,提出分三个阶段,要让懂知识、善学习、能进化的软硬一体机器人走进千家万户。去年1024全球开发者节上,机器人超脑平台AIBOT发布,把认知智能、运动智能和具身智能的多模态感知能力结合起来,已为工业、教育、服务、特种等领域372家企业提供服务。AIBOT的持续进步,助力我国机器人进入高阶智慧时代。

刘庆峰表示,星火大模型的推出将让AIBOT赋能机器人发展进入到一个全新的阶段,人形机器人对复杂任务的拆解、开放场景的物体寻找明显提升,在强化学习泛化抓取、仿人行走的复杂地形运动能力上都比主流系统有一个非常大的提升。“下一步我们将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型,能够更好地赋能人形机器人”。

此外,科大讯飞发布AI扫拖机器人,它具备领先的家庭环境全场景感知及运动能力,通过多模态交互,精准避障让扫地机器人在家庭常见的障碍物中灵活穿梭不卡困。

共建产业生态,2024年上半年对标GPT-4

唯有生态繁荣,才有人工智能大未来。自2010年发布讯飞开放平台以来,科大讯飞持续构建AI开发者生态,让AI像水和电一样落地各行各业。今年依托星火大模型,讯飞将AI普惠更多用户。

此外,他现场发布星火内容运营大师,人机共创提质增效,通用稿件30分钟共创生成,深度稿件辅助编辑效率翻番。

如今随着大模型持续突破,讯飞AI开发者生态持续领先。自5月6日星火发布以来,讯飞开放平台新增143.4万开发者团队,同比增幅331%,汇聚553万AI生态开发者团队。其中新增大模型开发者17.8万,讯飞正与10万+企业客户用星火创新应用新体验。大模型也显著降低了开发者门槛,在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用。

为了进一步加速大模型行业落地,科大讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等行业,加速产业升级。

在讯飞星火蓬勃的生态背后,是自主创新的算力底座。讯飞和华为“联合特战队”半年内实现星火大模型训练和推理效率均翻番。1024全球开发者节现场,科大讯飞联合华为重磅发布,基于昇腾生态的“飞星一号”大模型算力平台。

不过,刘庆峰也提到,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。”他表示,唯有实事求是的科学精神,才能真正实现超越。

“大模型时代的大幕才刚刚揭开,让我们一起共创、共享、共进化。”刘庆峰透露,对标GPT-4的更大参数规模的星火大模型正式启动训练,2024年上半年将实现对标GPT-4。

“讯飞星火正日益成为解放生产力工具。”刘庆峰表示,当前讯飞星火已有1200万用户,为千万用户持续创造刚需场景价值。自讯飞智作2.0 、讯飞写作产品发布以来,已新增超10万名专业用户,提供新闻播报、教育培训、自媒体推广到企业宣传等服务,让每个内容创作者都拥有自己专属的AI创作助手。(曾宪勇)

0 阅读:19

阿桶观察

简介:我崇尚文明,但遵从自然。