AI国家队来了!国产人工智能大模型将赶超ChatGPT

胖胖聊科技 2023-05-07 00:15:25

自从ChatGPT上线,人们就将人工智能看作生产力变革的关键因素之一。现在,各大模型技术陆续登陆,呈现出星星之火可以燎原的态势。就在近期,又有一则关于人工智能大模型的新闻传出,科大讯飞又一次带给我们惊喜。

5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。

发布会现场,语音输入,实时互动,无论是文本生成、语言理解,还是知识问答、逻辑推理,亦或是数学能力等,星火大模型都表现出色。现场真机实测的互动提问,大模型的精彩回答,引发掌声不断。

刘庆峰表示,认知大模型成为通用人工智能的曙光,科大讯飞有信心实现“智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。他进一步公布大模型年内三次升级时间点,10月底将整体赶超ChatGPT。后续科大讯飞还将联合开发者推动大模型应用落地,共建人工智能“星火”生态。

一、提出通用人工智能七大维度481项评测体系 赶超GPT要有科学的方法和体系

自去年11月30日ChatGPT发布以来,认知大模型技术阶跃持续进化,人工智能在全球引起了广泛关注,掀起了全新的热潮。在多个领域,认知智能都表现出了非常强大的能力。对于人工智能来说,认知大模型成为通用人工智能的“曙光”,它出现的历史意义不亚于PC或者互联网的诞生。

刘庆峰表示,从ChatGPT关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求分析,通用人工智能应当具备七大维度能力,包括文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等。

认知大模型的“智能涌现”也将带来解决人类刚需的全新机遇。比如,改变信息分发获取模式,革新内容生产模式,全自然交互完成任务,实现专家级的虚拟助手,颠覆传统手工编程方式以及成为科研工作的加速器等。“让未来每一个有创意的人,都能成为数字经济中的创业者。”刘庆峰说。

面向全新的人工智能时代机遇,科大讯飞已为认知大模型的“智能涌现”做好了源头核心技术的储备。

2011年科大讯飞便承建了语音及语言信息处理国家工程实验室,“我们提出让机器像人一样能听会说,这一次认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是一个基础条件。”刘庆峰说。

2014年科大讯飞推出“讯飞超脑计划”,明确提出:让机器像人一样能理解会思考。2022年,又升级为“讯飞超脑2030计划”,提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会,让机器人走进家庭。

“在国家平台和讯飞超脑计划的支撑下,过去几年我们在认知智能领域取得了一系列全球领先的成果。”2017年,科大讯飞承建认知智能国家重点实验室,也就是从这一年起,科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生,并且在SQuAD机器阅读理解中全球首次超过人类平均水平,刚刚过去的2022年在OpenBookQA 科学知识推理中,单模型也超过人类平均水平。“可以说多年来,科大讯飞已在认知智能领域有了丰富的储备和积累。”

刘庆峰透露,在2022年12月15日,科大讯飞正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。

作为人工智能“国家队”之一,刘庆峰表示:“我们要向OpenAI致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。“科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。在科学的评测体系中,推动大模型的发展。

刘庆峰强调,“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”

二、讯飞星火认知大模型三大能力已超ChatGPT 现场语音输入流畅 多维实测燃爆全场

发布会现场,科大讯飞围绕讯飞星火认知大模型的七大核心能力,即多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力,展开现场实测。大模型更是在文本生成、语言理解、数学能力上表现出“智慧”的火花,效果惊艳。

写邮件、做方案、讲故事,讯飞星火大模型到底有多会写?

“你为什么叫星火?”科大讯飞研究院院长刘聪直接语音输入,讯飞星火认知大模型不仅准确的进行了语音转文字,而且迅速给出了它的回答。

“今天是科大讯飞星火认知大模型的发布会,线下和线上观看发布会的朋友们一直以来对科大讯飞都非常关心和支持,非常感谢大家,请帮我写一篇欢迎词。”短短几秒钟,一篇要点俱全的欢迎词随机生成。

星火大模型编故事的能力也很出彩。“孙悟空和奥特曼也偷偷潜入了会场,他们都争着想做讯飞星火认知大模型的代言人,还为此吵了一架,请根据上述信息创作一个故事。”星火大模型随即脑洞大开,一段生动的故事就娓娓道来。“每一次重新生成,结果都是不一样的,这也是我们星火大模型的魅力所在。”刘庆峰表示。

此外,它还能写邮件、做方案、写新闻通稿等,它还能生成英文宣传,修改英语语法错误,展现作为AI助手的多才多艺。

刘庆峰表示,在长文本生成上,讯飞星火大模型在国内明显领先,并且在中文方面超过了Chat GPT,并且在持续进步中。

中文理解十级测试,现场观众:讯飞星火满分!

在语言理解上,星火大模型的变现也很出彩。刘聪现场问到:

“俗话说男子汉大丈夫宁死不屈,但是俗话又说男子汉大丈夫要能屈能伸,请问这两句话怎么理解?”

“如果一个小伙子跟女朋友吵架了,他应该宁死不屈还是能屈能伸呢?”

大模型都很好的理解了特定的句子和场景含义,随着问题的变化,灵活调整自己的答案。精彩的回答也让现场观众报以热烈掌声。

这还不够,大模型现场还展示了“情感分析”能力,展现出跟人类共情的潜力。

“今天小明参加比赛获得了冠军,拿到奖杯后他默默地站了一分钟。今天我上课被老师批评了,走出教室后我默默地站了一分钟。请问上面这两个默默地站了一分钟分别表达了什么心情?”

刘庆峰表示,科大讯飞现在的语言能理解能力相比ChatGPT还略有差距,但已超越国内同类产品。

大模型聪明与否看数学,讯飞星火数学能力远超过国内外大模型

在数学能力中,讯飞星火大模型展现出“学霸”气质。除了常规计算、几何、情景应用等,刘聪现场也抛出了复杂的计算题:“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”

星火大模型很快准确给出了答案,并给出了解题步骤。刘庆峰表示,数理能力一定程度代表了一个大模型的聪明程度。讯飞星火大模型不仅在国内系统中遥遥领先,也超过了ChatGPT。

此外,刘聪还展示了大模型面向泛领域开放式知识问答,它具备很好的通识知识,能够对生活常识、科学知识、工作技巧,以及医学知识等应对自如,该能力也已超过ChatGPT。此外,星火大模型也具备逻辑推理能力与代码能力,为了还将进一步升级多模态输入和表达能力,不断实现自身迭代进化。

刘庆峰表示,虽然目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但这些问题在今年会有明显的改进。

同时他公布了年内大模型技术持续升级的三个关键里程碑节点:6月9日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。

三、赋能教育、办公、汽车、数字员工 讯飞星火认知大模型落地四大行业应用

讯飞星火认知大模型技术正逐渐为更多行业赋能。在本次发布会上,围绕星火认知大模型“1+N”架构中“N”个领域的内容,科大讯飞还发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。

“大模型+AI学习机”,让AI 像老师一样批改作文,像口语老师一样实景对话。在作文批改上,搭载认知大模型的科大讯飞AI学习机T20系列可实现中英文作文类人批改。相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,讯飞AI学习机实现了围绕写作要求、分析全篇结构和文采的深度高阶批改。像老师一样层层批改点评,让作文批改更高效。它还可以实现写作思路启发,利用AI润色技术生成片段优化参考和写作建议提升,让孩子在启发中精准提升。在口语对话方面,讯飞AI学习机精通中英双语,不仅发音纯正、表达地道,孩子直接说中文也能翻译成英文并教孩子朗读,还能对孩子的发音进行评分。陪伴式对话练习,让孩子更愿意开口说,告别哑巴英语,提升口语表达能力。

刘庆峰相信,这两项功能的升级将会促进语言学习再上一个全新的台阶,科大讯飞希望用“星火”点燃每一个孩子的想象力。

长篇大论不想看?口水稿成文太费力?讯飞智能办公本搭载大模型阅读效率提升60%

“大模型+智能办公本”,根据手写要点自动生成会议纪要,助力办公效能进一步提升。面对口语稿阅读困难、纪要整理耗费精力、已有素材难成稿、长篇章难抓要点等痛点,搭载大模型技术的讯飞智能办公本升级了会议纪要、语篇规整两大功能。在会议纪要方面,将语音实时转写与墨水屏纸感书写相结合,并且可以对会议记录内容形成一份精简的会议纪要,有助于快速回溯会议内容。在语篇规整方面,可以去除语音转写文稿中的口语化词汇、过滤冗余词汇,对文本进行润色等,轻松将一篇语音转写文稿规整成书面化内容,阅读效率提升50%。

AI写稿抢头条,记者采访后30秒生成新闻!讯飞听见会写到底多会写?

“大模型+讯飞听见”,一段录音、一键成稿, 一分钟输出流畅会议文案。输入音频录音后,除了能够实现语音转文字外,讯飞听见通过AI分析文字内容,可以一键生成包括全文摘要、工作待办、工作计划、新闻稿件、宣传文案、多语种翻译等多种文本,还可以根据原文件内容,进行AI对话并对原文内容进行提问追溯。此外还有讯飞智能录音笔、讯飞智能麦克风等办公产品的相关功能也在持续更新中,智慧办公将迈入全新阶段。

汽车语音市场占有率第一的科大讯飞有望推出搭载大模型的智能座舱

“大模型+智能座舱”,实现车内跨业务、跨场景人车自由交流。科大讯飞已为数千个车型提供业界领先的智能语音交互服务,提供多轮、多人、多区域、多模态的语音交互,累计服务用户已经超过4610万,在国内汽车智能语音应用市场保持占有率第一。这一次认知大模型技术会让车载人机交互再上一个新的台阶,实现更自由、更拟人化地沟通,让汽车驾驶更智能、更安全、更有乐趣。

科大讯飞首创新一代基于大模型的生成式RPA,让数字员工更智能

“大模型+数字员工”,基于自然语言生成业务流程和 RPA,帮助企业员工完成大量重复性工作。现场以公司招聘事项为例,输入指令后,系统即可自动按照事先设计的RPA脚本,操作计算机中的相应软件,实现业务流程的自动化操作并输出结果,还能进行数据分析,大幅减轻一线工作人员的压力。另外,科大讯飞推出的虚拟人智能交互机,消费者通过对话直接说出需求,数字员工即可为消费者推荐相关产品,从咨询到购买的全过程能实现24小时不打烊的服务,首批10家讯飞官方直营店将率先上线。

除了上述领域外,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,满足更多专业领域的需求,向更广阔的产业领域延伸。

四、开放合作 共建人工智能“星火”生态 与华为强强联合,让大模型建立在安全可控的国产算力平台之上

“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”刘庆峰说。

讯飞开放平台新增星火认知大模型,将赋能开发者打造更具价值的AI应用。目前,讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。在新时代的机遇下,科大讯飞将通过能力开放、插件开放、行业共创,与千行百业共建生态。

刘庆峰宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。与生态伙伴一起,燎原新一轮产业变革。

为全面深度赋能开放平台合作伙伴,科大讯飞启动“2023 科大讯飞AI星火营生态计划”,面向千行百业的开发者,提供技术赋能、方案打造、赛事运营、商业运作、创业扶持等多维度资源,推动大模型的应用落地。

“今天在我们发布会的同时,苏州、武汉、青岛、太原四座城市将会率先启动星火营计划,我们期待与开发者一起用星火燎原产业生态。”刘庆峰说。

据了解,此次发布会还设有7个分论坛,从办公、座舱、医疗、金融,到面向儿童的阿尔法蛋,以及到智慧营销和算力平台方面的共7个专题。刘庆峰介绍,算力方面科大讯飞将联手华为,“使我们未来认知大模型的持续进化,要在我们自主可控的平台上,不断地提升。”

面向未来,科大讯飞将秉持源头创新、自主可控、信息安全、人文伦理的原则,在保护伦理和安全的前提下健康发展。

即日起,讯飞星火认知大模型已正式对行业合作伙伴和开放平台开发者开放预约。访问讯飞开放平台官网,进入星火大模型,即可体验。

15 阅读:10145
评论列表
  • 2023-05-08 14:28

    别人没有公布的时候咋不见你们有动静,别人一发布你就赶超,是敢抄吧!

    秋阳 回复:
    还能不敢抄,我就指着它吃饭了[得瑟]
    用户10xxx00 回复:
    做PPT赶超他们很快的[笑着哭]。
  • 2023-05-07 12:45

    实际怎么样不敢,嘴上不能输

    热心网友 回复:
    又双叒叕赶超了[鼓掌][鼓掌]
  • 2023-05-09 17:13

    显卡多买不到还超超你妹

  • yq 11
    2023-05-12 05:33

    抄袭山寨世界闻名

  • 冷风 10
    2023-05-09 11:27

    假的一批[呲牙笑]

  • 2023-05-09 15:49

    有本事不要过滤关键字,不要偏向性回答问题

  • 2023-05-14 12:20

    吹牛排第一,要用了,就一言难尽了

  • 2023-05-08 21:32

    鸭子毛,吹牛无敌

  • 2023-05-09 14:57

    吹吧,吹吧,没人说得过你们

  • 2023-05-08 12:56

    科大讯飞比较靠谱,我相信科大的。

    用户12xxx83 回复:
    一年前不见他出来吹[笑着哭]
    chc142857 回复:
    上午刚看到是抄袭,下午就赶超了?
  • 2023-05-15 09:56

    内测的时候就觉得不错,现在的版本更出彩了,估计会更好!

  • 2023-05-16 22:45

    小作文写的质量不错,还可以进行朗读

  • 2023-05-16 22:13

    这个产品已经在车机系统上使用了呢

  • 2023-05-22 10:44

    放屁真响![点赞]显卡哪里来的?土地长出来的吗?就是你有钱人家也不卖你!你知道Open AI用了多少张显卡,一张显卡多少钱?一个数量数据用了多少钱,别在这里瞎逼逼,啥也不懂的骗小白。

  • 2023-05-09 10:54

    多语言翻译翻车这么久了,怎么还没上路啊?

  • 2023-05-09 09:46

    令人振奋的信息[点赞]

  • 2023-05-14 14:02

    赶超

  • 2023-05-15 10:01

    还要进行几次迭代,会越用越聪明

  • 2023-05-15 10:20

    问了几十个问题,回答都还不错,简单的复杂的都能搞定

  • 2023-05-15 23:43

    英伟达都不卖A100给你。你说你要超越GPT?

  • 2023-05-15 10:41

    应该还会继续迭代吧?现在比前段时间内测又好不少

  • 2023-05-16 22:27

    AI人工智能时代真的就在身边。

  • 2023-05-09 09:47

    希望是真的

    走猫步的螃蟹 回复:
    希望不就是失望吗
  • 2023-05-14 19:12

    世界的运转依旧遵循丛林法则,只有执科技创新之牛耳方能令老牌西方列强心服口服,而国家战略层面能否打造出一个优于西方国家的科技创新氛围显得尤为关键!一个华为太过孤单,中国这么大一个市场完全具备养活像英伟达、阿斯麦、台积电、谷歌、波音……这样子科技巨头,只要我们努力做好自己降低内卷。

  • 2023-05-15 17:38

    讯飞有前途

  • 2023-05-17 19:03

    遍地都是人工智能,仿佛一夜之间就赶超了米国,吹牛都不打草稿。

  • 2023-05-17 17:01

    当初内测的时候就觉得应该不错

  • 2023-05-18 15:56

    赶英超美从上世纪50年代就开始了。先来个小突破吧,把3纳米芯片制程给解决了。

  • 2023-05-19 10:07

    让他写个代码,只能写一半,剩下的不会了

  • 2023-05-20 12:22

    一说国家队就完了,这些年所谓的国家队搞出过什么东西

  • 2023-05-21 03:50

    这就是抄袭。

  • 2023-05-20 19:16

    先吹牛再做事

  • 2023-05-23 16:31

    跟屁虫.让老美瞧不起。

  • 2023-05-09 10:10

    为什么不向个人用户开放?

    liak47_2001 回复: 走猫步的螃蟹
    让个人用户参与使用测试,训练及反馈呀,是骡子是马拉出来遛遛。就如百度的文心一言;如果实在想收钱就像opnai的chatgpt4一样。
    走猫步的螃蟹 回复:
    怎么开放??
  • 2023-05-12 11:29

    看文章,感觉我国已经实现了人造人,只是没有公布,绝绝对的世界、宇宙第一。感谢科大讯飞的撰稿,让我觉得很幸福

  • 2023-05-14 19:13

    除了抄袭还会啥?腾讯起码抄袭时还会创新

  • 2023-05-15 10:36

    这个都可以搞成办公小助手了,很多问题都可以问星火,方便得很

  • 2023-05-15 10:00

    算是行业风向标了,希望我国能加快速度发展更好

  • 2023-05-15 18:10

    希望星火独树一帜,越来越好!

  • 2023-05-15 17:51

    这个是需要用数据进行训练的

  • 2023-05-16 22:19

    整体的表现相当不错

  • 2023-05-17 16:27

    问星火问题 对答如流啊

  • 2023-05-17 16:43

    申请账号试了下,还不错

  • 2023-05-19 11:12

    又赶超了[笑着哭][笑着哭]

  • 这就是一个坑[呲牙笑]

  • 2023-05-23 20:58

    牛逼满天飞

  • 2023-05-14 20:12

    国人就是喜欢吹牛逼 动不动就秒天秒地秒宇宙 从没见任何发明创造 引领时代科技的成果 全都是在抄袭 还厚颜无耻敢说自己比别人强 辣鸡

  • 2023-05-08 22:55

    科大讯飞,垃圾,每股负3分钱收益,透支未来多少年,大家可以算一下

  • 2023-05-09 07:06

    要赋予AI价值观

  • 2023-05-08 19:25

  • 2023-05-09 12:06

    🐮皮第一

  • 2023-05-09 17:07

    发布出来,让用户评价评价。

  • 2023-05-09 23:05

    [笑着哭]

  • 2023-05-11 17:46

    梦里啥都有

  • 2023-05-14 06:50

    周宏伟讲了,说现在赶超的绝对是吹牛逼

  • 2023-05-14 17:49

    开发个策反AI,专门策反敌方AI[笑着哭][笑着哭][笑着哭]

  • 2023-05-14 21:41

    不吹牛逼不会死

  • 2023-05-15 10:07

    看了写的一篇新闻,我以为只是单纯的文字堆砌,结果很有调理,写得很清晰啊!

  • 2023-05-16 07:40

    一个笑话

  • 2023-05-16 22:43

    小孩能玩半天,就不用追着我问了哈哈哈

  • 2023-05-16 22:35

    对语义的理解性很好

  • 2023-05-16 22:13

    要是应用到机器人上,岂不是很厉害

  • 2023-05-19 07:35

    前两天看到评论小星火自己都承认套别人壳这个怎么洗[得瑟]

  • 2023-05-20 20:50

    可别吹牛逼了,芯片这就跟不上

  • 2023-05-20 10:39

    论文能写吧还是可以编程,和人家差远了[得瑟]

  • 2023-05-20 21:23

    一直在赶超和弯道超车,其实一直都是套壳和组装。

  • 2023-05-21 01:28

    什么时候不天天吹牛,才是真正的改变

  • 2023-05-21 02:15

    AⅠ会讲政治吗?

  • 2023-05-08 20:27

    垃圾而已,我从不在后面追。

  • 2023-05-09 12:38

    鬼才信

  • 2023-05-12 22:01

    别玩了,邯郸学步,东施效颦

  • 2023-05-15 07:07

    这赶超的方式 很韩国

  • 2023-05-15 10:34

    这样的效果整体已经可以了

  • 2023-05-15 18:02

    没想到星火表现的这么好

  • 2023-05-16 22:34

    用过了,比我想象中的要好很多

  • 2023-05-16 21:58

    终于被我等到了,这个测试效果真不错

  • 2023-05-17 16:28

    目前看讯飞真不错,可以提升效率,帮助还是蛮大的

  • 2023-05-17 16:31

    对语义理解也更灵活透彻 生成的答案还是不错的

  • 2023-05-21 16:08

    我就希望能出个科大讯飞机器人医生,能为病人答疑解惑。这个才是造福人类。

胖胖聊科技

简介:先后就职于IT168、品玩,主编、高级主笔、资深科技媒体人