2022年走到尾声之时,全球媒体的关注焦点都在疫情3年之后全球的经济走向,很少有人想到即将迎来一个科技大年。
媒体在做2022年终盘点之时,本以为这一年的1号科技明星,是“太空歌剧院”作者——Midjourney及其同行,《经济学人》还因此用Midjourney的技术特别制作了一期封面。
然而,在2023年的中国春节过后,2022年11月底发布的Chat GPT,在经过两个月的机器学习之后,以“AI 的iPhone时刻”的天神下凡般形象出现在世人面前,成为了全球媒体头条,并成为活跃用户最快突破一个亿的App。
大模型在2023年以摧枯拉朽之势席卷了科技产业。如果说2012年开启的AI十年狂飙,中国的科技力量尚处于跟随美国的状态,那么新十年的大幕拉开,中美就大有并驾齐驱之势,中国市场在200天时间内就涌现出79个大模型。
而在“AI 的iPhone时刻”的所有中国参与者中,科大讯飞成为了佼佼者——其不但在100天的时间里从发布星火大模型直至迭代出V2.0,并且以商业覆盖教育、消费、科研、智慧城市等多条赛道的想象力,成为了A股名副其实的AI第一股,市值最高逼近2000亿。
10月24日,在科大讯飞主办的“全球1024开发者节”上,科大讯飞发布了星火大模型V3.0,再次以刷新国内大模型迭代速度。科大讯飞董事长刘庆峰宣布,星火大模型V3.0对标Chat GPT实现中文超越、英文相当,而在1+N中的医疗大模型的六大核心能力则超越GPT-4。
这还只算“小菜”。随后,科大讯飞与到场的华为轮值董事长徐直军共同宣布两者将结成技术同盟。
与会者中有人问,这是中国版的“WinTel”同盟出现了吗?
科大讯飞在这个科技大年的1024,貌似要与华为组团一起去“捅破天”。
其实,2023年的科大讯飞,早已经不是2010年代那个靠AI语音技术一招鲜的高科技公司了。除了科技底座强大而丰富外,科大讯飞近年来以高效的AI产业化落地而著称,其营收增长新“发动机”接连出现,可以说是中国最成功的AI产业化应用落地公司。
新的科技十年轮回开启,为什么是科大讯飞一马当先?
双剑合璧, 科研高速迭代造就技术遥遥领先在正式发布之前,科大讯飞将星火大模型3.0开放给了一些机构测试。其中,国务院发展研究中心下属的国研经济研究院的测评报告认为,星火大模型3.0的综合能力超越ChatGPT,在国内领先并达到国际一流水平,而且在医疗、法律、教育行业的表现格外突出。
为什么5月份才推出的星火大模型能表现如此优异?
这与科大讯飞的AI基因与高屋建瓴的战略密不可分。
2012年10月,在并不十分引人注目的第三届ImageNet大规模视觉识别挑战赛(ILSVRC)上,神经网络的坚守者Geoffrey Hinton和他的几位学生,凭借基于深度学习的卷积神经神经网络AlexNet,以15.3%的低错误率获得冠军,这个成绩几乎是之前获胜者错误率的一半,而那届亚军的错误率高达26%。
这次比赛将AI代入了自90年代以来的又一个发展高峰,其与移动互联网波段叠加,至ChatGPT出世之前已带动全球科技产业狂飙已十年。
其实,在这第一个AI黄金十年里,科大讯飞就是国内公认的“AI第一股”。
包括刘庆峰在内的科大讯飞创始团队,皆为毕业于中国科学技术大学相关专业的优等生,可以说是科学家团队创业。
语音合成->语音识别->自然语言处理(NLP)->基于大模型的AIGC——这是围绕语言的AI技术的跃迁路线。在这条路线上,布满攀登难度极高的科研险峰。
而2008年就已经上市的科大讯飞,在刘庆峰的带领下没有小富即安,而是沿着这条道路不断地勇攀高峰,攻克了一个又一个科研难题。
其实,进入2010年代以来,中国人到处可以体验到科大讯飞所带来的科技便利与魅力,这些便利与魅力包括但不限于地图导航语音、高考听力测试、课堂教学课件、智能家居产品、智慧城市配套设备,等等。
科大讯飞的AI技术到底有多领先?
在2014年,科大讯飞高管团队内部开会讨论,认为自己的技术要领先竞争对手1年-1年半。
事实证明确实如此。2015年初,科大讯飞就推出了国内第一款智能音箱——叮咚,这在当时绝对是遥遥领先的科技。要知道,直到2016年11月,谷歌才推出Google Home;2017年7月,小米才发布第一款智能音箱,天猫精灵也是在这个时间点问世。
NLP是被誉为AI皇冠上的明珠。其技术的转折点,是ILSVRC偃旗息鼓那一年诞生的Transformer架构,其被很多人称为是“2010年代最伟大的科技发明”,其使得AIGC(AI生成内容)成为可能。而ChatGPT的出世,则意味着大模型运算赋能的AIGC产品出现了“智能涌现”。
而科大讯飞在取得语音识别技术不可撼动的领先地位的同时,一直在NLP领域投入重金攻坚克难,与国际最先进的科研成果保持同频共振。
实际上,在科大讯飞主办第五届世界声博会暨2022年“全球1024开发者节”之际,正是ChatGPT诞生前夜。如果回看便不难发现,当时的科大讯飞已经为“AI的iPhone时刻”的到来做了充足的准备,其自身也处于破茧成蝶前夜。
比如,在2022年,科大讯飞AI取得了突破性进展,在多模态感知、深度理解、多维表达、运动智能这四大领域皆取得历史性进步,在这些进步的基础之上刘庆峰发布了讯飞机器人超脑平台。
再如,国家首批20个标杆全国重点实验室,科大讯飞承建的“认知智能全国重点实验室”在列,且是其中唯一由企业承办的重点实验室。
2022年,科大讯飞发布了“讯飞超脑2030计划”,要让陪伴机器人走进千家万户。面对未来社会事业、工业发展和人类发展的刚性需求,科大讯飞准备再攀AI的科技高峰。
还有,在2022年10月,刚满一周岁的羚羊工业互联网平台已汇聚超过22.6万用户,累计服务企业次数超过45.5万。
讯飞开放平台在这一年也取得了飞速进步。刘庆峰在彼时兴奋地说:
“今年参加2022开发者大赛的团队数,从2021年的22472支增长到了32333支,增长了44%。108个赛道,其中有72个算法赛、36个应用赛。算法赛前三名的平均年龄26.5岁,而应用赛中有上市公司、独角兽、潜在独角兽,但有72%获得前三甲的队伍是从未融资过的企业!”而在2023年的“全球1024开发者节”上,这组数据已经变为
“在9月5日讯飞星火正式对全民开放以来,现在星火的各类应用已经超过了1200万用户。现在我们一开放603项AI能力,在星火大模型的加持下,开发者团队的总数已经达到了550多万家。5月6日至今5个多月的时间,我们新增了143万的开发者团队,增速非常快,比去年同期的增幅高331%!”科大讯飞的AI丛林生态正在茁壮成长。
可见,科大讯飞在2023年成为佼佼者,绝非偶然,这是其与生俱来的科技创新基因与高瞻远瞩的科技战略,两者不断优化配置、快速迭代的结果。
本届“全球1024开发者节”的一个重磅信息,是华为副董事长、轮值董事长徐直军到场,与科大讯飞联合发布了基于_腾生态的“飞星一号”大模型算力平台。
在之前,两家的合作一直是公开状态被行业熟知,但如此深入却出乎很多人预料。仔细一想,两者能结成类似于“WinTel”联盟也顺理成章,毕竟两者都是矢志不渝向“捅破天”技术持续输出的高科技企业,可谓情投意合,双剑合璧。
三生万物, 生态平台高屋建瓴激发产业化势如破竹自2012年AI大潮席卷、尤其是今年以来的通用AI大潮席卷以来,欧洲和日本都选择躺平,像意大利竟然出台法律禁止公民使用ChatGPT。总体来看,围绕AI的科技竞争就是在中美之间展开。
而这也是历史首次,中国的科技公司能与美国巨头在科技前沿角逐中同时起跑。美国对这种局面感到紧张,所以包括科大讯飞在内的中国AI领域领跑者才被连续列入所谓“实体清单”,因为美国怕科大讯飞们真的“捅破天”。
实际上,正如刘庆峰在本届“全球1024开发者节”上坦陈的那样,OpenAI有上万亿的浮点参数,有丰富的经验以及人机协同的强化学习、数据积累等等,星火大模型跟GPT-4比还是实实在在有差距的。
而令美国如此紧张的原因,不仅仅是因为以科大讯飞为代表的AI高科技公司成长迅速,更是因为中国的产业化土壤要远远优于美国。
中国用几十年走过发达国家几百年所走工业化历程,是全世界唯一拥有联合国产业分类中所列全部工业门类的国家,加之劳动力资源充沛,产学研结合紧密,这成为了中国科技公司在与美国竞争中“弯道超车”的最大法宝。
实际上,在移动互联网与新能源车两个领域,这种“弯道超车”已经连续上演,而在AI领域,这种趋势也比较明显。
在第一个AI十年狂飙一开场,2013年,拥有卓越机器人技术(著名的人形机器人Atlas)的波士顿动力被谷歌母公司Alphabet所收购,当时在科技迷和资本圈看来本来是强强联合想象空间无限,但波士顿动力在2017年又被谷歌转卖给软银集团;2021年6月,现代汽车集团又从软银集团手里收购了波士顿动力公司80%的股权。
波士顿动力在Altas身上已经耗费了十几年、几十亿美元,却在7年内换了3个东家,至今商业化无望,其根本原因就是美国的产业环境过于贫瘠,无论是生产供应链还是市场规模,都很难撑起波士顿动力的“捅破天”梦想。
2022年9月,马斯克接过波士顿动力的衣钵,以“擎天柱”机器人再次给科技界勾勒梦想蓝图。然而,“擎天柱”发布之后,并没有引起Space X火箭发射那样的惊叹,而是被众多AI创业者泼了凉水,他们普遍认为,“擎天柱”这样的四足机器人,不可能如期量产。
果不其然,2023年10月份都要过去了,擎天柱的量产进度杳无音信。
中国的AI创业者普遍看衰“擎天柱”的最重要原因,就是美国缺乏价廉物美的供应链网络,以及缺乏产业落地环境,致使“擎天柱”难以实现商业闭环。
反观中国,机器人已经走进各种场景,在刚结束不久的亚运会田赛赛场,负责捡拾铁饼与标枪的机器狗成为了一道靓丽的风景线。
从机器人这一视角也不难看出,科大讯飞“捅破天”的机会正在于AI赋能千行百业。
实际上,科大讯飞在AI产业化方面所取得的相对优势,要远远大于其AI技术本身的优势。
根据OpenAI的最新数据,其2023年年化营收已达130亿美元,折合人民币近95亿(其中包括微软的Azure OpenAI服务收入),然而,这仅相当于科大讯飞2022年营收的一半。
实际上,在上文提到的“与生俱来的科技创新基因”与“高瞻远瞩的科技战略”外,科大讯飞能够在第二个AI狂飙时代一马当先的最重要原因,是其多年来在AI产业化落地方向的执着探索。三者齐备,方能塑造出如今向“捅破天”冲刺的科大讯飞。
科大讯飞的消费者业务是其这方面成就的最佳例证。
2001年,为了把科大讯飞留在合肥,在时任合肥市长车俊的撮合与说服下,合肥美菱与国资给科大讯飞投资了3000万,这也是科大讯飞创业以来最大的一笔投资。兜里有了钱,讯飞的创业团队开启了第一次消费产品尝试,他们推出了To C的产品“畅言2000”。
畅言2000的目标客户是那些刚购入电脑却不会做的家庭用户,也就是PC版的Siri,这在当时是非常超前的产品。
然而,用户既不适应这种语音操控高科技,也不适应1000+的高昂价格,在全国铺货的“畅言2000”轻易就输给了键盘与鼠标。“畅言2000”的失败,导致科大讯飞巨亏。
上文提到的叮咚音箱,是科大讯飞在十余年后向消费级产品作出的又一次重要尝试。遗憾的是,这一次尝试也没有成功,叮咚音箱并没凭借自身领先的AI技术取得市场成功。
遇到这种情况,很多企业都会心灰意冷,放弃风险巨大的消费级产品战略。然而,就在2016年底,总结失败经验之后的科大讯飞成立了消费者事业群,重整旗鼓进军消费领域。
科大讯飞5年来收入情况,数据来源于公司财报
这一次,科大讯飞取得了巨大成功,时至2020年代,其消费者业务的营收已经占总营收的1/3,并且消费者业务的成功,为科大讯飞在“AI的iPhone”时刻的到来打好了雄厚的基础。
毕竟,没有大量的用户数据反哺,通用大模型不可能实现有价值的AIGC——就在大会召开前夕的周末,讯飞正式放出『讯飞友伴』产品后,短短的48小时内,首批用户自己捏出了3000多个虚拟人。
可以说,没有科大讯飞在消费者业务的不懈坚持,就不会有星火大模型的一鸣惊人,遑论在各行业赛道领域如羚羊工业平台赋能千行百业。
本届“1024全球开发者节”的主题,是“解放生产力 释放想象力”。
可以说,科大讯飞是先在产业化探索方向上勇敢地解放了自己,才成功赋予自身解放千行百业生产力的能力。
涓流泱_的结果,必然是水到渠成。
在本届“全球1024开发者节”上,科大讯飞联合行业龙头共同发布了12个行业大模型,与行业深度对接,进一步加速大模型落地和产业升级。
大模型时代的序幕才刚刚拉开。Gartner预测到2026年,80%的企业都要用到生成式AI应用程序编程接口(API)或模型,现在这个数据才5%。
科大讯飞在未来的想象空间非常之大。
在主题演讲的最后,刘庆峰有一段动情的陈辞:
“我很自豪,因为今天发布的所有应用底层的星火大模型V3.0的代码都是国产的,我们在中国电信的环境保障中,在国产化的算力平台上来训练讯飞星火3.0。整个星火V3.0,包括今天正式点火的‘飞星一号’,不仅仅是中国企业的相互抱团,更是给世界提供了第二种可能、第二种选择。”
诚然。2023年,Open AI的 Arrakis项目流产,这说明美国的科技巨头也有算错棋着的时刻,而中国的科技先锋们正迎来历史上最好的机遇期。
2022年“全球1024开发者节”的主题,是“因为看见 所以相信”,2023年的主题是“解放生产力 释放想象力”。其实,对于志向高远又有强大执行力的组织来说,“看见”与“相信”是一组在时代交替中不断彼此支撑的条件。
正因为科大讯飞相信AI解放生产力的远大前程,所以才能不忘科技创新的初心并坚持高屋建瓴的公司战略;同时,正因为科大讯飞看见了经自己妙手的AI,切实帮助千行百业解放了生产力,所以其才能再次相信2030那个未来图景。
不忘初心,坚守战略,勇于产业化探索,三者叠加使得科大讯飞在迎面而来的第二个AI狂飙时代,已经取得了明显领先的身位。