模型成色几何?
据财报,2022年全年,科大讯飞的主营业务仍是软件和信息技术服务,占总营收的98.41%;其中占比最大的是教育产品和服务,占总营收的32.74%;其次是开放平台及消费者业务(24.66%),再次是智慧城市(23.63%)以及运营商相关业务(11.14%);智慧汽车、智慧医疗和智慧金融相加占比为6.2%。
AI业务的迅猛发展需要科大讯飞跟进技术潮流,大模型的重要性不言而喻。
由研发投入可见科大讯飞对大模型的重视。财报显示,科大讯飞2021年研发投入29.36亿元,2022年增长至33.55亿元,同比增长14.28%;研发人员数量已从2021年的8367人增加到了2022年的9281人,同比增长10.92%,在整体员工中的占比提升到了61.68%。
但实际上,除去算法,大模型训练的难点和重点在于需要庞大数据和巨大算力,包括CPU(中央处理器)、GPU(图形处理器)、ASIC(专用集成芯片)等硬件设备以及支持大规模并行计算的软件平台和框架,此外还涉及大量数据存储、传输以及相关人力维护和升级。NVIDIA即英伟达研究数据显示,ChatGPT 3最大规模的模型需要使用175 Billions的参数量,需要512颗V100显卡训练7个月时间或使用1024颗A100芯片训练长达一个月的时间,每个月成本在百万美元以上量级。
这意味着资金实力雄厚的大厂更有烧钱的底气,一般企业很难参与竞争。2022年全年,阿里、腾讯的研发投入均超过500亿元,而百度在研发投入214亿元的情况下,旗下文心一言仍与ChatGPT差距较大,遑论同期研发投入仅约30亿元的科大讯飞。
即便如此,仍有不少人对科大讯飞寄予厚望。这不仅因为其在语音和AI上有一定先发优势,更因为这家公司多少带有些国家队色彩。最新财报即2023年第一季度财报显示,国有法人中国移动通信有限公司和中科大资产经营有限责任公司在科大讯飞前十大股东中分别排在第一和第四位,持股比例分别为10.66%和3.59%,作为创始人兼董事长的刘庆峰以7.24%的持股比例位列第二。
这被认为科大讯飞更易打造从ToG到To B的商业闭环。财报对此亦有提及。举例来说,财报显示,截至2022年底,科大讯飞智能评卷技术已累计在14个省市高考中实现正式交付应用;司法业务领域已接入466个子平台,涉及26个省市区,累计覆盖1800多家法院。
但G端与B端的发展很难与大模型研发和应用直接挂钩,也无法全然打消市场质疑。5月星火大模型发布后不久,就有网友发现在后者的回答中会出现“我是由OpenAI开发的”等内容,由此怀疑星火大模型套壳OpenAI开发的ChatGPT。科大讯飞表示,这是由于ChatGPT热度较高,训练数据中出现较多OpenAI、ChatGPT等词汇造成的回答错误。
大模型的常见考察标准包括多风格、多任务长文本生成,多层次跨语言理解,泛领域开放式知识问答,情境式思维逻辑推理等。据海克财经观察,目前已有相当数量的网友对星火大模型进行了测试。面对一些人类视角不算复杂的逻辑推理题目和部分高考语文、数学题目时,星火大模型未能给出正确答案。
正因大模型开发成本高昂,应用和商业化想要覆盖成本也还需要时间。OpenAI在2023年3月宣布开放API(应用程序接口),价格为每1000 tokens 0.002美元,还表示开放人工智能驱动的语音转文本模型Whisper的API,开发者使用的价格为每分钟0.006美元。有外媒报道,2022年OpenAI亏损超过5.4亿美元,全靠背后的微软输血。
对标ChatGPT的星火大模型无疑更难短期直接为科大讯飞带来利润,而科大讯飞如今还需部分依靠政府补助。财报显示,自2018年至2022年,科大讯飞获得的政府补助分别为2.76亿元、4.12亿元、4.25亿元、4.38亿元、4.73亿元。