云厂PK算力够不够高客户只在意模型能否落地

华尔街科技眼 2023-06-21 15:20:44

文/陆以达

编辑/cc

从可以领会意图识别情绪的聊天机器人,到梦幻般的图像创作,再到复杂的 DNA 蛋白质建模……ChatGPT吸引了全世界的想象力,并且把数字经济带向了另一个历史性的节点。人工智能正在充当无形的虚拟行政助理,辅助保险理赔估算,甚至进行法律援助。

大模型(LLM)狭义上指基于深度学习算法进行训练的自然语言处理(NLP)模型,它是让人工智能产生以上魔力的基础。为了让各个行业受益于大模型这样的数字经济基础设施的更新和进步,6月19日,腾讯云首次公布行业大模型研发进展,依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,帮助其他应用者开发在大模型的基础上定制、开发智能应用。

技术的爆发令所有人兴奋,但对于商业用途而言,成本和预算却是现实的考量。从规模上看,目前千亿级参数规模的大模型已经成为主流。各个大厂动辄比拼量级,通过足够大的规模促成“涌现”。通用大模型的训练不但需要依赖大规模的GPU芯片支持算力,也需要海量的训练数据和漫长的训练周期,昂贵且耗时,是大玩家才能负担得起的巨大投入。

腾讯集团高级执行副总裁汤道生在大模型及智能应用技术峰会上就模型、数据、应用与算力拆解了大模型在产业落地的方案,他指出,一味强调规模的大模型并不是满足行业场景需求的最优解:“客户更需要有行业针对性的大模型,再加上企业自己的数据做训练或精调,才能打造出实用性高的智能服务。企业所需要的是在实际场景中真正解决了某个问题,而不是在100个场景中解决了70%-80%的问题。”

激动人心但昂贵的技术如何落地?关于创新技术的应用,麻省理工学院(MIT)麦戈文人脑研究院创始人帕特里克·麦戈文先生说过一句朴素的至理名言:“寻找那些用户需求没有得到满足的领域。”大模型寻找到真正的落地场景,需要特定行业和专业领域的知识。只有经过了特定的“调教”,通用模型才能扩展延伸成行业模型甚至场景模型,解决商业痛点,满足市场的需要。

图:腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声

大模型三千,让客户也可以取一瓢

面对一些中小型企业无法承担大模型落地高昂成本的落地问题,大模型不但要会“计算”,也需要能够为客户着想,会“算计”,成为可负担、具有可及性、可以带来商业回报的技术。

“行业大模型与产业的结合尚处于早期阶段,针对产业的标记和模型训练仍然在摸索的过程中,而产业对大模型的理解和运用也才刚起步。”腾讯云副总裁和智能负责人吴运声认为,“让客户真的能够用起来,帮助他解决问题,才是大模型落地发挥作用的时刻。”

吴运声指出:“我们发现,大模型在不同的参数影响下确实会表现出一些区别,像逻辑推理、数学推理等等确实要到几十B甚至上百B的规模才能比较大的提升;但是,一些开放问答或者其他维度,通过小模型、量化其他方式维持在十几B,甚至比较小的一个范围内,就可以满足客户的需求,达到小问题用大模型这个愿景。”

因此,针对问题,找到最合适的模型,以最低的成本,匹配最好的服务,才是扫清大模型落地产业的障碍。有一些垂直行业、领域或者产品,它所涉及的数据量本身并不大,其实用小参数可能效果会更好。

在依托腾讯云TI平台MaaS一站式服务的精选商店里,企业客户可根据自身业务场景需求,“量体裁衣、按需定制”不同参数、不同规格的模型服务,选购涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案。在TI平台内置高质量行业大模型基础上,企业加入自己独有的场景数据,就可以快速生成自己的专属模型,大幅降低大模型应用门槛。

“结合客户的需要,评估解决问题的难度,选择对应的模型,形成定制化的整体解决方案。有的场景预算甚至不会提升,而是降低。”吴运声说,“一些问题场景原来是无法解决的,大模型可以解决,一些场景问题原来需要多个模型解决,现在只需要一个模型解决,因此,可以更加节省人力和资源。”

腾讯云TI平台以前更强调工具的属性,如今在升级为MaaS后,得到了腾讯云内置行业大模型的加持。这意味着下游产业和公司可以站在腾讯云的肩膀上继续拓展人工智能的想象力,利用TI平台提供的完善的大模型工具链,包括数据标注、训练、评估、测试和部署等全套工具,进一步打磨大模型的能力,为行业提供高性能的方案。在这样的基础上,场景和应用公司可以更好地用例打磨细节,节省了巨大的投入成本,避免“杀鸡用牛刀”落地问题。

图:腾讯云MaaS全景图

产业场里练兵,哪些用例已经走马上任?

大模型意味着数字基础设施的升级,也预示着相关的创新工具箱的爆发。在这艘全新的数字母舰上,行业新数字化的迁徙已经发生。想要大展拳脚的技术必须找到市场,而市场就在产业和生态中。目前的MaaS覆盖了金融、传媒、文旅、政务、工业等多个行业场景,腾讯云意在锁定船票,开始征途。

依托在高性能算力及大模型能力方面的积累,腾讯云已在大模型行业应用方面共创了50多个行业解决方案,在智能客服、光学字符识别(OCR)、跨模态检索等领域有广泛实践,大模型被调教完之后,直接可以完成这些行业的下游任务。

“以前客户服务需要就相应的流程配置大量的知识库、模块和画布,而如今,行业大模型不但可以提供更高效的方案,它甚至还可以识别客户的意图,做情绪分析,并且给出更人性化的回复。”在分享案例时,吴运声表示,客户对行业大模型持欢迎的态度,只要打消顾虑,解决真问题,带来真效用,行业就会拥抱新技术。

在研发进展的发布会上,腾讯云拿出了几个案例:客服问答服务已经涵盖了文旅行业的定制化服务、政府政务问答和教育就业类的咨询场景;跨模态检索方面,腾讯云TI平台原生模型开始服务于剪辑师,大力提升了视频制作和分发的效率;银行服务也受惠于OCR的智能化,实现了95%以上准确率的文件智能识别和关键词提取,将文件数据转化为结构化数据,全面提升运营效率。

“大模型只是开端,AI与产业的融合,将绽放出更有创造力的未来。”汤道生在主题演讲中说,“回顾过去,人工智能的发展是结合开放数据的积累、算法的创新与算力的突破共同推动的;也是全球科技企业、高校与研究机构共同努力,通过代码的开源与研究成果的分享,开放共建的成果。”让AI普惠产业和生活,是大模型服务数字经济的最终目的。

0 阅读:15

华尔街科技眼

简介:理性看待商业世界 审慎研判科技趋势