早于ChatGPT成立,中国头部大模型智谱AICEO张鹏解析大模型商业化

大国汽车精说 2024-03-15 08:45:59

“第一代ChatGLM,这也是我们去年3月14号发布的这个产品的基座,这应该是国内最早可以线上测试使用的千亿级的对话模型,基于它开发智谱清言C端应用,并在去年8月第一批通过了国家的备案认证。”3月14日,在智谱AI媒体小型沟通会上智谱AI CEO张鹏表示,回顾过去大模型落地的这一年,智谱AI交出了一份还不错的答卷,实现了2000+生态合作伙伴、1000+大模型规模化应用、200多家企业深度的共创,更深度的改变着客户的业务范式和组织架构。

3月14日,由央视网“人人都爱中国造”品牌助力行动和智谱AI联合主办的“智领,万象新生”智谱AI媒体小型沟通会在北京举办。总台央视网主持人常婷介绍,“人人都爱中国造”品牌助力行动是2020年在国家相关部委指导下发起的,在不久前刚刚召开的全国两会上,“人工智能+”这个概念被首次写入到了政府报告当中。

热议一年有余的AI大模型到底是什么?它能帮助人们做什么?

在智谱AI推出的生成式AI助手“智谱清言”中输入“AI大模型是什么”,得到的答案是:AI大模型通常指的是大型的人工智能算法模型,这些模型拥有庞大的参数数量,需要大量的数据来训练,并且能够执行复杂的任务。它们通常用于自然语言处理、图像识别、声音识别和其他人工智能领域。这些模型通过不断地学习和调整,以提高其准确性和泛化能力。

大模型与小模型的讨论

张鹏认为,在当时国内学术界和产业界都对大模型的发展和产业化没有形成共识,有很多的讨论,甚至很多人提出成本这么高,我们不应该发展大模型,而应该专注于发展所谓的“小”模型。

“说实话在那个时间段,我们自己内部也有很多的思考和讨论,也有一些争论,正如大家所知,这件事情的投入成本非常高、非常大的,作为一家刚刚建立不久的创业型企业,我们如何来支撑这么大的资源,而且我们的研发人员团队是否能支撑这样一个任务?”张鹏说,外部市场对于大模型的认知少,对这个概念还非常陌生,各方面都处于一个非常艰难的情况和境地,换而言之,其实当时的智谱是有那么一点孤注一掷的意思,大家的压力,尤其是研发人员的压力是非常大的。大家最近可能也听说了 OpenAI 团队内部的一些非常卷的故事的一些情况,其实我们当时的情况甚至比他们更严重,非常类似。

国产新力量:从零开始搭建,完全自主研发可控大模型

智谱AI是国内头部大模型厂商的代表之一,公司成立于2019年6月,这远早于ChatGPT一鸣惊人继而引起全球大模型热潮的时间。

据智谱AICEO张鹏介绍,智谱AI源于清华大学技术成果成立,创始团队此前一直在清华大学计算机系KEG实验室工作,实验室汇集了行业领军人才,一直密切关注、探讨下新一代人工智能技术会往哪个方向发展。“近十年时间,我们一直从事人工智能技术相关的研究和产业落地工作。”张鹏介绍,团队经常接触到人工智能技术发展最前沿资讯,感受到下一个时代人工智能技术阶梯式、飞跃式的发展潜力,基于“把过去十几年实验室的研究成果转化为落地实际技术和产品的想法,成立了智谱AI。”

张鹏介绍,智谱AI最大的核心竞争力,就是其实现了大模型生成AI的全链路自主可控,专注做大模型的中国创新。智谱AI自研了具有完全知识产权的预训练框架GLM, 并自建训练平台,拥有从零开始搭建平台和运维平台的能力。公司2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B——同年,斯坦福大学大模型中心对全球30个主流大模型进行了全方位的评测,GLM-130B是亚洲唯一入选的大模型,准确性、恶意性与GPT-3持平,鲁棒性和校准误差在所有模型中表现最佳。

2024年1月,新一代基座大模型GLM-4正式推出,支持更长的上下文,具备更强的多模态能力;同时,GLM-4智能体能力得到大幅提升,可根据用户意图,自动理解、规划指令以完成复杂任务;GLMs 个性化智能体定制功能亦同时上线。

张鹏表示,基于智谱清言的智能体的体系,到目前为止,我们的用户已经贡献了超过10万个创新的智能体应用,覆盖了方方面面,包括心理咨询、教育辅导、金融投资分析、法律咨询甚至是娱乐、产品开发与设计、人力资源咨询、行政与办公辅助、营销与广告、出版与编辑、个人生活助理等众多场景,大家都可以在这个智能体应用当中找到相应的工具来帮助你。

“大模型,真的已无处不在,现在它的潜力越来越多的展现在我们的面前。1月份的技术开放日我们的推广语中有一句话,我因遇到风暴而激动如大海——这句话来自诗人里尔克。”张鹏说,浪潮涌起总有勇敢屹立潮头之人,我们智谱AI愿意做这个先行者,朝着通往人工智能的目标勇敢前进。

0 阅读:0

大国汽车精说

简介:感谢大家的关注