文/侯煜
编辑/罗卿
2023年可以称得上是大模型发展的元年,2月份,创新型公司OpenAI连同其发布的ChatGPT一夜爆火。之后,科技公司的大模型开始陆续亮相。
按照人们的共识,工业1.0是蒸汽机时代,工业2.0是电气化时代,工业3.0是信息化时代,工业4.0则是利用信息化技术促进产业变革的时代。大模型的出现将整个科技行业推向4.0 pro时代。新的技术时代的到来,让实体企业迫不及待地想要拥抱大模型技术,推动设计、销售、服务等环节的智能化升级,提升生产、经营、管理效率。
于是乎,大模型从面世之初的拼算力、拼规模,逐渐开始变得更细分、更垂直、更专业。云厂商也在试图降低大模型的使用成本,让大模型更好地与实体技术结合,在增效的同时,维持可控的成本。
近日的世界人工智能大会(WAIC2023)又是一个大厂秀实力和表达行业洞见的舞台,各位大厂大模型的推动者各抒己见,以下是会议的部分发言实录。
腾讯云与智慧产业事业群CEO汤道生:腾讯数智人“入职”了130多个行业
事实上,虽然通用大模型很强大,但并不一定能解决很多企业的具体问题。大模型在产业场景中是否真正可靠、可用?怎样才能保护好企业数据产权和隐私?如何降低大模型的使用成本?这些都是企业需要考虑的现实问题。
企业基于行业大模型构建自己的专属模型,也许是更优的选项。同时也要借助高效的专业工具,不断优化、迭代模型,以满足企业和市场持续变化的需求。
虽然通用大模型整体技术水平在不断提升,但并不聚焦。通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。
每个企业都可以基于用专业知识和数据训练出来的行业大模型,再加上企业自己的数据进行精调,建构独有的“专属模型”,更高效地打造出可用的智能服务。
实际上,过去5年,人工智能技术和产品也在各行各业落地生根,比如腾讯的数智人已“入职”了130多个行业,担任金融客服、虚拟主播等“数智员工”,为用户提供个性化的服务。
基于腾讯云TI平台打造的行业大模型精选商店,面向金融、文旅、政务、医疗、传媒、教育等10大行业,提供超过50个解决方案。在这些能力模型基础上,合作伙伴只需要加入自己独有的场景数据,就可以快速生成自己的“专属模型”。
百度CTO王海峰:文心大模型3.5,让知识点更具体和细分
百度首席技术官王海峰发言指出,百度文心大模型现已升级为文心大模型3.5,已实现基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
据王海峰介绍,在基础模型训练上,文心大模型3.5采用了飞桨自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源及数据分布,加快了模型迭代速度,显著提升了模型效果和安全性,同时还创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。
在知识增强和检索增强基础上,文心大模型3.5提出了“知识点增强技术”,对用户输入的查询、问题等进行分析理解,为大模型注入更具体、详细、专业的知识点,显著提升大模型对世界知识的掌握和运用。此外,文心大模型3.5还新增了插件机制,目前文心一言已对外发布官方插件百度搜索和ChatFile。
高通侯纪磊:创新和优化全栈式AI,加速应用落地
高通全球副总裁兼高通 AI 研究负责人侯纪磊介绍:在成本方面,生成式 AI 通常参数体量巨大,如果在端侧部署,能够推动成本的显著降低。而在 AI 数字助手方面,手机、驾舱、PC 等使用场景,端侧 AI 则能够很好地满足私密性、个性化的需求。"
据侯纪磊介绍,早在十几年前,高通便开始了 AI 方面的研发,其中一个重要研究方向就是高效能 AI,在包括硬件、算法和软件等层面进行了大量的研发创新。
在高效硬件方面,通过对高通移动平台中 CPU、GPU、NPU 等不同单元进行优化,最终使得AI针对不同任务,能够选择合适的计算模块运行,侯纪磊认为这是高通端侧 AI 非常显著的特点。在算法层面,高通拥有一支顶尖的深度神经网络算法团队,有很多原创性的研究成果。在软件方面,在面向深度学习的软件加速 runtime 以及 SDK/ 开发框架方面,高通对于客户以及开发者都做出了很好的支持。
" 因此,高通 AI 研究的一个非常重要的原则,就是全栈式的 AI 创新和优化。通过跨层的模型、硬件和软件创新加速 AI 应用,这种早期研发和技术发明对于引领生态系统发展至关重要,而最终将技术提供给商业团队,并通过部署过程中的收获来影响未来的研究,形成正向循环。" 侯纪磊说。
据侯纪磊介绍,高通在高效能 AI 研发中,一个重要的部分是整体模型效率研究,目的是在多个方向缩减 AI 模型,使其在硬件上高效运行。
比如在量化方面,学习在保持所需精度的同时降低比特精度;在条件计算方面,学习仅基于输入执行大模型图例模型部分组件;在神经网络架构搜索方面,学习设计更小的神经网络,能够在真实硬件上媲美或超过人工设计架构;在编译方面,学习编译 AI 模型以实现高效的硬件执行等。
" 在量化方面,高通一直在业界进行学术研究及落地层面的推动。包括 Stable Diffusion 和 ChatGPT 等最终要在端侧实现,量化一定是非常重要的手段。在高效能的推理方面,整数的点运算是非常重要的方向。在这方面,高通在积极推动相关学术研究,包括在顶级学术会议上发布一些论文的同时,也会定期放到开源的工具包 AIMET 中。通过领先的 AI 研究和快速商业化,推动行业向整数推理和高能效 AI 方向发展。" 侯纪磊说。
埃隆·马斯克:机器人主导的生产效率将远超人类
在未来,人工智能将在人类的世界中扮演重要角色,并对文明产生深远的影响。同时,我们也看到了数字计算能力的爆炸性增长,其中特别要考虑的一个指标是比例,即数字计算、机器计算能力与生物计算能力之间的比例关系。
具体而言,我们需要考虑人类能够完成多么复杂的计算任务,计算机和机器能够承担的计算任务的强度,以及计算机计算能力和人类计算能力之间的比例。随着时间的推移,这一比例不断增大,意味着机器与生物之间的计算能力差距正在进一步扩大。
因此,在不久的将来,人工智能在整体智能中的地位将逐渐下降,与机器智能相比,这将是一场根本性而深远的变革。这种变革所带来的影响目前还难以完全理解,但可以肯定的是,这将是人类历史上最重要的时期之一。
特斯拉的 Optimus 机器人目前仍处于开发阶段,属于较早期的阶段。然而,在未来,我们将会看到大量的机器人存在。因此,我们迫切需要考虑一个比例的问题:机器人与人类的比例是多少?
目前的趋势表明,在某个阶段,机器人的数量将超过人类的数量。而且,机器人的计算能力要比人类强大得多,这似乎是一个发展的趋势。
这种趋势将产生积极的影响,也会带来消极的影响。积极的影响是,我们将进入一个不再有资源短缺的时代。这将是一个充裕的时代,只要是你想要的东西,就能立刻得到。由于未来世界中机器人的大量存在,其生产效率将远远超过人类主导的生产效率,这是一个巨大的变化。因此,我们必须谨慎行事,以确保最终结果对人类有益。
我们还需要注意一个问题,就是对于深度、全面的人工智能要保持警惕,有限制的人工智能和通用人工智能(AGI)是完全不同的情况。通用人工智能很难进行明确定义,它是一种比人类在任何领域都要聪明得多的人工智能类型。现在需要一些监管者来对其进行监督,以确保这种深度的人工智能不会对人类造成威胁。
华为轮值董事长胡厚崑:人工智能的发展,关键是要“走深向实”
对于华为来说,我们下一阶段要全力推进人工智能走深向实。为了实现这个目标,我们有两个关键举措:第一,打造强有力的算力底座,支撑中国人工智能产业的发展;第二,从通用大模型到行业大模型,真正让人工智能服务好千行百业,服务好科学研究。
人工智能的发展,算力是基础。但在中国当前的情况下,算力在可获取性和成本方面,都面临着不小的挑战。未来希望通过各位同仁的努力,让算力不再成为人工智能发展的瓶颈。
生态对计算产业的持续发展来说非常关键,也往往是个瓶颈。四年以来,在全产业合作伙伴的共同努力下,已初步构建起完整的计算产业生态。
在深耕算力的同时,我们还要真正让人工智能走进千行百业,服务科学研究。我们认为:一方面,要打好基础,持续提升通用大模型的能力;另一方面,我们在此基础上,要建好行业模型,将行业专有知识、经验与大模型能力充分结合,最终为客户提供更专业精准的解决方案。
我们希望,AI for Science,能为科学家、科学工作者带来更多新思路、新方法、新工具,也为我们的产业输入新的动力。