盘古大模型只做一件事

TechForWhat 2023-09-14 20:05:42

作者 | 葛覃

查理·芒格有一句经典论断,“手拿铁锤的人,看什么都像钉子”。不论是经济学领域,还是新技术领域,人们总是会陷入一种惯性思维,试图用一种方法来解决所有问题。

听起来和大模型如今的处境何其相似。AI技术从多分支发展,进入大模型时代,各种大模型层出不穷,起初,业界对大模型的认知就是一个大模型可以解决所有问题,模型的参数量越大,智能涌现越多,我们对它的期待也就越高。

当前全球已发布数百个大模型,大模型却并没有起到“技术银弹”一般的作用,大模型的局限逐渐显露。华为云在7月发布了盘古大模型3.0,其推进人工智能“走深向实”的路径,从通用大模型到行业大模型的研究创新,演化成为行业的主流发展方向。

大模型到来之后,我们仿佛有了一把无所不能的“锤子”,满目都在寻找新的“钉子”,这本并无可指摘,但关键是,不要寄希望于大模型暴力改变一切,而要让大模型找到适合生长的应用场景土壤。

从这个角度而言,华为云盘古大模型只做一件事,就是沉到千行百业之中去解决真正的问题。

找到正确的定位

大模型和我们所拥有的大部分技术都不太一样。

绝大部分技术都是需求牵引,在既定的任务下,为了实现更好的效果或更低的成本,这些技术有明确的使用场景,是原有技术体系下的渐进式创新。

大模型更像是一次技术推动的破坏性创新,在ChatGPT之前,少有人知道大模型能做什么,人工智能领域的专家在实验室训练大模型,做人工智能的理论验证和技术创新,我们并不十分准确地知道,大模型将要被用在何处。

这不禁让人想起,20世纪60-70年代,科学家们曾有过一场关于技术推动和市场拉动的大辩论,他们把两种技术在创新中的作用对立起来。

技术推动型新兴技术,是通过重大原始性技术创新形成的,在产生之初并没有明确的应用领域,往往会有一系列的“辅助性”新技术的出现,新兴技术才最终获得爆发性的市场应用。

市场拉动型新兴技术,一般是以满足消费者需求为目的的应用导向型技术创新得到的,有明确应用领域和潜在市场,随着性能/价格比的不断改进,最终取代原有市场。

大模型显然接近于前者,类似的技术创新如公元前的轮子和铁,19世纪的铁路和电力,以及20世纪的汽车、电脑、互联网。华为早有预判,并且更早付诸实践。

任何技术只有准确的定位,才会充分发挥其价值。给人工智能技术进行合理的定位,是我们理解和应用此技术的基础。

“盘古大模型技术一定要和千行百业结合,哪里有难题,华为就把科学家、数学家、工程师们送下去,盘古大模型要和行业的难点、堵点结合,这是我认为华为在大模型上最重要的竞争优势,我们愿意沉到千行百业里头。”华为云CEO张平安此前表示。

现代创新理论折中了技术和市场的作用,华为云盘古大模型也两条路线并进,为原始技术寻找规模市场。

AI与场景,双向赋能

AI与生物医药的结合,是一个典型案例,在近日举办的AI+生物医药创新发展高峰论坛暨华为开发者大赛深圳赛区颁奖典礼上,深圳理工大学计算机科学与控制工程院院长、中国科学院深圳先进技术研究院首席科学家潘毅表示,AI与生物医药呈现双向赋能的态势。

(深圳理工大学计算机科学与控制工程院院长、中国科学院深圳先进技术研究院首席科学家潘毅)

具体来看,人工智能逐渐应用于药物发现的靶点挖掘、虚拟筛选、化合物设计与合成、ADME-T性质预测和理化性质预测等各个方面,AI与生物医药结合将为临床新药试验带来巨大的潜在应用空间。

反过来,生物医药也在推动AI的发展,以AI的可解释性为例,AI不仅要能够预测氨基酸序列结构,还要解释什么序列引起了结构的变化,完成AI的可解释性,潘毅2006年的研究提供了参考,帮助AI科学家厘清了其中的关系。

盘古大模型找到了合适的切入口,所以当大部分大模型还局限在写诗、作画时,盘古大模型已在金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。以药物研发为例,华为云基于盘古药物分子大模型,融合科学计算,构建了盘古辅助制药服务。

盘古辅助制药服务可用于靶点发现、苗头化合物发现和先导化合物优化,助力企业药物研发效率提升60%+。同时基于云原生的软硬件一体化加速,大大提升虚拟筛选和分子动力学模拟计算效率。将新药研发从“马拉松”迈向“加速跑”。

不止生物医药,以大模型为代表的AI技术,与垂直行业的众多场景,都是双向赋能的关系。

在本次大会上,深圳兔展智能科技有限公司、深圳夸夸菁领科技有限公司、深圳中比生物科技有限公司、深圳市祥根生物有限公司、深圳市倍轻松科技股份有限公司、深圳湾宝龙生物创新投资发展有限公司6家深圳市企业与华为云签订盘古大模型联合创新合作协议。

依据合作协议,双方将在大数据、人工智能、云计算领域内就行业数字化创新进行合作,以共同推动大模型、企业智能化业务发展。盘古大模型蔓延到呼唤它的众多行业中。

揳准那颗钉子

是否以行业用户的视角和思维看待,是否以人工智能的理念和技术解决现在和未来的问题,是大模型揳准产业钉子问题的关键,谁能最快将问题收敛并解决,谁就能在这一次技术浪潮中占尽先机。

从技术驱动的角度,盘古大模型 3.0 包括「5+N+X」三层架构,三层分别指 L0 层的 5 个基础大模型、L1 层的 N 个行业通用大模型、以及 L2 层可以让用户自主训练的更多细化场景模型,满足客户数据隐私安全的同时降低应用大模型的技术门槛。

盘古大模型3.0采用完全的分层解耦设计,企业用户可以基于自己的业务需要选择适合的大模型开发、升级或精调,从而适配千行百业多变的需求。

从市场需求的角度,盘古大模型聚焦价值场景,深耕政务、制造、气象、制药、金融、煤矿、铁路等行业。

在政务领域,华为云携手深圳市福田区政务服务数据管理局,联合推进盘古政务大模型创新验证和应用,对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识。

基于盘古政务大模型的福田政务智慧助手“小福”,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言。

在制造行业,企业存在大量的决策优化问题,比如生产排程,运力规划等等,传统的求解过程中需要大量的业务专家,数学专家,编程专家,求解门槛很高。

过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划。

在气象行业,预测天气往往采用数值预报法,但随着算力增长的趋缓和物理模型的逐渐复杂化,传统数值预报的瓶颈日益突出。

盘古气象大模型速度相比传统数值预报提速1万倍以上,能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,应用于多个气象研究细分场景。

水面之上的大模型,比拼参数,炫技作诗,但这都不是大模型揳准产业钉子问题的要害,水面之下的大模型,要做客户运营、产品研发、软件工程、生产供应、市场营销等等,盘古大模型虽然只做一件事,将华为的所有全盘托出。

The End

0 阅读:26

TechForWhat

简介:数字时代,技术当立。关注行业数字化转型实践与案例。