大模型,何时“私人订制”?

因为科技是阴天 2024-03-07 03:31:41

与其去卷大模型,不如直接去卷大模型的落地。当“公有云+大模型”不能满足所有应用时,进而,当“私域大模型”概念被提出时,也就意味着有些公司要直奔主题而去,想要成为最懂大模型落地的科技企业。

大模型并非越大越好

如果从ChatGPT算起,大模型已狂奔近一年。期间就应用落地等问题,咨询过国内头部数字化服务商。答曰:两个月之内,公司已经举办了三十余场大模型技术交流会议,且四类声音较为集中:

用户希望看到真实的效果,毕竟在“百模大战”中需要有人去甄别,哪些是“野模”,哪些是“超模”;用户也希望选择适合的应用场景切入,毕竟直接切入生产场景总需反复验证;用户还希望安全得到保障,毕竟坚守商业机密和法律法规是大模型落地的底线;用户更希望不被“黑盒子”绑定,毕竟在此方面吃过的亏太多。

除此之外,就是合理控制大模型的落地成本。而且越来越多的科技企业也意识这一点——大模型并非越“大”越好。这就像大排量的汽车,虽然如可发出西装暴徒一样的嘶吼,但并不是所有人都买得起、用得起。

梳理公开资料,也映证了上述判断:GPT-3的参数量为1750亿,背后的算力消耗达到3640PFlops/s-Days;Google的PaLm参数量超过5400亿,算力消耗更是为惊人的29600PFlops/s-Days。

以此对照中国现已投入运营的城市级智算中心,一期项目的算力规模大多在100PFlops~300PFlops之间。国内最大的智算中心,算力规模也不过是12EFlops。显然,传统企业无力承担如此高额的技术投入。

也应该是看到了这方面的制约,此之后的大模型,对数据进行了持续优化,更考虑到应用落地问题。例如,开源大模型LLaMA2的参数范围从是70亿到700亿不等;清华智谱的开源大模型ChatGLM3,参数量只有60亿;百川智能的Baichuan大模型,也包括60亿和130亿两个不同的参数量版本。

而且即使是闭源的大模型,也会在通用大模型的基础上,推出100亿、380亿、710亿、1000亿等不同参数的“企业版”。这就如上述提到的国内头部数字化服务商给出的观点:60亿到130亿参数量版本的大模型,比较适合企业应用落地。因为企业在预算范围之内,采购数台AI服务器,就能先让大模型“跑”起来。

既要、又要、还要、更要

回归主题:大模型,何时“私人订制”?科技企业在合理控制成本的同时,如何去卷大模型的落地?此问题的答案是个典型的“既要、又要、还要、更要”的句式:既要懂产品技术,又要懂应用场景,还要懂平台服务,甚至更要懂些企业的管理思路。

#首先从应用角度分析

大模型是企业数字化转型的一部分,这其中隐含着一句潜台词——今天的企业已经或多或少地经过数字化的洗礼,重构OA、客户服务等“边缘应用”显然不能解渴,“大模型”重构核心生产系统才是用户所期待。

#再从技术角度分析

经过此前5~8年的实践,行业数字化转型已形成明晰的路径,即以“设备IP化-平台云化-资产数据化”为主线,以“场景智能化”为方向贯穿始终。期间,企业虽多已建设了数据平台,但也只是解决了数据使用问题,没有解决知识沉淀问题,下一阶段必将延续“数据化-知识化-自主化”的方向发展。

大模型的出现加快了这一进程,它使AI第一次无比接近通用人工智能,也成为知识沉淀的最佳载体。当然,大模型不可避免地继承了企业数字化进程中的一些遗留问题。例如,数据治理复杂、AI开发技术门槛高、训练算力利用率低、行业AI应用不成熟等。

换句话说,大模型在企业市场的“私人订制”,需要全栈能力的服务商,即贯穿“IP化-云化-数据化-知识化”全部能力,拥有算力、存储力、运力、云平台、数据平台、算力调度平台、使能平台、工具助手等全部能力。

更进一步,用户更希望大模型提供方,兼具“技术+服务”、“平台+应用”等多方面能力,而创业型企业可能就真不适合推助大模型落地,短时间内其难以集齐全栈的技术能力,也缺乏充足的服务能力,场景理解能力也在逐步摸索之中,其对企业现有条条框框的管理制度,更是难以厘清。

直奔主题的“私域大模型”

应该说,类似新华三这样的“老牌”科技企业,在大模型落地领域才更有发言权。新华三在业内首提“私域大模型”概念,而且其关注的“私域”,既包括行业大模型,也包括企业大模型。

当然,这里可先探讨一个观点。此前业内存在不同声音:行业大模型是个伪命题——下有掌握基础能力的通用大模型,上有可满足个性需求的企业大模型,行业大模型的市场空间有限,应用空间也被积压。

其实不然,从现在的市场热度看,恰是行业大模型最为被追捧。行业头部企业已在积极选型和测试通用大模型:一方面,他们为了企业自用,率先重构应用场景,率先释放生产力;另一方面,他们也希望进行能力外溢,覆盖整个行业。

这就像公有云和私有云还将长期并存,“私域大模型”概念也已经得到业内认可。而且“私域大模型”概念的提出,也就意味着类似新华三这样的企业想直奔主题而去,希望成为最懂大模型落地的科技企业。

外练“筋骨皮”,内练“一口气”

其实,新华三一直是家很务实、很接地气的企业,其针对“私域大模型”提出了“五星原则”,即合适的切入场景、合理的模型大小、高效的数据治理、合规的内容安全、合用的落地工具。这也都是现阶段,用户最关心的问题。

同时,新华三也首先看到,推助大模型落地,就是既要成为“练家子”,也要去当“孙悟空”。其推出由私域大模型百业灵犀(LinSeer)、智算解决方案,以及模型专家咨询服务组成的AIGC解决方案,就很具备这两方面特点。

“智算解决方案”的技术思路,很像中国功夫——讲究“外练筋骨皮,内练一口气”。充足算力的保障和高效智能的算力调度,是大模型修炼的“筋骨皮”;海量的优质数据供给与使用,则是大模型修炼的“一口气”。

在此方面,外练“筋骨皮”一直都是新华三的看家本领。业界首发800G CPO硅光数据中心交换机,让新华三在大模型领域棋先一招。同期发布的傲飞算力平台则实现了算力调度的“最优解”,让算力可以最大化的按需调度。其长期技术投入的智能无损网络,更可高效支持AI集群训练。

与此同步,新华三也没有放松内练“一口气”。任何大模型的训练,本质上都是对数据的加工与应用,通过对绿洲数据平台持续不断的技术投入,新华三不断加强了数据标记、简化数据治理流程、数据安全、湖仓一体、加速数据流通等方面的能力,并形成数据平台独有的“四专”基因——行业专注、区域专属、数据专有、价值专享。

或也可如此比喻,智算解决方案就像以加工数据为主要产品的智能工厂。其底层是云计算的各项能力。在此之上,通过绿洲平台实现高质量的数据要素供给,再通过傲飞算力平台实现多元算力资源的智能调度。

“金箍棒”和“紧箍咒”

当然,如果“私域大模型”是可七十二般变化的,可以适应不同规模的企业,服务不同应用场景的“孙悟空”,其手里就还要有披荆斩棘的“金箍棒”,头上也要有可以守住底线的“紧箍咒”。

私域大模型百业灵犀(LinSeer)就像“金箍棒”,其中核心组件大模型使能平台,包含:提示词工程、知识库、推理服务、插件服务和评估优化五大核心功能模块,实现8项关键特性。

同时,个人用户可以对大模型的“幻觉”一笑了之,企业用户可绝不能接受大模型存在“幻觉”问题,这将直接影响大模型落地企业应用。新华三也意识到这一点——大模型的落地,既需要产品,也需要服务,其可提供私域大模型的推理、微调、训练,灵活的服务组合,满足客户不同的大模型落地需求。

此外,无所不能的大模型,更需设好安全的“紧箍咒”。新华三百业灵犀(LinSeer)已形成以绿洲数据平台为核心的数据域、以大模型使能平台(LinSeer Hub)为基础的大模型域、以数据安全审查为重点的安全隔离域、以AI助手和AI服务组成的用户域的“四域支撑”。

这就可为行业用户提供端到端私域部署服务,内置安全限制提示词和出入内容过滤拦截功能,可对所有场景下大模型生成内容进行安全性限制,为用户信息和数据安全保驾护航。

自己的“私人订制”

当然,说的再多也不如实践。新华三给自己“私人订制”的大模型,已逐步开始走进其自身核心生产系统,支撑新华三全面数字化改革。而更进一步,新华三百业灵犀(LinSeer)还将逐步落地数字政府、数字教育、数字媒体、数字医疗、数字企业、数字工厂、数字矿山、数字出行等诸多领域,瞄准垂直行业和专属地域的客户,提供更多“量身订制”的AIGC解决方案。

0 阅读:0

因为科技是阴天

简介:感谢大家的关注