大模型，何时“私人订制”？ - 科技资讯(世良情感网)

与其去卷大模型，不如直接去卷大模型的落地。当“公有云+大模型”不能满足所有应用时，进而，当“私域大模型”概念被提出时，也就意味着有些公司要直奔主题而去，想要成为最懂大模型落地的科技企业。

大模型并非越大越好

如果从ChatGPT算起，大模型已狂奔近一年。期间就应用落地等问题，咨询过国内头部数字化服务商。答曰：两个月之内，公司已经举办了三十余场大模型技术交流会议，且四类声音较为集中：

用户希望看到真实的效果，毕竟在“百模大战”中需要有人去甄别，哪些是“野模”，哪些是“超模”；用户也希望选择适合的应用场景切入，毕竟直接切入生产场景总需反复验证；用户还希望安全得到保障，毕竟坚守商业机密和法律法规是大模型落地的底线；用户更希望不被“黑盒子”绑定，毕竟在此方面吃过的亏太多。

除此之外，就是合理控制大模型的落地成本。而且越来越多的科技企业也意识这一点——大模型并非越“大”越好。这就像大排量的汽车，虽然如可发出西装暴徒一样的嘶吼，但并不是所有人都买得起、用得起。

梳理公开资料，也映证了上述判断：GPT-3的参数量为1750亿，背后的算力消耗达到3640PFlops/s-Days；Google的PaLm参数量超过5400亿，算力消耗更是为惊人的29600PFlops/s-Days。

以此对照中国现已投入运营的城市级智算中心，一期项目的算力规模大多在100PFlops~300PFlops之间。国内最大的智算中心，算力规模也不过是12EFlops。显然，传统企业无力承担如此高额的技术投入。

也应该是看到了这方面的制约，此之后的大模型，对数据进行了持续优化，更考虑到应用落地问题。例如，开源大模型LLaMA2的参数范围从是70亿到700亿不等；清华智谱的开源大模型ChatGLM3，参数量只有60亿；百川智能的Baichuan大模型，也包括60亿和130亿两个不同的参数量版本。

而且即使是闭源的大模型，也会在通用大模型的基础上，推出100亿、380亿、710亿、1000亿等不同参数的“企业版”。这就如上述提到的国内头部数字化服务商给出的观点：60亿到130亿参数量版本的大模型，比较适合企业应用落地。因为企业在预算范围之内，采购数台AI服务器，就能先让大模型“跑”起来。

既要、又要、还要、更要

回归主题：大模型，何时“私人订制”？科技企业在合理控制成本的同时，如何去卷大模型的落地？此问题的答案是个典型的“既要、又要、还要、更要”的句式：既要懂产品技术，又要懂应用场景，还要懂平台服务，甚至更要懂些企业的管理思路。

#首先从应用角度分析

大模型是企业数字化转型的一部分，这其中隐含着一句潜台词——今天的企业已经或多或少地经过数字化的洗礼，重构OA、客户服务等“边缘应用”显然不能解渴，“大模型”重构核心生产系统才是用户所期待。

#再从技术角度分析

经过此前5~8年的实践，行业数字化转型已形成明晰的路径，即以“设备IP化-平台云化-资产数据化”为主线，以“场景智能化”为方向贯穿始终。期间，企业虽多已建设了数据平台，但也只是解决了数据使用问题，没有解决知识沉淀问题，下一阶段必将延续“数据化-知识化-自主化”的方向发展。

大模型的出现加快了这一进程，它使AI第一次无比接近通用人工智能，也成为知识沉淀的最佳载体。当然，大模型不可避免地继承了企业数字化进程中的一些遗留问题。例如，数据治理复杂、AI开发技术门槛高、训练算力利用率低、行业AI应用不成熟等。

换句话说，大模型在企业市场的“私人订制”，需要全栈能力的服务商，即贯穿“IP化-云化-数据化-知识化”全部能力，拥有算力、存储力、运力、云平台、数据平台、算力调度平台、使能平台、工具助手等全部能力。

更进一步，用户更希望大模型提供方，兼具“技术+服务”、“平台+应用”等多方面能力，而创业型企业可能就真不适合推助大模型落地，短时间内其难以集齐全栈的技术能力，也缺乏充足的服务能力，场景理解能力也在逐步摸索之中，其对企业现有条条框框的管理制度，更是难以厘清。

直奔主题的“私域大模型”

应该说，类似新华三这样的“老牌”科技企业，在大模型落地领域才更有发言权。新华三在业内首提“私域大模型”概念，而且其关注的“私域”，既包括行业大模型，也包括企业大模型。

当然，这里可先探讨一个观点。此前业内存在不同声音：行业大模型是个伪命题——下有掌握基础能力的通用大模型，上有可满足个性需求的企业大模型，行业大模型的市场空间有限，应用空间也被积压。

其实不然，从现在的市场热度看，恰是行业大模型最为被追捧。行业头部企业已在积极选型和测试通用大模型：一方面，他们为了企业自用，率先重构应用场景，率先释放生产力；另一方面，他们也希望进行能力外溢，覆盖整个行业。

这就像公有云和私有云还将长期并存，“私域大模型”概念也已经得到业内认可。而且“私域大模型”概念的提出，也就意味着类似新华三这样的企业想直奔主题而去，希望成为最懂大模型落地的科技企业。

外练“筋骨皮”，内练“一口气”

其实，新华三一直是家很务实、很接地气的企业，其针对“私域大模型”提出了“五星原则”，即合适的切入场景、合理的模型大小、高效的数据治理、合规的内容安全、合用的落地工具。这也都是现阶段，用户最关心的问题。

同时，新华三也首先看到，推助大模型落地，就是既要成为“练家子”，也要去当“孙悟空”。其推出由私域大模型百业灵犀（LinSeer）、智算解决方案，以及模型专家咨询服务组成的AIGC解决方案，就很具备这两方面特点。

“智算解决方案”的技术思路，很像中国功夫——讲究“外练筋骨皮，内练一口气”。充足算力的保障和高效智能的算力调度，是大模型修炼的“筋骨皮”；海量的优质数据供给与使用，则是大模型修炼的“一口气”。

在此方面，外练“筋骨皮”一直都是新华三的看家本领。业界首发800G CPO硅光数据中心交换机，让新华三在大模型领域棋先一招。同期发布的傲飞算力平台则实现了算力调度的“最优解”，让算力可以最大化的按需调度。其长期技术投入的智能无损网络，更可高效支持AI集群训练。

与此同步，新华三也没有放松内练“一口气”。任何大模型的训练，本质上都是对数据的加工与应用，通过对绿洲数据平台持续不断的技术投入，新华三不断加强了数据标记、简化数据治理流程、数据安全、湖仓一体、加速数据流通等方面的能力，并形成数据平台独有的“四专”基因——行业专注、区域专属、数据专有、价值专享。

或也可如此比喻，智算解决方案就像以加工数据为主要产品的智能工厂。其底层是云计算的各项能力。在此之上，通过绿洲平台实现高质量的数据要素供给，再通过傲飞算力平台实现多元算力资源的智能调度。

“金箍棒”和“紧箍咒”

当然，如果“私域大模型”是可七十二般变化的，可以适应不同规模的企业，服务不同应用场景的“孙悟空”，其手里就还要有披荆斩棘的“金箍棒”，头上也要有可以守住底线的“紧箍咒”。

私域大模型百业灵犀（LinSeer）就像“金箍棒”，其中核心组件大模型使能平台，包含：提示词工程、知识库、推理服务、插件服务和评估优化五大核心功能模块，实现8项关键特性。

同时，个人用户可以对大模型的“幻觉”一笑了之，企业用户可绝不能接受大模型存在“幻觉”问题，这将直接影响大模型落地企业应用。新华三也意识到这一点——大模型的落地，既需要产品，也需要服务，其可提供私域大模型的推理、微调、训练，灵活的服务组合，满足客户不同的大模型落地需求。

此外，无所不能的大模型，更需设好安全的“紧箍咒”。新华三百业灵犀（LinSeer）已形成以绿洲数据平台为核心的数据域、以大模型使能平台（LinSeer Hub）为基础的大模型域、以数据安全审查为重点的安全隔离域、以AI助手和AI服务组成的用户域的“四域支撑”。

这就可为行业用户提供端到端私域部署服务，内置安全限制提示词和出入内容过滤拦截功能，可对所有场景下大模型生成内容进行安全性限制，为用户信息和数据安全保驾护航。

自己的“私人订制”

当然，说的再多也不如实践。新华三给自己“私人订制”的大模型，已逐步开始走进其自身核心生产系统，支撑新华三全面数字化改革。而更进一步，新华三百业灵犀（LinSeer）还将逐步落地数字政府、数字教育、数字媒体、数字医疗、数字企业、数字工厂、数字矿山、数字出行等诸多领域，瞄准垂直行业和专属地域的客户，提供更多“量身订制”的AIGC解决方案。