近日,北京、广东、江苏、内蒙古、江西等多地宣布,其政务服务系统接入DeepSeek系列大模型。而一些行业巨头、地方媒体也将接入DeepSeek当作新闻发布。一时间,好像接入DeepSeek成为一种时髦,不接入就有落伍之嫌。
那么,到底什么样的机构适合接入大模型?具体接入方式是什么?接入后会带来怎样的改变呢?
01
为什么要接入DeepSeek
无论是政府还是企业,接入DeepSeek,就是要做一个自身的智能体,也就是自己的分身,以此来优化流程,提升效率,减少误差。
那么说到智能体,就得提到AI发展的五个阶段。智能体是第三阶段。
有媒体报道,OpenAI于去年年中提出通用人工智能发展的五级标准,分别是:第一级:聊天机器人,具有会话语言的人工智能,即交互的能力;第二级:推理者,解决人类水平问题的人工智能,即推理的能力;第三级:代理(智能体),能够代表用户采取行动的人工智能,即调用的能力;第四级:创新者,能够帮助发明的人工智能,即发现、发明的能力;第五级:组织者,能够完成组织工作的人工智能,即组织协同的能力。
现阶段为智能体阶段,也可以称作分身,能代表政府和企业在不同场景之下回应用户需求,或自动进行分析推理等工作。
由此可见,很多单位对外宣称接入了DeepSeek,就是要打造自己的智能体,从而实现质效双提升。
02
怎么接入DeepSeek
从技术角度来讲,所谓“接入”,表现在三个方面,即技术集成、数据交互和功能调用。
技术集成,是将DeepSeek的AI能力(如大模型、数据分析工具等)嵌入到单位的现有系统中,通过API(应用程序接口)、SDK(软件开发工具包)或云服务等方式实现。
数据交互,是单位将自身数据(如文档、数据库等)输入DeepSeek的系统中,由AI进行处理(如分析、生成内容、预测等),再将结果返回给单位。
功能调用,是单位可以通过接口直接使用DeepSeek的特定功能,例如智能客服、文档自动摘要、数据建模等。
具体到操作层面,有三种接入方式,分别是云端调用、私有化部署和混合模式。
云端调用:即通过互联网直接使用DeepSeek的云服务,适合需要快速部署、轻量级使用的场景。
私有化部署:是将DeepSeek的模型部署到单位本地服务器,适合数据敏感性高、需要完全控制权的场景(如金融机构、涉密单位)。
混合模式:部分功能云端调用,部分功能本地化处理,平衡效率与安全性。
这里插一句,为什么原来很少听到某某机构接入ChatGPT呢?一方面因为DeepSeek是开源的,而ChatGPT的API接口是要收费的,字符(包括标点符号和空格)输出也是要收费的;另一方面,ChatGPT本地化部署需要消耗大量的计算资源和内存,而DeepSeek则根据用户需要,设计了多个可接入版本,让本地化部署成为可能。
03
没有知识库的接入就是伪命题
很多单位貌似宣称接入了DeepSeek,但如果没有自身知识库的加持,那这个“接入”也就是个伪命题。你想啊,本地接入全网检索,和直接使用DeepSeek有啥区别?
这就涉及到了自身知识库的建立,它是数据的重要组成部分。
我们都知道,人工智能有三个要素,分别是算法、算力和数据。打个比方,算法就是菜谱,算力就是炊具,数据就是食材。
DeepSeek的开源,就意味着一个五星级酒店的大厨把菜谱公开了,同时还非常贴心地告诉你,做不同的菜要匹配不同的炊具,比如671B的满血版对硬件的要求最高,而8B的版本,可能一台高配置的笔记本就能运行。
而接下来就是数据了,呃不对,是食材。有的食材满大街都是,而有的则比较稀缺,或不愿意让别人看到。所以我希望关起门来,翻着菜谱,自己做,做好了可以大家尝。
那么这些私有食材,就是自己的知识库。比如我创建了自己的智能体“媒体人胡二刀”,把近几年写的1000多篇文章分门别类装到知识库里。如果前台有人提问的时候,我的智能体就会自动调用并分析这个知识库中的文章来生成答案。相当于这个智能体深度学习了我的思想,模仿了我的口吻,即便让我真人来答,也不过如此。
政府机关的知识库,往往包括高质量的政策文件、专业术语以及内部流程等,可以进行专业领域的深度适配。
同样,医院的知识库,就可以包括历年来的患者病历、医生处方、成功案例和医疗事故等,通过前台数据对比,自动生成治疗建议,供医生参考。
律师事务所的知识库,就可以包括历年审判司法文书、庭审记录、辩护词等,生成司法方面的建议。
“接入DeepSeek”本质是单位通过技术手段调用其AI能力,实现业务流程的智能化升级。这既是AI赋能千行百业,也反映了各单位在数字化转型中的积极探索。但具体实现方式需结合自身需求、数据敏感度、合规要求等因素综合考量,切不可为了接入而接入。
部分图文源自中国之声、环球时报热点、澎湃新闻