GiteeAI联手DB-GPT,加速数据智能应用开发落地

开源其实不简单 2025-01-15 20:20:50

随着不断地发展,大语言模型的能力在自然语言处理、多轮对话和意图识别等方面的语言理解与生成能力越来越强大。然而,在复杂交互任务中,模型有时会生成与用户需求不匹配的答案或凭空捏造事实(即幻觉问题),这直接影响了实际应用的准确性和可靠性。因此,提升模型的任务完成质量、减少幻觉现象,成为开发者持续关注的重点。

为此,AI 原生数据应用开发框架 DB-GPT 应运而生,旨在让围绕数据库的大模型应用构建更简单,更方便。而 Gitee AI 也在近期与 DB-GPT 正式达成合作,在 DB-GPT 平台中开发者能够更便捷地使用 Gitee AI 提供的丰富模型资源,加速从模型选择到应用落地的开发流程。

作为一款上线时间不足两年的开源「新秀」,AI 原生数据应用开发框架 DB-GPT 在正式开源后快速成长,在 GitHub 上收获了超过 1.4 万颗 Star,并拥有了超过 120 名社区贡献者。

DB-GPT 通过开发多模型管理(SMMF)、Text2SQL 效果优化、RAG 框架以及优化、Multi-Agents 框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

DB-GPT 拥有如下核心能力:

RAG(检索增强生成,Retrieval Augmented Generation) ,RAG 是当下落地实践最多,也是最迫切的领域,DB-GPT 目前已经实现了一套基于 RAG 的框架,用户可以基于 DB-GPT 的 RAG 能力构建知识类应用。GBI:生成式 BI 是 DB-GPT项 目的核心能力之一,为构建企业报表分析、业务洞察提供基础的数智化技术保障。微调框架:模型微调是任何一个企业在垂直、细分领域落地不可或缺的能力,DB-GPT 提供了完整的微调框架,实现与 DB-GPT 项目的无缝打通,在最近的微调中,基于 spider 的准确率已经做到了 82.5%数据驱动的 Multi-Agents 框架:DB-GPT 提供了数据驱动的自进化 Multi-Agents 框架,目标是可以持续基于数据做决策与执行。数据工厂:数据工厂主要是在大模型时代,做可信知识、数据的清洗加工。数据源:对接各类数据源,实现生产业务数据无缝对接到 DB-GPT 核心能力。

在 DB-GPT 中调用 Gitee AI

仅需简单几步,开发者就可以轻松调用 Gitee AI 的 Serverless API 创建应用。

获取 API Key

注册 Gitee AI 后进入个人工作台,创建新的 API Key,点击密钥进行复制,以备后续使用。

部署 DB-GPT克隆DB-GPT源码git clone https://github.com/eosphoros-ai/DB-GPT.git创建虚拟环境并安装依赖# cd 到 DB-GPT 源码根目录cd DB-GPT# DB-GPT 要求python >= 3.10conda create -n dbgpt_env python=3.10conda activate dbgpt_env# 这里选择代理模型类依赖安装pip install -e ".[proxy]"配置基础的环境变量# 复制模板 env 文件为 .envcp .env.template .env修改环境变量文件.env,配置 Gitee 模型# .envLLM_MODEL=gitee_proxyllmGITEE_MODEL_VERSION=Qwen2.5-72B-InstructGITEE_API_BASE=https://ai.gitee.com/v1GITEE_API_KEY={your-gitee-api-key}# 配置使用 Gitee 的 Embedding 模型EMBEDDING_MODEL=proxy_http_openapiPROXY_HTTP_OPENAPI_PROXY_SERVER_URL=https://ai.gitee.com/v1/embeddings# 记得填写您在步骤2中获取的 API KeyPROXY_HTTP_OPENAPI_PROXY_API_KEY={your-gitee-api-key}# 配置具体的 Embedding 模型名称PROXY_HTTP_OPENAPI_PROXY_BACKEND=bge-large-zh-v1.5启动 DB-GPT 服务dbgpt start webserver --port 5670

在浏览器打开地址http://127.0.0.1:5670/即可访问部署好的 DB-GPT。

在 DB-GPT 中调用 Gitee AI调用 Gitee AI 的 Servelrss APIimport asynciofrom dbgpt.core import ModelRequestfrom dbgpt.model.proxy import GiteeLLMClientclient = GiteeLLMClient( model_alias="Qwen2.5-72B-Instruct")print( asyncio.run( client.generate( ModelRequest._build("Qwen2.5-72B-Instruct", "Hi!") ) ))使用 Gitee AI 的 Embedding 模型import osfrom dbgpt.rag.embedding import OpenAPIEmbeddingsopenai_embeddings = OpenAPIEmbeddings( api_url="https://ai.gitee.com/v1/embeddings", api_key=os.getenv("GITEE_API_KEY"), model_name="bge-large-zh-v1.5",)texts = ["Hello, world!", "How are you?"]res = openai_embeddings.embed_documents(texts)print(res)

获取 API、部署、调用,仅需简单三步,开发者就可以使用本土算力及本土平台,以更低的成本进行数据智能应用的开发。

Gitee AI 与 DB-GPT 在未来也将继续深入合作,挖掘 AI 创新应用的更多潜能,访问 DB-GPT 开源仓库(https://github.com/eosphoros-ai/DB-GPT),及 Gitee AI (https://ai.gitee.com/serverless-api)了解更多详情。

Serverless API 目前已包含文本生成、视觉模型、图像生成与处理、自动语音识别、语音合成、特征抽取、代码生成九大类共 43 款各领域的顶尖开源模型。同时,Gitee AI 也上线了模型资源包,通过极低的价格即可尽享众多主流模型。

0 阅读:0
开源其实不简单

开源其实不简单

感谢大家的关注