基于RAG技术创新构建智能对话机器人,8小时快速掌握,并获得证书

科技大人说 2024-08-07 13:38:49
什么是RAG

在人工智能领域,“RAG”是“Retrieval-Augmented Generation”的缩写,中文翻译为“检索增强生成”。它是一种结合了检索模型和生成模型的技术,通过从私有或专有数据源检索信息来辅助文本生成。

RAG 系统的核心是使用用户的查询从外部知识源检索相关上下文,然后将这些额外的上下文与用户查询一起放入提示模板中,最后输入到大型语言模型(LLM)中进行生成。这种方法允许模型在生成响应之前引用训练数据来源之外的权威知识库,从而生成更准确、更符合上下文的答案,并减少错误信息的产生。

完整的 RAG 应用流程主要包含两个阶段:

数据准备阶段:数据提取:将多种格式的数据进行处理为同一范式;分块(chunking):将初始文档分割成一定大小的块,尽量不失去语义含义;向量化(embedding):将文本数据转化为向量矩阵,常用的 embedding 模型有 moka-ai/m3e-base、ganymedenil/text2vec-large-chinese 等;数据入库:数据向量化后构建索引,并写入向量数据库,适用于 RAG 场景的向量数据库包括 facebookresearch/faiss(本地)、chroma、elasticsearch、milvus 等。检索生成阶段:问题向量化;根据问题查询匹配数据;获取索引数据;将数据注入 prompt;LLM 生成答案。

RAG 技术主要用于解决大语言模型存在的一些问题,如幻觉问题(提供虚假信息)、时效性问题(对最新事件不知情)和数据安全问题等。它能够有效避免幻觉问题、经济高效地处理知识并具有开箱即用的特点,同时可以更好地保护企业数据安全。

NVIDIA课程和证书

NVIDIA免费课程:Building RAG Agents with LLMs

通过学习课程,可以免费获得NVIDIA证书,如下图所示:

注册账号

打开课程网址:

https://learn.nvidia.com/courses/course-detail?course_id=course-v1:DLI+S-FX-15+V1

点击“Learn”

进入这个页面,输入你的邮箱

点击继续,进入下面的页面:

填好所有信息,点击“创建账户”。弹出如下提示,验证电子邮件。

1小时快速取得证书的方法

以下内容是通过课程认证的核心内容(如果为了拿证书,只看下面的就可以了)。建议大家从前到后,把每个课程的视频都看一遍,并完成每节课的课后练习。

开始认证测试

直接点击“Retrieval-Augmented Generation”,开始这节课程

点击“start”,启动项目,

等待启动虚拟环境

等待几分钟后,点击“Launch”,

点击后,会弹出一个新的窗口jupyter页签。

接着打开07、08、35几个文档

打开07

在这个网址里找一篇一个月内的文章:

https://arxiv.org/

找到这个数字:

2407.03319

粘贴到下图中的位置

ArxivLoader(query="2407.03319").load(),

运行代码

刚才填写的文章出现在这里了

生成一个文件:docstore_index

打开35

打开08

并运行,运行结束后,点击这里

弹出一个新窗口,等待加载结束,如下图:

点击这里

如果出现404提示,请刷新页面,重试。

多试几次,并等待几分钟后,出现如下提示。

回到之前的页面,点击“assess task,弹出如下提示,表示通过。

复制这个网址,在新页签中打开

网址:

https://learn.nvidia.com/my-learning

这里出现证书,点击

课程认证完成。

总结

证书的核心目的在于促使我们学习知识,因而建议用心研习每一节课程,深入掌握 Langchain RAG 原理,完成全部练习,顺道获取证书。

0 阅读:0

科技大人说

简介:感谢大家的关注