很难相信,自从我写了上一篇关于人工智能(AI)的文章《实用人工智能》以来,已经过去了将近六年。在那篇文章中,我概述了人工智能和机器学习 (ML) 的状态以及当时流行的一些用法和工具。从那时起,人工智能世界的事情变得疯狂:每个人都在谈论像 ChatGPT 这样的工具,但大多数人真的不了解所有的术语和工具,也不了解它们最适合什么。在本文(第 1 部分,共 2 部分)中,我将尝试让您了解这个生态系统的最新情况,并尝试用“Joel”术语来解释事情。
因此,让我们从定义所有关键术语开始,并查看每个术语的一些示例。
关键术语人工智能 (AI)人工智能(AI)是机器表现出的人类智能。人工智能的例子包括面部识别、帮助台聊天机器人、智能恒温器和语音转文本。
作为开发人员,我们从一开始就将 AI 写入我们的代码中。下面是一个玩井字游戏的早期例子——代码是模拟另一个人的智力来对抗你。请注意,这段代码没有什么花哨或神奇的地方,实际上,它只是一系列 IF 语句;而且,是的,这确实符合人工智能的条件!
机器学习 (ML)机器学习 (ML) 是 AI 的一个子集,我们使用算法来解析数据,从中学习,然后决定做某事。所有机器学习都算作 AI,但并非所有 AI 都算作机器学习。例如,符号逻辑——规则引擎、专家系统和知识图谱——都可以被描述为人工智能,而它们都不是机器学习。
如果你去亚马逊买一些鞋子,也许它会建议搭配一件衬衫。亚马逊还使用图像分类等工具来决定什么是图像,以防止虚假广告。最后,谷歌和雅虎等大型电子邮件提供商使用垃圾邮件分类来决定电子邮件是否为垃圾邮件。他们做得有多好,每天都在影响着我们!
作为开发人员,当我们将机器学习放入代码中时,我们历来都是使用算法作为模型来实现的。你有没有在代码中构建过决策树?这是你实现的机器学习模型,甚至可能没有意识到。
大型语言模型 (LLM)大型语言模型 (LLM) 是一种人工智能 (AI) 算法,它使用深度学习技术和大规模数据集来理解、总结、生成和预测新内容。术语“生成式 AI”也与 LLM 密切相关,是一种生成式 AI,专门用于帮助生成基于文本的内容。
目前 LLM 的例子是 GPT-4(在 OpenAI 的 ChatGPT 后面)、Llama (Meta) 和 LaMDA (Google)。
历史开发人员构建的 LLM 示例包括:
对聊天机器人进行编码以理解基本命令并处理它们(想想早期基于文本的“冒险游戏”)一种技术 Word2vec,您可以在其中获取单词的向量表示以确定语义含义。生成式 AI生成式 AI 是能够使用预测模型生成文本、图像或其他媒体的人工智能。当今最著名的生成式人工智能可能是 Dall-E。许多人正在使用它来生成图像。此外,ChatGPT 还被用于生成文章/内容。
我们大多数人在早期从未编写过生成式 AI,但即使在 1970 年,也有很多工作在进行;一些早期的例子包括语音合成。
GPT:生成式预训练转换器最受欢迎的 ChatGPT(聊天生成预训练转换器)是由 OpenAI 开发的基于大型语言模型的聊天机器人(这里的多个竞争对手,如 Bard、Claude)。
检索增强生成 (RAG)检索增强生成 (RAG) 是一种强大的技术,它将预训练语言模型的优势与信息检索系统的优点相结合。RAG 的主要目的是增强大型语言模型 (LLM) 的能力,特别是在需要深入理解和生成上下文相关响应的任务中。
由于大多数开发人员当时没有编写 LLM 代码,因此大多数开发人员也没有实现 RAG。
RAG 的一个示例是获取一些尚未包含在标准模型中的信息,并对其进行扩充,以使模型在特定用途中更强大。一个例子包括使用我的公司手册,并使用一种称为嵌入的技术,用现有的 GPT/LLM 对其进行扩充。一旦我这样做了,我就可以向 GPT 询问有关我的公司政策的问题,它应该能够对此进行推断,即使原来的 LLM 对我的公司一无所知。
商业用途现在我们已经掌握了基本词汇,并且有一些很好的例子来说明所有这些东西是如何工作的,让我们来谈谈 2024 年,以及我们应该如何做一些事情来利用人们构建的所有伟大工具来做很棒的 AI 和 ML!
我的公司使用软件为我们的客户解决业务问题。这是我们一直在做的事情,所以我喜欢从“我们可以解决哪些业务问题”这个问题来看待人工智能和机器学习,而不是从技术方法出发。
传统上,我们使用 AI 和 ML 来解决以下问题:
获取文档并将其转换为可搜索和可用的东西:传统上,我们使用自然语言处理 (NLP) 来理解文本的含义和情感,使其可搜索,并自动处理文档以将图像转换为文本并对其进行分类和分割。其中大部分工作都围绕着获取遗留的 PDF 文档并更好地利用它们。预测销售结果:获取客户拥有的数据并构建模型,为客户生成销售预测构建更快、更不容易出错的软件:在过去几年中,我们一直在利用 GitHub Copilot 和 Amazon CodeWhisperer 等代码辅助工具来帮助开发人员更快、更高质量地编写代码。今天,我们可以使用最新和最好的工具以更高的精度和更少的工作量解决这些问题(我们稍后将讨论其中的一些)。我们还可以使用新工具更轻松地解决其他典型的业务问题。
现在比较容易解决的一些问题是:
自动化简单的客户服务交互:构建自定义聊天机器人来解决客户最常见的问题现在相当容易。通过使用 ChatGPT 类型的工具来帮助您,自动执行过去手动完成的任务,例如合并文件、过滤文件、汇总文件等。将面部识别和语音转文本/文本转语音等功能整合到我们的系统中。工具和框架直到最近,如果你想构建一个机器学习模型,你唯一的选择就是编写一些代码。大多数开发人员从以下几个选项中进行选择:
Scikit-learn:简单易学,大多数人都是从这里开始的TensorFlow:来自 Google;更强大,但很复杂(有些人在上面使用 Keras)PyTorch的:来自 Meta,比 TensorFlow 更强大、更易于使用现在,主要的云提供商都有自己的一套针对每个领域的工具:
Microsoft:Azure OpenAI (GPT)、视觉/语音/翻译、ML Studio、自动化 ML、预训练模型AWS的:Sagemaker(传统);基岩 - 多种型号选择,;Sagemaker 拥有用于自动化 ML、AmazonQ (GPT) 的 Canvas 和 Autopilot谷歌:VertexAI(双子座模型)、Bard(GPT)、TensorFlow最近,更高级别的工具也出现了,它们允许您在不编写任何代码的情况下快速构建模型:
Nyckel - 允许您上传 CSV 并转到适用于 Google 表格的 SimpleML:请参阅“企业主:控制您的数据”来自云提供商的 AutoML(AWS、Azure、GCP)(在上一页)使用 ChatGPT 为您完成 ML!(以前称为高级数据分析)总结在本文(第 1 部分)中,我们总结了有关人工智能和机器学习的所有最新术语以及其中的许多示例。我们还展示了可以使用最新工具解决的典型业务问题。最后,我们今天谈到了这个领域的流行工具。请继续关注本文的第 2 部分,我们将引导您完成使用这些工具之一解决业务问题的真实示例!
原文标题:Introduction to Modern AI 2024 Edition: Part 1
原文链接:https://dzone.com/articles/introduction-to-modern-ai-2024-edition-part-1
作者:Joel Nylund
编译:LCR