分类法(Taxonomies)和人工智能聊天机器人

新浪财经 2024-09-09 18:00:24

TaxonomiesandAIChatbots

分类法、人工智能和聊天机器人:将人们与信息联系起来

人工智能聊天机器人和分类法之间存在天然的关系,但它们如何协同工作?更重要的是,分类法/本体论如何支持最佳人工智能实践?

分类法和本体论与人工智能(AI)技术相互作用、支持和驱动。从根本上讲,人工智能聊天机器人的目的是将人与他们所需的信息联系起来。从根本上讲,这正是分类法/本体论的用途。

第一个重要提示:这篇博文并未探讨聊天机器人的任何优点或陷阱;也无意抹黑任何底层人工智能技术。相反,我希望概述分类法或本体论可以支持精心设计的聊天机器人体验的几种方法。分类学家拥有大量可以帮助聊天机器人计划的重要信息,但通常在设计过程的后期才被引入聊天机器人项目。

什么是“聊天机器人”?

我们可以将聊天机器人定义为一种计算机程序:

通过语音或文字与人互动

解释并澄清一个问题

根据问题(和附加上下文信息)创建数据集的查询

提供了答案

聊天机器人使用各种技术解释问题,但它必须能够:

地址同义词

确定背景

消除概念歧义

提供查询扩展或细化。

要记住一件事:聊天机器人的目标是解决可查找性问题。

分类法具有相同的功能:减少提出问题的实体和提供答案的实体之间存在的摩擦或熵。

分类学/本体论(Taxonomy/Ontology)

第二个重要提示:本博客文章互换使用术语“分类法”和“本体论”,主要是为了清晰和易于理解。分类法和本体论之间存在具体差异。然而,在基本层面上,两者都有概念并定义这些概念之间的关系。

分类法和本体论定义了一种通用语言,并将一种语言与另一种语言联系起来。

定义概念之间的关系(层次、关联、条目或同义词)

可用于描述内容

可用于细化问题

聊天机器人的分类功能

同义词、同音词、反义词等。

查询消歧(即“土耳其”动物与“土耳其”国家)

查询扩展/细化(即“Terrier”→Dog)

识别跨领域的关系(即狗→治疗辅助工具)

AI训练和规则,实体提取。

实际应用和实施。

事物变化越多……它们就越保持不变

Baklib最近与一些大型开发人员和人工智能工程师团队合作构建和实施新的聊天机器人。(分类学家喜欢从头开始研究项目!)进入我们的第一个聊天机器人项目,我们非常有兴趣了解该项目与我们的标准信息架构项目有何不同。Baklib团队为电子商务、门户、分析和其他类似项目开发了一种长期稳定的方法。但人工智能令人望而生畏。我们已做好充分准备重新评估我们的整个聊天机器人方法,但对我们的方法如此持久感到惊讶!

聊天机器人只是另一个系统;另一组要求。

显然,我们比其他项目更加重视实际的技术要求。但评估所有其他领域对于设计和构建成功的聊天机器人本体至关重要。评估阶段帮助我们确定必要的领域、变体的作用、关系、本体与内容交互的需求等。

根据我们的评估,我们能够收集并向设计和构建聊天机器人的团队提供要求。每个领域(粗体)都对整体本体模型有直接影响。

需求收集

分类法构建输入

从在线和文档内容中提取实体结果

审查搜索日志

支持团队记录的用户问题

公开可用的支持文档

之前的用户研究

本体工具培训和文档

获取分类法

显然,聊天机器人还有更多的功能,但这些是我们在最近的聊天机器人项目中通过分类/本体支持的功能。

聊天机器人功能

解析上下文——语言、同义词、技术或专业白话等

细化用户问题——支持“采摘浆果”

根据本体的结构扩展或细化查询

根据用户问题、用户上下文和本体创建查询。

将内容返回给用户

本体能力

概念之间的关系和上下文有助于确定是否需要其他信息

支持消歧的同义词

支持概念之间的层次结构的查询扩展和细化用作适当查询的数据源。例如,概念定义。

作为人工智能询问的语料库内容的标记基础。

浏览此功能列表,您应该清楚聊天机器人功能在几乎所有可查找性项目中都很常见。认识到这一点有助于我们坚持基本原则。

人工智能的一大优点是,我们可以与一群极其聪明、以信息为中心的工程师合作。我们非常幸运能够利用正在建造的结构。因此,我们不必非常努力地让人们相信不同类型的词条(同义词、反义词、昵称等)的价值。当开发人员努力寻找与动词交互的最佳方式时,我们能够为他们构建一个“动词”分类法。

浆果采摘

1989年,玛西娅·贝茨(MarciaBates)发表了她的“浆果采摘”模型,该模型后来被证明是分类学工作的基础。

贝茨描述了信息查找行为的关键要素,为解析话语并将其转换为查询提供了背景。这需要开发人员进行相当大的思维转变。本体提供了支持这个过程的能力,但是接口和交互仍然需要合并。

典型的搜索查询不是静态的,而是不断变化的。

搜索者通常以零碎的方式收集信息,而不是在一组最佳检索信息中收集信息。

检索者使用各种各样的检索技术,这些技术超出了通常与书目数据库相关的技术范围。

检索者使用书目数据库以外的各种来源。

查询不仅得到了改进,而且可能会发生显着变化并从一种模式转移到另一种模式。

每个聊天机器人都应该考虑的5件事

同义词、同音词、反义词等

查询消歧

查询扩展/细化

识别跨域的关系

AI训练和规则、实体提取

最后的想法

不要忘记最终用户的目标。我们构建的本体直接受到内容领域和内容结构的影响。构建本体相对容易。设计它以满足跨技术、内容、用户目标、业务目标和资源的不同聊天机器人功能是真正的挑战。

相信这个过程。Baklib本体/分类设计的标准流程和评估非常持久。人工智能聊天机器人可能看起来令人畏惧,但像任何其他分类项目一样对待这个过程有助于我们从根本上定义和解决问题,并与开发人员、工程师合作解决可查找性问题。

0 阅读:0