1. 首页 > 科技资讯

渊亭科技小亭智能问答平台 构建更精准、复杂的多轮对话应用

 

导读:

随着自然语言处理技术的持续发展进化,智能问答系统在促进人和机器的有效沟通上被寄予厚望,预期能为客服效率低、人力成本高、数据流转难等人工服务问题的解决带来积极影响。其中,多轮对话作为智能问答系统的典型应用场景,不仅涉及多方面异构知识的表示、抽取、推理和应用,还涉及包括自然语言理解在内的其他人工智能核心技术的综合利用,已经成为了智能问答领域备受关注的研究方向之一。

与时俱进,我们推出了更加智能的问答系统,同时DataExa-Maya智能问答系统也获得新的中文名称——小亭。

01小亭智能问答平台

渊亭科技在自然语言处理领域拥有多年技术探索和实践创新,推出小亭智能问答平台。平台基于语音识别、个性化推荐、机器学习、深度学习、自然语言理解等人工智能关键技术,提供知识管理工具、对话引擎、数据统计及分析和开发者工具,精准理解用户对话意图和关键信息,帮助用户快速创建个性化智能对话系统。致力于实现高效、便捷、多样化、低成本的人机对话体验。研发成果目前已经广泛应用在智能客服、智能音箱、智能车载等众多场景。

多轮对话是小亭问答平台中任务型对话的主要核心策略,也是我们今天重点介绍的内容。多轮对话引擎以公司自主研发的底层技术产品DataExa-Kamala中的各种算法单元作为服务层,获得自然语言的语义解析、实体提取等能力。本次新发布的版本还支持新一代图形化对话流编辑器,能够以图形化拖拽界面与编程相结合的方式实现复杂多轮对话管理。

02关于多轮对话

多轮对话的另一个名字,又叫作基于上下文关系的对话,小亭智能问答平台多轮对话模块的目的是在交互式场景中连续地正确地回答自然语言问题。

为了更好地满足对话状态跟踪、对话策略选择、话术生成等需求,渊亭多轮对话模块采取四步走路线:

第一步:自主研发的多轮对话快速构建一个基于规则对话流的对话引擎,持续交互沉淀出大量的对话数据。

第二步:利用监督学习,实现对话管理的初步模型化。

第三步:通过自学习算法让系统的对话能力持续增强。

第四步:收集用户真实交互数据,持续优化模型,接入知识图谱,进行数据分析和挖掘,用于客户洞察。

多轮对话模块主要使用了自然语言理解(NLU)、对话管理(DM)、自然语言生成(NLG)、多轮策略这几个关键组件。

其中渊亭科技底层技术产品DataExa-Kamala负责了自然语言整体能力输出的部分,支持自然语言理解(NLU)和自然语言生成(NLG)。如下图所示,DataExa-Kamala提供包括分词、NER、句法分析、相似度计算、文本分类、文本聚类等在内的高质量自然语言处理能力。

对话管理(DM)和多轮策略则通过多轮对话引擎来实现。多轮对话是一种在人机对话中,初步明确用户意图之后,获取必要信息以最终得到明确用户指令的方式。每个对话session包含多个对话类型,包括丰富的交互逻辑、多样性的对话领域、个性化的profile和推荐等。多轮对话引擎负责用户对话状态的跟踪与控制,确保对话流程按照对话模块进行,以最短的轮数完成对话任务。其核心功能是意图识别、意图跳转、槽位识别等技术,能够实现同一主题的多次对话。引擎通过实体识别、序列标记与意图识别来准确识别多轮对话。

1、实体识别

用户通过实体管理自定义的实体,这些实体基于“关键词-同义词”模式;现有的通用实体以及用户自定义实体组合成新的实体,通过设置实体,使机器人能够识别用户话术中的关键信息,更好地理解用户意图。

2、槽位标记

在意图模板中配置语料时,支持自动或手动标记槽位。槽位的标记可以帮助平台从用户的输入中准确地提取参数。

3、意图识别

意图识别是多轮对话的核心能力,通过对意图语料的训练,可以快速匹配用户对话的意图。

03技术架构

多轮对话模块的技术架构中主要包括自然语言分析模块、意图探测模块、对话管理模块和对话生成模块:

1、自然语言分析模块

将用户输入自然语言信息经过词法分析、句法分析、语义分析生成解析树结构。

2、意图探测模块

基于分析模块的输出,进行用户意图识别(User Intent Detection)以及语义槽填充(Semantic Slot Filling),解析为计算机能够处理的结构化数据。

3、对话管理模块

该模块主要包括对话状态追踪(DST)以及对话策略选择(DPL)两个主要部分。对话状态追踪部分负责维护多轮对话的状态并根据与知识库的交互结果、当前模块的输入、历史对话状态三者综合得到新的对话状态,从而生成对话策略,对话策略作为对话管理模块的输出,控制回复生成模块,产生对用户的回复语句。

4、对话生成模块

通过情感分析、个性化推荐、评价指标等多种形式为用户提供更专业、精准的问答回复。

此外,小亭智能问答平台多轮对话拥有以下技术特点:

1、基于状态图的结构

利用有限状态机来控制对话的进行,即下一状态由当前状态和系统输入决定,输出由当前状态和用户输入决定。

2、填充槽结构

采用多维特征向量来表示对话的情况。可以在对话的过程中不断修改向量的值,对于操作的顺序没有严格限制,根据现在状态进行响应,随后根据用户的回答或系统的反应修改特征向量。

3、基于任务的结构

采用树进行表示,建立一个对话流作为根节点,随后各个节点表示为解决该任务所需要的信息,要素之间的关系可通过“与”或者 “或” 进行表示。系统首先判断是什么任务,建立任务树,随后提问用户所需要的查询信息,根据用户回答来填充树。

4、基于逻辑表达式的结构

任务树结构将很多转移路径、对话交互的逻辑隐藏在了其目标结构和运行时的策略中。根任务表达成各个自信息元素的集合,任务树转换成逻辑表达式与的结构。

5、状态图和逻辑表达式混合使用

对于复杂的提问,则建立对应的任务树或者逻辑表达式进行信息条件填充、查询和应答。

6、基于知识图谱进行实体消歧

利用知识图谱提供先验知识,进行实体消歧。

04功能优势

小亭智能问答平台的多轮会话功能运用意图识别、实体识别、填槽等NLP技术,并采用可视化设计机器人多轮会话流程,可实现基于上下文语境的多轮对话,解决复杂场景问题。

针对多轮对话产品中经常出现的 "多任务调度", "挂起", "回溯", "回归", "嵌套", "异常处理", "抢占", "异步", "阻塞","打断","恢复" 等各种各样的痛点,我们预置了多项对话能力。多轮对话主要针对任务型场景,以多轮交互形式完成人机对话流程,支持可视化创建对话流程和节点设置,将对话节点分成多个类型——包括用户输入节点、条件判断节点、服务调用节点、函数节点、填槽节点、回复节点等等,每个节点有其特定的功能,是对话交互设计的最小逻辑单元。通用的对话策略和流程做成可插拔式的组件,大大降低了不同领域对话设计的成本,提高了对话管理的可扩展性。

因此,搭载了多轮对话功能的小亭智能问答平台也进而拥有了全面对话管理、算法领先、稳定可靠、简单易用、自助服务、完善的对话管理和快速调试功能等优势,能够满足各行各业各种场景下的对话服务需求。

05开发流程

小亭智能问答平台多轮对话功能模块是以工业级可用为目标进行开发的。设计指标包括高性能、流畅的API、面向接口编程、高度组件化、高度可配置、测试驱动开发。

开发流程如下:

1、确定系统的业务需求

2、定义对话交互的功能说明

3、开发对话任务中用到的语义模型

4、设计和开发对话交互的流程

5、确定对话交互时错误处理策略

6、后端系统的集成

7、对话场景模型和对话调试

8、上线后对效果的监控

06可视化多轮对话流编辑器

渊亭在智能对话交互的探索和实践创新中积累了丰富经验。此次新版本在原有版本基础上进行了新一轮迭代,新增了「可视化对话流编辑器」功能,有效提升用户体验。

可视化对话流编辑器提供了以下多个功能点:

1、画布

支持节点编辑、流程管理配置所见即所得,以画布形式构建多轮对话。系统支持不同节点的组合和对话流的构建,支持意图、服务、变量、实体的构建,对话工厂适用于各项多轮对话场景,支持问答业务流的构建,节点上支持判断、意图、回复、服务、函数等,支持组件库、全局变量、全局实体、全局服务等全局引用功能,高效构建对话流。配置无条件进入的连线,与开始节点连接,后续连接对话回复节点,从而实现进入对话意图后主动发起对话的效果,连线支持对用户Query输入内容、意图、词槽、全局变量等多种条件进行判断。

2、条件节点

支持当前时刻的对话状态条件判断,根据条件将对话导向不同的分支,跳转后的对话由其他节点承担。

3、服务调用节点

支持 API 接口调用服务,调用节点无需任何代码即可调用外部资源,调用后数据获取结果在流程中使用;一站式实现多轮对话流程设计,完成与用户的交互、管理槽位信息,访问外部接口,管理调用的结果;自助集成三方业务接口,实现更多业务可能。

4、填槽节点

用来做槽填充和填槽过程中的交互;填槽节点和对话回复节点可以将变量或词槽配置到机器人话术当中,并可以根据业务需求灵活调整接下来的操作。

5、函数节点

基于编程的自定义节点;针对于定制化要求较高的业务需求,支持节点编程,充分满足开发者的多项需求。无需编写代码,简单高效;更便捷地引入业务资源,降低接入成本。

解决定制业务需求在条件判断时、应答回复时,获取业务系统数据资源时,可以使用自定义编程。

6、调试窗

进行对话的诊断、效果评测,调试结果无误发布上线;解决了分支众多、人工难以覆盖,变量众多、错误定位困难,多轮对话、修改复测困难等问题;对话实例包括用户的话语、dialog act、用户意图、用户实体、会话历史记录,可根据当前对话动态生成话术;支持顺序、随机话术,多次澄清失败后支持用户选择继续对话或者中止对话。系统响应的决策依据是相似度匹配,配置多个话术顺序或随机答复有助于提高体验。

7、回复节点

用来表示回复用户的内容;对话回复话术依赖特定词槽或变量的取值,澄清时支持顺序、随机话术,多次澄清失败后支持用户选择继续对话或者中止对话。通过配置选择是否等待用户输入,同时回复用户多句答复,即在一个对话回复中,选择不等待用户输入,后续连接另一个对话回复节点,赋予开发者最灵活的话术配置,可以在话术中配置变量、意图名称和词槽值,动态生成话术,不用再进行滞后的拼接处理,从而实现同时回复用户多句答复的效果。

平台部分功能演示

- 结语 -

过去几年中,结合智能问答的刚性需求和场景,渊亭在智能对话交互上做了大量的探索和尝试,在多轮对话领域构建了一套相对完整的数据、算法、在线服务、离线数据闭环的技术体系,并推动产品在不同行业的智能服务和智能设备上得到了大规模的应用。

未来,小亭智能问答平台将继续扩展新的应用领域,针对细分领域持续优化产品功能,输出更多创新能力和产品,助力用户实现价值提升。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.miyuegong.com/kejizixun/71905.html

联系我们

在线咨询:点击这里给我发消息

微信号:666666