对话系统调研笔记

2021-02-20  本文已影响0人  JoeNahm

对话系统分类

任务型 开放域聊天 知识问答 推荐系统
目的 完成任务/动作 闲聊 知识获取 信息推荐
领域 特定域(垂类) 开放域 开放域 特定域
场景 个人助理 娱乐交流 客服/教育 个性化推荐
典型 Siri/小娜 小冰 Watson 今日头条
轮数 单轮 多轮 单轮 单轮

早期工作

名称 Eliza Clippy A.L.I.C.E
开发者 MIT 微软 Richard S. Wallace
时间 20世纪60年代 20世纪90年代 1995年
特点 不好用 不好用 尽管是启发式模板匹配,但却是同类产品中做的最好的

转折

2016年微软、Facebook、Amazon等公司分别发布了各自的相关产品,原因有如下两点:

  1. 消息类服务(尤其是社交网络)大发展
  2. 深度学习技术实现突破

分类

开放域:无明确主题、目标

特点:

问题:

封闭域:明确的目标,限定知识范围

特点:

问题:

经典架构(任务型对话)

一般由3个核心模块构成:自然语言理解(NLU)、对话管理(DM,包括DST和DPO)和自然语言生成(NLG)

车万翔,张伟男.人机对话系统综述[J].人工智能,2018(01):76-82.

如图所示,仅看右侧就好,左侧是语音到文字的转换及其逆过程。其中NLU叫做SLU了,其实是一个意思。

NLU:自然语言 -> 结构化的语义表示

示例:

目标是识别出领域、意图和语义槽

输入查一下明天到上海的机票
输出 :

<
    领域=航旅;
    意图=查询机票;
    语义槽(
        出发日期=明天;
        到达地=上海
    )
>

主要任务:

实现方法:

DM:综合当前用户输入和历史中已获得的信息,给出机器作答的结构化表示

示例:
DST

< 日期=NULL; 出发地=NULL; 到达地=NULL >
=变成=>
< 日期=NULL; 出发地=NULL; 到达地=上海 >

DPO :

< ask=出发地 >

DST:通过自然语言的结构化表示,理解、捕捉用户的意图、目标

DPO:与用户交互,获取到缺少的信息

实现方法:有限状态自动机(FSA)、填槽法、基于实例的方法、基于规划的方法和贝叶斯网络

NLG:把DM的结构化对话策略,还原成对人友好的自然语言

实现方案:

解决方案 优点 缺点 应用场景
rule based 在特定领域内很准确 移植、扩展能力差 个人助理
seq2seq 数据驱动 需要大量语料 闲聊机器人
query based 易扩充,无语法错误 不连续、答非所问 问答/客服

目前基于深度学习的seq2seq(亦称Encoder-Decoder)生成式端到端模型快速发展

发展趋势

典型问题:

解决方案:

参考

上一篇下一篇

猜你喜欢

热点阅读