可汗精读《自然语言处理实践》01聊天机器人概述
2019-03-29 本文已影响0人
Khan可汗
01 聊天机器人概述
聊天机器人概述
聊天机器人的发展历史
通过自然语言模拟人类,进而与人进行对话的程序
聊天机器人溯源及发展
-
1950年图灵提出图灵测试,图灵“人工智能之父”
-
1966年MIT的约瑟夫·魏泽鲍姆开发最早的聊天机器人程序ELIZA,用于心理治疗BASIC编写,自然语言的先驱
-
1972年美国肯尼斯·科尔比使用LISP编写了模拟偏执型精神分裂症表现的计算机程序PARRY
-
1988年英国罗洛·卡彭特创建了聊天机器人Jabberwacky
-
1988年加州大学伯克利分校的罗伯特·威林斯基开发了名为UC(UNIX Consultant)的聊天机器人系统
-
1990年美国科学家休·勒布纳设立了人工智能年度比赛勒布纳奖
- 旨在借助交谈测试机器的思考能力
- 图灵测试的一种实践
聊天机器人研究兴起
-
1995年具有代表性的聊天机器人系统ALICE诞生
- 可以通过和网友聊天进行学习
- 1998年代码进行开源
- 采用启发式模板匹配的对话策略
-
2001年SmarterChild第一次被应用在及时通讯领域
-
2006年IBM开始研发Waston
聊天机器人研究方兴未艾
- 2010年苹果推出人工智能助手Siri
- 2016年全球各大公司开始推出可用于聊天机器人系统搭建的开放平台或开源架构
- 2010年至今,标志性聊天机器人纷纷出现
- 移动搜索和服务的入口之一
聊天机器人的分类与应用场景
基于应用场景的聊天机器人分类
-
在线客服聊天机器人系统
- 自动回复用户提出的鱼产品或服务相关的问题
- 降低企业客服运营成本、提升用户体验
-
娱乐场景下的聊天机器人系统
- 同用户进行不定期的闲聊
- 起到陪伴、慰藉的作用
-
教育场景下的聊天机器人系统
- 根据教育内容的不同进一步划分
-
人类助理类
- 通过语音文字与用户进行交互
- 实现用户个人事务的查询及待办
-
智能问答类
- 可以回答用户已自然语言形式提出的实时性问题及其他需要计算和逻辑推理的复杂问题
基于实现方式的聊天机器人分类
-
检索式
- 回答是提前定义的
- 在聊天时使用规则引擎、模式匹配或者机器学习训练好的分类器从知识库中挑选一个最佳的回复展示给用户
- 优点:回答的质量高,表达比较自然
- 缺点:知识库需要足够大
-
生成式
- 不依赖与提前定义的回答
- 训练机器人需要大量的预料,预料包含上下文聊天信息和回复
- 优点:可能覆盖人已滑梯、任意句式的用户输入
- 缺点:生成的应答句子质量很可能存在问题
基于功能的聊天机器人分类
-
问答系统
- 评价指标较为客观,评价方式相对成熟
- 知识获取
-
面向任务的对话系统
- 很难通过客观的机制对其进行评价
- 完成用户期望的任务或动作
-
闲聊系统
- 很难通过客观的机制对其进行评价
- 陪用户闲聊
-
主动推荐系统
- 评价指标较为客观,评价方式相对成熟
- 信息主动推荐
聊天机器人生态介绍
典型聊天机器人框架
-
完整的聊天机器人的组成
-
自动语音识别
- ASR模块
- 负责将原始的语音信号转化成文本信息
-
自然语言理解
- NLU模块
- 负责将识别到的文本信息转换为机器可以理解的语义表示
-
对话管理
- DM模块
- 负责基于当前对话的状态判断系统应该采取怎样的动作
-
自然语音生成
- NLG模块
- 负责将系统动作/系统恢复转变成自然语言文本
-
语音合成
- TTS模块
- 负责将自然语言文本编程语音信号输出给用户
-
-
Amazon Lex
-
可以在任何程序中使用语音和文本构建对话界面的服务
-
具有高级自动语音识别功能
- 可以将语音转换为文本
- 自然语言理解功能
-
支持Amazon Alexa深度学习技术
-
-
Facebook Wit.ai
聊天机器人平台
- 微信公众平台
- 小i机器人
典型的聊天机器人产品
- 苹果公司发布的个人语音助理Siri
- IBM公司发布的最强大脑 Watson
- 谷歌公司发布的智能人工助理 Google Now
- 微软发布的个人机器人朱莉Cortana和聊天机器人小冰