NLP-对话常用数据集
2020-06-08 本文已影响0人
张张大白
-------------------------------------------未完-待更新------------------------------------------------------------------
Persona-Chat
- 论文:ACL2018. Personalizing dialogue agents: I have a dog, do you have pets too?
- 基于知识的会话数据集。它既提供了手动注释的对话,也提供了相应的人物角色配置(背景知识),其中两个参与者自然地聊天,并试图了解对方。
Daily Dialog
- 论文 : 2017. Dailydialog: A manually labelled multi-turn dialogue dataset.
-
一个聊天数据集,包含有关日常生活的高质量的人类对话。
- 上面三个数据集:
https://github.com/PaddlePaddle/Research/tree/master/NLP/Dialogue-PLATO
- 论文:Commonsense knowledge aware conversation generation with graph attention.
- 单轮数据集,数据集包含3,384,185个训练对和10,000个测试对
ConceptNet
- 论文:Conceptnet 5.5: An open multilingual graph of general knowledge.
- 知识图,包含120,850个三元组,21,471个概念和44个关系类型。
Persona-Chat
- 论文:
Persona-Chat
- 论文: