NLP随笔

2021-02-16 本文已影响0人三方斜阳

摘录：
绝大多数NLP任务可以归结为几大类任务。两个看似差异很大的任务，在解决任务的模型角度，可能完全是一样的。

绝大部分NLP问题可以这四类任务中：

序列标注：分词/POS Tag/NER/语义标注。。。

分类任务：文本分类/情感计算。。。

句子间关系判断：文本蕴含/QA/自然语言推理。。。

生成式任务：机器翻译/文本摘要。。。

1. 一类是序列标注，这是最典型的NLP任务，比如中文分词，词性标注，命名实体识别，语义角色标注等都可以归入这一类问题，它的特点是句子中每个单词要求模型根据上下文都要给出一个分类类别。

2. 第二类是分类任务，比如我们常见的文本分类，情感计算等都可以归入这一类。它的特点是不管文章有多长，总体给出一个分类类别即可。

3. 第三类任务是句子关系判断，比如Entailment，QA，语义改写，自然语言推理等任务都是这个模式，它的特点是给定两个句子，模型判断出两个句子是否具备某种语义关系。

4. 第四类是生成式任务，比如机器翻译，文本摘要，写诗造句，看图说话等都属于这一类。它的特点是输入文本内容后，需要自主生成另外一段文字。

参考：