编程常识Qt电子书大全想法

NLP之从句子中提取单词步骤

2022-07-20  本文已影响0人  新潮看世界

浅层自然语言处理技术可以用来从句子中提取单词,其步骤为:

1、将句子转换为小写

2、删除停顿词(这些是在一种语言中常见的词。诸如 for、 very、 and、 of、 are 等词是常见的停止词)

3、从给定的文本序列中提取 n-gram,即 n 个项目的连续序列(简单地增加 n,模型可以用来存储更多的上下文)

4、分配一个句法标签(名词,动词等)

5、通过语义/语法分析器方法从文本中提取知识,例如,尽量保留在名词/动词这样的句子中重量较高的词

上一篇下一篇

猜你喜欢

热点阅读