NLP之从句子中提取单词步骤
2022-07-20 本文已影响0人
新潮看世界
浅层自然语言处理技术可以用来从句子中提取单词,其步骤为:
1、将句子转换为小写
2、删除停顿词(这些是在一种语言中常见的词。诸如 for、 very、 and、 of、 are 等词是常见的停止词)
3、从给定的文本序列中提取 n-gram,即 n 个项目的连续序列(简单地增加 n,模型可以用来存储更多的上下文)
4、分配一个句法标签(名词,动词等)
5、通过语义/语法分析器方法从文本中提取知识,例如,尽量保留在名词/动词这样的句子中重量较高的词