Greedy NLP Learning Notes(六)信息抽取

2021-04-19  本文已影响0人  不可能打工

1. 目录

信息抽取目录
  1. NER识别实体
  2. 关系分析:分析每个实体之间的关系
  3. 指代消解 :it is located right 中的it(代词)属于hotel、hinton、nyc的哪一个实体?进行判断。
  4. 实体统一:给定两个实体,判断是否指向同一实体?
    例如:北京abc公司 、abc有限公司 ==> 北京abc科技有限公司。将不同表述的同一实体,换成标准化的形态
  5. 实体消歧:本质是在于一个词很有可能有多个意思,也就是在不同的上下文中所表示的含义不太一样,判别该实体属于哪个意思。


    image.png
  1. 知识库的搭建
  2. Google Scholar, CiteSeerX • ⽤用户库: Rapleaf, Spoke
  3. 购物引擎,产品搜索
  4. 专利利分析
  5. 证券分析
  6. 问答案系统

2.命名实体识别

命名实体识别(Named Entity Recognition,简 称NER),⼜又称作“专名识别”,是指识别⽂文本中 具有特定意义的实体,主要包括⼈人名、地名、机 构名、专有名词等。

  1. 毕业学校
  2. 毕业年份
  3. 学历
  4. 工作时⻓
  5. 技能
  6. 地点
  7. 工作过的公司名
上一篇 下一篇

猜你喜欢

热点阅读