nltkgensim算法小白菜

实体关系抽取

2017-06-05  本文已影响333人  时芥蓝

实体属性关系抽取

关系类型(通用文本)

关系 例子 类型
隶属关系
个人 和谁结婚/是谁的妈妈 per->per
组织 什么的发言人/**的总统/什么公司的CEO per->org
人为 拥有/发明/生产() per|org ->art
空间位置关系
临近 靠近/ loc->loc
指向/方向 位于某处南部/ loc->loc
整体与部分关系
组织 某个部门(a unit of/ a parent of) org->org
政治 签署/附加/吞并 获取 gpe->gpe(地理政治实体)
image.png

关系类型(ACE2003)

角色关系:将一个人与组织或地缘政治实体联系起来

子类型:成员、拥有者、子公司、客户、公民

整体与部分关系:

抽取类型

人的属性

产品的属性

概念的属性

企业的属性


实体属性抽取方法

  1. 基于模式和规则
    1. 人工构造规则和模式进行匹配
    2. 优点:准确率比较高
    3. 缺点:需要人工构造,依赖于特定领域,较难扩展和维护
  2. Bootstrapping方法
  3. 有监督方法
  4. 无监督方法
  5. 远程监督方法

基于规则

基于统计

上一篇 下一篇

猜你喜欢

热点阅读