elasticsearch

[Elasticsearch Reference 2x] Map

2017-02-07  本文已影响70人  king_wang

本文是对官方文档的翻译,学习elasticsearch之用,错误之处欢迎指出。

Mapping

Mapping是指定义如何将文档和它的字段存储并索引的过程。例如,使用mapping可以定义:

Mapping Types

每个index都有一个或者多个mapping types,用以将documents索引成逻辑组合。比如用户的documents应该被保存到user的mapping type,博客的documents应该被保存到blogpost的mapping type。

每个mapping type有:

Field datatypes

每个字段都有它的类型,可能是:

Dynamic mapping

动态mapping使得你可以不需要事先定义它,即索引文档的新字段会被自动添加到mapping中。新字段既可以加到top-level,亦可以添加到objet/nested字段内。

你也可以使用动态mapping规则来自定义新字段的类型。

Explicit mappings

如果你十分了解你的数据,你可以显示的指定mapping,以免动态mapping自动指定的类型不是你想要的。

你可以在创建索引时创建mapping,并且使用PUT API来添加字段和它的类型。

Updating existing mappings

已有的类型和字段mapping不能更新。更新mapping意味着已索引的旧数据会失效。如果确实想要更新mapping,那应该先创建一个有正确mapping的index,将就数据reindex到这个index中。

Fields are shared across mapping types

字段是跨mapping共享的,这点是必须要注意的。虽然mapping type将字段分组,但每个mapping type中的字段不是彼此独立的,如果一个字段,具有相同的名字,在相同的index中,那么即使在不同的mapping type下也必须使用相同mapping

举个例子,有一个blog的index,它有2个mapping type,userblogpost。如果userblogpost有同名字段title,那么title字段在userblogpost2个不同的mapping type下必须有相同mapping。即title字段要么都是string类型,要么都是int类型,或者同时为其它类型。这个规则有一些例外是,mapping中的copy_to, dynamic, enabled, ignore_above, include_in_all, and properties 参数可以是不同的。你可以在后面的文章中了解这些参数。

通常,具有相同名称的字段也包含相同类型的数据,因此具有相同的mapping不是问题。当冲突确实出现时,可以通过选择更具描述性的名称来解决这些问题,例如user_title和blog_title。

Example mapping

下面是一个创建index指定mapping的示例:

PUT my_index  [1]
{
  "mappings": {
    "user": {  [2]
      "_all":       { "enabled": false  },  [3]
      "properties": {  [4]
        "title":    { "type": "string"  },  [5]
        "name":     { "type": "string"  },  [6]
        "age":      { "type": "integer" }   [7]
      }
    },
    "blogpost": {    [8]
      "properties": {    [9]
        "title":    { "type": "string"  },  [10]
        "body":     { "type": "string"  },  [11]
        "user_id":  {
          "type":   "string",    [12]
          "index":  "not_analyzed" 
        },
        "created":  {
          "type":   "date",    [13]
          "format": "strict_date_optional_time||epoch_millis"
        }
      }
    }
  }
}

注意:在Elasticsearch系列版本中,2.4版本之前(即2.0-2.3)字段名不允许使用符号点.,而符号点.表示object的path路径。2.4版本之后(包括2.4)字段名允许使用符号点.。但是需要设置mapper.allow_dots_in_name参数为true。

export ES_JAVA_OPTS="-Dmapper.allow_dots_in_name=true"
./bin/elasticsearch
上一篇下一篇

猜你喜欢

热点阅读