[Elasticsearch Reference 2x] Map
本文是对官方文档的翻译,学习elasticsearch之用,错误之处欢迎指出。
Mapping
Mapping是指定义如何将文档和它的字段存储并索引的过程。例如,使用mapping可以定义:
- 一个字段是否作为full text的
- 一个字段是数字类型,日期类型,或者地理位置类型
- 文档上的哪些字段应该被索引到_all这个字段上
- 日期类型的格式format
- 自定义一些规则用来控制自动增加的字段
Mapping Types
每个index都有一个或者多个mapping types,用以将documents索引成逻辑组合。比如用户的documents应该被保存到user的mapping type,博客的documents应该被保存到blogpost的mapping type。
每个mapping type有:
-
Meta-fields
Meta-fields元数据字段用于自定义如何处理文档的元数据。meta-fields包含了_index, _type, _id, 和 _source -
Fields or properties
每个映射类型都包含与该类型相关的字段或属性的列表。用户类型user可能包含title,name和age字段,而博客类型blogpost可能包含title,body,user_id和created字段。在同一索引中不同映射类型中具有相同名称的字段必须具有相同的映射
Field datatypes
每个字段都有它的类型,可能是:
- 简单类型string, date, long, double, boolean 或者 ip
- Json类型,例如object或者nested
- 地理位置 geo_point, geo_shape 等ES专用类型
Dynamic mapping
动态mapping使得你可以不需要事先定义它,即索引文档的新字段会被自动添加到mapping中。新字段既可以加到top-level,亦可以添加到objet/nested字段内。
你也可以使用动态mapping规则来自定义新字段的类型。
Explicit mappings
如果你十分了解你的数据,你可以显示的指定mapping,以免动态mapping自动指定的类型不是你想要的。
你可以在创建索引时创建mapping,并且使用PUT API来添加字段和它的类型。
Updating existing mappings
已有的类型和字段mapping不能更新。更新mapping意味着已索引的旧数据会失效。如果确实想要更新mapping,那应该先创建一个有正确mapping的index,将就数据reindex到这个index中。
Fields are shared across mapping types
字段是跨mapping共享的,这点是必须要注意的。虽然mapping type将字段分组,但每个mapping type中的字段不是彼此独立的,如果一个字段,具有相同的名字,在相同的index中,那么即使在不同的mapping type下也必须使用相同mapping。
举个例子,有一个blog的index,它有2个mapping type,user
和blogpost
。如果user
和blogpost
有同名字段title
,那么title
字段在user
和blogpost
2个不同的mapping type下必须有相同mapping。即title
字段要么都是string类型,要么都是int类型,或者同时为其它类型。这个规则有一些例外是,mapping中的copy_to, dynamic, enabled, ignore_above, include_in_all, and properties 参数可以是不同的。你可以在后面的文章中了解这些参数。
通常,具有相同名称的字段也包含相同类型的数据,因此具有相同的mapping不是问题。当冲突确实出现时,可以通过选择更具描述性的名称来解决这些问题,例如user_title和blog_title。
Example mapping
下面是一个创建index指定mapping的示例:
PUT my_index [1]
{
"mappings": {
"user": { [2]
"_all": { "enabled": false }, [3]
"properties": { [4]
"title": { "type": "string" }, [5]
"name": { "type": "string" }, [6]
"age": { "type": "integer" } [7]
}
},
"blogpost": { [8]
"properties": { [9]
"title": { "type": "string" }, [10]
"body": { "type": "string" }, [11]
"user_id": {
"type": "string", [12]
"index": "not_analyzed"
},
"created": {
"type": "date", [13]
"format": "strict_date_optional_time||epoch_millis"
}
}
}
}
}
- [1] 创建一个名为my_index的index
- [2][8]在index上加
user
和blogpost
2个mapping type - [3]在
user
上关闭_all
这个meta - [4][9]为每个mapping type指定字段或属性
- [5][6][7][10][11][12][13]为每个字段指定类型
注意:在Elasticsearch系列版本中,2.4版本之前(即2.0-2.3)字段名不允许使用符号点.
,而符号点.
表示object的path路径。2.4版本之后(包括2.4)字段名允许使用符号点.
。但是需要设置mapper.allow_dots_in_name
参数为true。
export ES_JAVA_OPTS="-Dmapper.allow_dots_in_name=true"
./bin/elasticsearch