五、ElasticSearch之Document详解与版本并发控

2020-04-04  本文已影响0人  换煤气哥哥

{
"_index": "test_index",
"_type": "test_type",
"_id": "1",
"_version": 3,
"found": true,
"_source": {
"test_field1": "test field1",
"test_field2": "test field2"
}
}

(1)_id元数据

代表document的唯一标识,与index和type一起,可以唯一标识和定位一个document

我们可以手动指定document的id(put /index/type/id),也可以不指定,由es自动为我们创建一个id。

自动生成的id,长度为20个字符,URL安全,base64编码,GUID,分布式系统并行生成时不可能会发生冲突

(2)_source元数据

是document的完整文本,返回字段可定制

PUT /test_index/test_type/1
{
"test_field1": "test field1",
"test_field2": "test field2"
}

GET /test_index/test_type/1?_source=test_field1

(3)lazy delete

document的全量替换

语法与创建文档是一样的,es会将老的document标记为deleted,然后新增我们给定的一个document

document的强制创建

PUT /index/type/id?op_type=create,PUT /index/type/id/_create

document的删除

DELETE /index/type/id

不会理解物理删除,只会将其标记为deleted,当数据越来越多的时候,在后台自动删除

(4)_version

基于_version进行乐观锁并发控制,第一次创建一个document的时候,它的_version内部版本号就是1;以后每次对这个document执行修改或者删除操作,都会对这个_version版本号自动加1;哪怕是删除,也会对这条数据的版本号加1。删除一条document,再重新创建这条document,其实会在delete version基础之上,再把version号加1 。侧面印证了lazy delete,而不是物理删除

## 新增一个文档
PUT /test_index/test_type/7
{
  "test_field7": "test field7"
}

GET /test_index/test_type/7

{
  "_index": "test_index",
  "_type": "test_type",
  "_id": "7",
  "_version": 1,
  "found": true,
  "_source": {
    "test_field7": "test field7"
  }
}

## 客户端A修改文档成功
PUT /test_index/test_type/7?version=1 
{
  "test_field7": "test client A"
}

## 客户端B修改文档失败
PUT /test_index/test_type/7?version=1 
{
  "test_field7": "test client B"
}

## 在乐观锁成功阻止并发问题之后,尝试正确的完成更新。基于最新的数据和版本号,去进行修改。可能这个步骤会需要反复执行好几次,才能成功,特别是在多线程并发更新同一条数据很频繁的情况下
GET /test_index/test_type/7 

PUT /test_index/test_type/7?version=2
{
  "test_field7": "test client B"
}

external version

使用乐观锁并发控制的时候,若不想要用es内部的_version来进行控制,也可以自己维护的版本号来进行控制

?version=1
?version=1&version_type=external
唯一的区别在于:version只有当你提供的version与es中的version一模一样的时候,才可以进行修改,只要不一样,就报错;当version_type=external的时候,只有当你提供的version比es中的_version大的时候,才能完成修改

GET /test_index/test_type/7 获取到版本version是4

PUT /test_index/test_type/7?version=4&version_type=external
{
  "test_field7": "test client C"
}
-- 失败


PUT /test_index/test_type/7?version=5&version_type=external
{
  "test_field7": "test client C"
}
-- 成功

(5)partial update

PUT是document的全量替换,会先lazy delete,然后创建新文档。

POST则是document的部分更新,只要传入部分要修改的字段,网络开销更少、保证在同一个shard上。

并且:

(1)partial update 内置乐观锁并发控制,不用我们自己写version判断
(2)retry_on_conflict 会自动获取最新的版本号比对再更新,并发情况下失败了会重试。可设置重试次数
    POST /index/type/id/_update?retry_on_conflict=5
 (3) 当然partial update 也可以我们自己强制指定版本号修改
    POST /index/type/id/_update?retry_on_conflict=5&version=6
上一篇 下一篇

猜你喜欢

热点阅读