elasticsearch

【es】对es查询返回内容字段值的一个解读

2024-08-21  本文已影响0人  Bogon

对如下es集群的中的查询数据做一个解读

$ curl --location \
  --user username:password   \
  --header 'Content-Type: application/json'   \
  "http://xx.xx.xx.xx:9200/test/_search?size=1&pretty"


{
  "took" : 2,
  "timed_out" : false,
  "_shards" : {
    "total" : 3,
    "successful" : 3,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 12,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "6645a970b29a3f2e8f664952",
        "_score" : 1.0,
        "_source" : {
          "all" : true,
          "subordinateOrgs" : [ ],
          "summary" : "深圳不怕影子斜但能力有限公司运营管理制度",
          "catalogInfoId" : "66457d60b29a3f2e8f66493c",
          "eid" : "25201954",
          "updateDate" : 1715842058228,
          "code" : "YWYY-20240516-001",
          "roles" : [ ],
          "creatorPersonId" : "64d0bd50d08e8f52db7b054f",
          "title" : "深圳不怕影子斜但能力有限公司运营管理制度",
          "type" : 0,
          "content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>",
          "customPermission" : false,
          "jobIds" : [ ],
          "notSubordinateOrgs" : [ ],
          "top" : false,
          "attachmentList" : [ ],
          "personIds" : [ ],
          "id" : "6645a970b29a3f2e8f664952",
          "createDate" : 1715841392401
        }
      }
    ]
  }
}

"content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>"
这个content字段的值,这些特殊字符是干什么用的?

content字段中的特殊字符(如<p><br /></p>)是HTML标签。它们用于格式化文本:

这些标签用于在网页中控制文本的显示方式。

<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>
表示一个包含多段空白行的HTML内容,最后一段中包含实际的文本。

具体解释如下:

  1. <p><br /></p>:每个<p>标签代表一个段落,<br />标签插入一个换行。这段HTML在每个<p>标签中插入了一个换行,意味着在段落之间有空行。这通常用于在网页中插入间隔。

  2. 最终的<p>深圳不怕影子斜但能力有限公司运营管理制度</p>:这是最终的段落内容,显示了实际的文本。

综合起来,这段HTML内容的显示效果如下:

这通常表示文档中在实际内容之前留出了一些空间,可能用于分隔不同的内容部分或者使文档的排版看起来更整洁。

作为Elasticsearch中的content字段值,<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>中的HTML标签对搜索本身没有直接意义。

Elasticsearch会对存储的内容进行分析和索引,但这些HTML标签通常会被解析和忽略,只保留纯文本进行索引。
因此,搜索时主要关注文本“深圳不怕影子斜但能力有限公司运营管理制度”,而忽略HTML标签对结果的影响。

上一篇下一篇

猜你喜欢

热点阅读