【ES】--Elasticsearch的Nested类型介绍

目录

  • 一、问题现象
  • 二、普通数组类型
    • 1、为什么普通数组类型匹配不准?
  • 三、nested类型
  • 四、nested类型查询操作
    • 1、只根据nested对象内部数组条件查询
    • 2、只根据nested对象外部条件查询
    • 3、根据nested对象内部及外部条件查询
    • 4、向nested对象数组追加新数据
    • 5、删除nested对象数组某一个对象节点的数据
    • 6、遍历更新nested对象数组的数据
    • 7、动态修改nested对象数组的数据
    • 8、根据下标修改nested对象数组的数据
    • 9、批量修改nested对象数组的数据

一、问题现象

问题现象:在实际项目中,一些数组存储的字段,根据匹配条件去查询经常会查询到一些“其他不需要”的数据,为什么会出现这种情况?
----这种问题现象,就是ES的Object类型的数据扁平化存储问题

nested类型是object一种数据类型,对象数组的优先选择类型。Nested将数组中的每个对象作为单独的隐藏文档(hidden separate document)进行索引。nested属于object类型的一种,是Elasticsearch中用于复杂类型对象数组的索引操作。
nested类型数据是单独存储很耗资源,因此默认一个index最多只有50个nested字段。此外,虽然nested是单独存储的,但是其字段数也算入index总字段数,默认最多1000个。

二、普通数组类型

普通数组的mapping参数设置

 "word_one": {
   
          "properties": {
   
            "desc": {
   
              "type": "text",
              "fields": {
   
                "keyword": {
   
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            },
            "no": {
   
              "type": "text",
              "fields": {
   
                "keyword": {
   
                  "type": "keyword",
                  "ignore_above": 256
                }
              }
            },
            "sid": {
   
              "type": "long"
            },
            "sign": {
   
              "type": "boolean"
            }
          }
        }

现在进行搜索sid、desc字段数据。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
现象结论:word_one是普通数组List,多个must匹配条件会匹配整个List数组数据,而不是每个Bean去匹配。

1、为什么普通数组类型匹配不准?

原因分析:当字段是普通数组类型,其实在ES中,每个对象元素的属性值被扁平化存储在了数组中,已丢失了对应关系,因此无法保证搜索的准确。

{
   
          "app_id": "42533",
          "word_one": [
            {
   
              "desc": "南京有好高中么",
              "no": "0963",
              "sid": 2002,
              "sign": false
            },
            {
   
              "desc": "雨花区面积多大",
              "no": "05380",
              "sid": 2003,
              "sign": false
            }
          ]
        }

被扁平化存储到ES中,如下所示

 {
   
        "app_id"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/764992.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python+Pytest+Allure+Yaml+Pymysql+Jenkins+GitLab接口自动化测试框架详解

PythonPytestAllureYaml接口自动化测试框架详解 编撰人:CesareCheung 更新时间:2024.06.20 一、技术栈 PythonPytestAllureYamlJenkinsGitLab 版本要求:Python3.7.0,Pytest7.4.4,Allure2.18.1,PyYaml6.0 二、环境配置 安装python3.7&…

Windows下快速安装Open3D-0.18.0(python版本)详细教程

目录 一、Open3D简介 1.1主要用途 1.2应用领域 二、安装Open3D 2.1 激活环境 2.2 安装open3d 2.3测试安装是否成功 三、测试代码 3.1 代码 3.2 显示效果 一、Open3D简介 Open3D 是一个强大的开源库,专门用于处理和可视化3D数据,如点云、网格和…

linux内核驱动第一课(基于RK3568)

学习Linux驱动需要以下基础知识: C语言编程:掌握C语言是开发Linux驱动程序的基本要求。操作系统原理:了解操作系统的基本概念和原理,如进程管理、内存管理、中断处理等。Linux内核:熟悉Linux内核的结构和工作机制&…

编译libvlccpp

首先下载vlc sdk https://get.videolan.org/vlc/3.0.9.2/win64/vlc-3.0.9.2-win64.7z Cmake 生成libvlccpp vs2022工程文件 编译libvlccpp 编译出错需修改代码 错误信息: \VLC\sdk\include\vlc/libvlc_media.h(368): error C2065: “libvlc_media_read_cb”: 未…

Python程序语法元素简析

文章目录 Python程序的语法元素是构成Python程序的基础构建块,它们共同决定了程序的结构、逻辑和行为。以下是一些关键的Python语法元素简析: 注释:用于解释代码功能,不被执行。单行注释以#开始,多行注释使用三个单引号…

智能写作与痕迹消除:AI在创意文案和论文去痕中的应用

作为一名AI爱好者,我积累了许多实用的AI生成工具。今天,我想分享一些我经常使用的工具,这些工具不仅能帮助提升工作效率,还能激发创意思维。 我们都知道,随着技术的进步,AI生成工具已经变得越来越智能&…

怎样恢复数据?电脑数据恢复方法详解!

在日常使用电脑或移动设备时,我们难免会遇到数据丢失的情况,如误删除文件、存储设备故障等。数据恢复成了许多人迫切需要解决的问题。本文将为您介绍几种高效的数据恢复方法,帮助您轻松找回丢失的文件。 一、了解数据丢失的原因 在恢复数据…

Centos安装1Panel面板工具安装可视化界面

1Panel是一种市场调研平台,旨在帮助企业进行市场研究和获取消费者反馈。它通过在线调查和观察研究的方式,帮助企业了解他们的目标市场,并针对市场需求做出相应的决策。 1Panel的特点包括: 1. 全球范围:1Panel在全球范…

学习笔记(linux高级编程)10

IPC 进程间通信 interprocess communicate 三大类: 1、古老的通信方式 无名管道 有名管道 信号 2、IPC对象通信 system v BSD suse fedora kernel.org 消息队列(用的相对少,这里不讨论) 共享内存 信号量集 3、socket通信 网络通信 特…

Linux登录界面

Linux登录界面 1. 起因2. 脚本3. 效果 1. 起因 某次刷抖音看到一个博主展示了一个登录页面,觉得蛮好看的.于是自己动手也写一个 2. 脚本 编写脚本/usr/local/bin/login.sh #!/bin/bash Current_timedate %Y-%m-%d %H:%M:%S Versioncat /etc/redhat-release Kernel_Version…

合作协议的网络接入协议

合作协议的网络接入协议 介绍阿里云获取网络接入协议查看合同生成新合同总结 介绍 最近在帮公司弄增值电信业务经营许可证的相关的材料,然后需要我提供网络接入商的网络接入协议。因为每个公司买的服务器可能都不一样,有的阿里云、华为云、腾讯云等还有…

币界网讯,币安准备与SEC 展开长期法律对决

刚刚,数字货币交易所的领头羊Binance公布了法律策略,未来将会采取大胆举措与美国证券交易委员会 (SEC) 展开长期法律斗争,彰显其对监管合规的承诺。小编认为,Binance的这一战略立场是向美国SEC传递的道歉信,自从美国SE…

【0299】Postgres内核之哈希表(Hash Tables)

0. 哈希表(Hash Tables) 哈希表是 一种用于存储键值对的数据结构。与使用索引号访问元素的基本数组不同,哈希表使用键来查找表条目。这使得数据管理对于用户来说更易于管理,因为按属性对数据条目进行分类比按它们在一个巨大的列表中的数量更容易。 在 C++ 中,我们将哈希…

MySQL自学教程:1. MySQL简介与安装

MySQL简介与安装 一、MySQL简介二、MySQL安装(一)Windows系统上的安装(二)Linux系统上的安装(以Ubuntu为例)(三)Mac OS系统上的安装三、安装后的基本配置四、总结一、MySQL简介 MySQL是一个流行的开源关系型数据库管理系统(RDBMS),广泛应用于各种业务场景,从小型个…

干货分享:代理IP的10大误区

在当今的数字时代,代理已成为在线环境不可或缺的一部分。它们的用途广泛,从增强在线隐私到绕过地理限制。然而,尽管代理无处不在,但仍存在许多围绕代理的误解。在本博客中,我们将探讨和消除一些最常见的代理误解&#…

AI太火,今年更缺人了 (含实习)

AI太火了!眼睛一睁一闭,一大堆新鲜出炉的前沿科技进展已经塞满未读列表。 许多公司更是开出了高薪, 读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用 对于0基础小白入门: 如果你是零基础…

构建LangChain应用程序的示例代码:50、如何在检索-生成 (RAG) 应用中利用多模态大型语言模型 (LLM) 处理包含文本和图像的混合文档的示例

多模态 RAG 许多文档包含多种内容类型,包括文本和图像。 然而,大多数 RAG 应用中,图像中捕获的信息往往被忽略。 随着多模态 LLM 的出现,如 GPT-4V,值得考虑如何在 RAG 中利用图像: 选项 1:…

CDC同步器设计方案:为什么使用异步路径?

随着现代ASIC中时钟域的增加,时钟域交叉(CDC)变得无处不在,必不可少且必不可少。当然,时间安排总是一个问题。高时钟速度和信号路径中的延迟会导致信号到达不希望的时刻,从而导致亚稳性。本文的部分重点介绍…

pandas数据分析(5)

pandas使用Numpy的np.nan代表缺失数据,显示为NaN。NaN是浮点数标准中地Not-a-Number。对于时间戳,则使用pd.NaT,而文本使用的是None。 首先构造一组数据: 使用None或者np.nan来表示缺失的值: 清理DataFrame时&#xf…

【关于C/C++中的scanf不能使用问题】

方法1:scanf_s 方法2:看见后面的日志了吗 CRT……?在第一行加上#define 日志 方法3:#pragma warning(disable:4996) 4996是我们的报错序号