Elasticsearch 映射 fielddata 工作原理解析_ar

1.fielddata 是什么

fielddata 是 elasticsearch 中一种数据结构，用于在内存中缓存字段数据，主要服务于以下场景：

聚合操作（aggregations）
排序（sorting）
脚本计算（scripting）
某些类型的查询（如 field 字段上的 term 查询）

当需要对 text 字段或其他非 doc_values 支持的字段执行上述操作时，elasticsearch 需要将这些字段的值加载到内存中，这就是 fielddata 的作用。

2.fielddata 的工作原理

按需加载：当第一次需要对某个字段执行聚合 / 排序等操作时，elasticsearch 会从磁盘读取该字段的所有值并构建内存中的数据结构。
存储在 jvm 堆内存：fielddata 会占用 jvm 堆内存空间。
字段级启用：默认情况下，text 字段禁用 fielddata，keyword 字段使用 doc_values 而非 fielddata。

3.主要用法

3.1 启用 fielddata（通常在 text 字段上）

put my_index/_mapping
{
  "properties": {
    "my_text_field": { 
      "type":     "text",
      "fielddata": true
    }
  }
}

3.2 监控 fielddata 使用情况

get _nodes/stats/indices/fielddata?fields=*

3.3 清除 fielddata 缓存

post my_index/_cache/clear?fielddata=true

4.使用场景示例

示例 1：对 text 字段进行聚合

get my_index/_search
{
  "size": 0,
  "aggs": {
    "my_terms": {
      "terms": {
        "field": "my_text_field"  // 需要该字段启用 fielddata
      }
    }
  }
}

示例 2：对 text 字段进行排序

get my_index/_search
{
  "sort": [
    {
      "my_text_field": {
        "order": "asc"
      }
    }
  ]
}

5.fielddata 与 doc_values 的区别

特性	`fielddata`	`doc_values`
构建时机	查询时按需构建	索引时预先构建
存储位置	jvm 堆内存	磁盘（操作系统缓存）
内存占用	高	低
适用字段类型	主要为 `text` 字段	主要为 `keyword` / `numeric` / `date` 等字段
默认启用	`text` 字段默认禁用	支持的字段默认启用

6.注意事项

内存消耗：fielddata 会显著增加内存使用，特别是高基数（大量唯一值）字段。
性能影响：首次加载 fielddata 可能导致查询延迟。
替代方案：对于 keyword / numeric / date 等字段，优先使用 doc_values。
熔断机制：elasticsearch 有 fielddata 熔断器防止内存耗尽。

7.最佳实践

尽量避免在 text 字段上启用 fielddata。
如需对文本进行聚合/排序，考虑使用多字段（multi-field）映射：

"my_field": {
  "type": "text",
  "fields": {
    "keyword": {
      "type": "keyword"
    }
  }
}

然后对 my_field.keyword 进行操作。

监控 fielddata 内存使用，设置合理的熔断阈值。

到此这篇关于elasticsearch 映射 fielddata 工作原理解析的文章就介绍到这了,更多相关elasticsearch 映射 fielddata 内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

客制化新体验! 雷柏V700DIY-98机械键盘全面测评

随着机械键盘设计和轴体越发丰富，对外设手感要求较高的玩家们已经开始不再满足于传统品牌的几款经典键盘款式和轴体。而是开始寻求手感多样、配列多变、外观设计感更强、满足了个性化需求的客制…

2025年06月03日 • 游戏开发

性价比超越RTX 5070! 瀚铠VASTARMOR RX 9070 GRE合金白色显卡测评

两个月前，amd凭借radeon rx 9070 xt以及radeon rx 9070两张显卡，成为玩家讨论的焦点。出色的性能、合理的价格，以及比竞争对手更充足的货量，收获玩家一致…

2025年06月03日 • 游戏开发

Flask请求参数获取常用方式详解

一、参数获取方式全景图先来看一个总览表格，对比三种主要获取方式：获取方式适用场景示例url代码示例路由参数<int:aid>url路径中的变量部分/... [阅读全文]

华为大规模推送鸿蒙HarmonyOS 5.0.1.130升级:适配 Mate 60/70、Pura70系列等手机

华为鸿蒙 harmonyos next 系统今日开启5.0.1.130 sp8版本大规模升级推送，系统包大小约 1.79gb，适配 mate 60 / 70、p... [阅读全文]

prometheus数据远程写入elasticsearch方式

prometheus数据远程写入elasticsearch一、部署elasticsearchversion: '3'# 网桥es -> 方便相互通讯networks: es…

2025年06月23日 • 游戏开发

解决Tomcat:One or more listeners failed to start.报错的问题

tomcat:one or more listeners failed to start.报错报错信息:one or more listeners failed to start.…