ES如何通过文档id获取正排信息

本文介绍了Elasticsearch(ES)中如何通过文档id获取正排信息,强调了Doc Values在列式存储中的作用。在ES中,原始数据以行式存储并压缩,而正排信息来源于Doc Values,它是列式存储的,用于排序和聚合操作。Doc values不支持analyzed字符串字段,对于这类字段,fielddata提供了一种内存中的解决方案,但存在扩展性和内存消耗问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

根据文档id定位到某个字段的正排信息,常常用于需要根据某个字段排序,分类计算,这个必须使用Doc values

 

正文

1: 在ES中原始数据是以行式存储的,也就是文档的所有字段都会连续的存储在物理空间上。

这样势必会占用非常多的空间,所以一般都是压缩存储的!

正排信息不是来自于原始文档中。存储原始文档的文件 如下

 

查看原始文档的过程!

第一步二分查找block,定位属于哪个block。 

  第二步就是根据从block里根据每个chunk的起始文档号,找到属于哪个chunk和chunk位置。 

  第三步就是去加载fdt的chunk,找到文档。

2: docvalues结构 @hxx 列式存储

在建倒排的时候,docvalues就会同时建好

正排的结构如下:

因为是列式存储,就是说所有文档的city会连续存储!其中city会用一些压缩技术,比如漂移量或者公约数来减少空间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

huangleijay

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值