《Elasticsearch全攻略：从入门到精通》_elasticsearch菜鸟教程资源-CSDN下载

183 浏览量 2025-07-15 10:22:52 上传评论收藏 63KB DOCX 举报

资源推荐

资源详情

资源评论

Elasticsearch 全攻略：从入门到精通

一、Elasticsearch 初相识

1.1 是什么

Elasticsearch 是一个基于 Lucene 的开源、分布式、RESTful 风格的搜索和数据分析引擎。

它为所有类型的数据提供近乎实时的搜索和分析，能迅速搜索用户的结构化或非结构化文本、

数字数据、地理空间数据等，并高效存储。其强大之处在于分布式架构，数据可水平扩展到多

个节点存储和处理，数据被分割成多个分片，每个分片还能复制到多个副本，以此提高数据可

用性和容错性。并且它提供快速的实时搜索功能，能在大规模数据集上快速搜索、过滤和排

序，支持复杂搜索查询语法和全文搜索功能，满足各种搜索需求。同时，Elasticsearch 支持

多种数据类型存储和索引，提供丰富聚合功能，还拥有基于 RESTful API 的接口，方便开发

者使用各种编程语言和工具与之交互。在如今大数据和云计算盛行的时代，它已然成为分布式

搜索和分析领域的中流砥柱，是构建现代化数据处理和检索系统不可或缺的关键技术。

1.2 能做什么

1. 日志分析：在大型互联网应用中，每天都会产生海量的日志数据。通过

Elasticsearch，运维人员可以快速地从这些日志中检索到特定时间范围、特定服务产

生的日志，定位系统故障、分析用户行为路径等。例如，某电商平台利用

Elasticsearch 分析用户在购物流程中的点击日志，优化商品展示和推荐算法。

2. 电商搜索：当用户在电商网站上输入关键词搜索商品时，Elasticsearch 能够在毫秒级

的时间内，从海量的商品数据中找到匹配的商品，并按照相关性、销量、价格等因素

进行排序展示。像淘宝、京东等电商巨头，都借助 Elasticsearch 来提升搜索的准确性

和效率，为用户提供优质的购物搜索体验。

3. 企业级搜索：在企业内部，员工需要在大量的文档、合同、邮件等资料中查找信息。

Elasticsearch 可以整合这些不同类型的数据源，实现统一的搜索接口，员工只需输入

关键词，就能快速找到所需资料，提高工作效率。

4. 安全信息和事件管理（SIEM）：Elasticsearch 可用作 SIEM 工具，帮助组织实时分析

安全事件。通过对网络流量、系统日志等数据的实时分析，及时发现潜在的安全威

胁，如入侵行为、数据泄露等，并采取相应的措施进行防范和处理。

1.3 核心概念解读

1. 索引（Index）：可以理解为一个数据库，是具有相似特征的文档的集合。例如，电商

平台中所有商品信息可以存放在 “products” 索引中；一个网站的所有日志数据可以放

在 “website_logs” 索引里。每个索引都有自己的映射（Mapping），用于定义文档中

字段的数据类型、分析方式等。索引具有多租户支持，一个集群可承载数千个独立索

引，并且可以根据需求进行创建、删除、更新等操作。

2. 文档（Document）：是索引中的最小数据单元，以 JSON 格式存储，类似于关系型

数据库中的一行记录。每个文档都有一个唯一的 ID，可以通过 ID 来对文档进行创

建、读取、更新和删除操作。例如，在 “products” 索引中，一个手机商品的详细信

息，包括名称、价格、品牌、配置等就是一个文档。文档支持嵌套对象和数组，能灵

活地表示复杂的数据结构。

3. 映射（Mapping）：定义了索引中文档的字段及其数据类型、是否被索引、分析器等

规则，就像是数据库表的结构定义。比如，对于 “products” 索引中的 “name” 字段，

可定义为文本类型（text），并使用中文分词器（如 ik_max_word）进行分词处理，

以便实现中文全文搜索；“price” 字段定义为数值类型（如 double），用于价格的存储

和计算。映射分为动态映射和显式映射，动态映射会在写入文档时自动推断字段类

型，方便快速开发；显式映射则在生产环境中用于严格管控字段类型。

4. 分片（Shard）：为了应对海量数据存储和提高搜索性能，Elasticsearch 将索引切分

为多个分片，每个分片是一个 Lucene 索引。分片可以分布在不同的节点上，从而实

现分布式存储和并行处理。比如，一个包含 10 亿条数据的索引，如果只存储在一个节

点上，无论是存储压力还是搜索性能都会面临巨大挑战。但将其分为 10 个分片，分别

存储在 10 个节点上，每个节点只需处理 1 亿条数据，搜索时还能并行处理，大大提

高了效率。分片分为主分片（Primary Shard）和副本分片（Replica Shard），主分片

负责数据的写入和读取，副本分片是主分片的复制，用于提供数据冗余和高可用性。

5. 副本（Replica）：副本是主分片的拷贝，主要作用是提高数据的可用性和容错性，当

某个主分片所在节点出现故障时，副本分片可以替代它继续提供服务；同时，副本还

能提高搜索性能，因为搜索请求可以分发到副本分片上并行处理。每个索引可以配置

多个副本，比如设置为 2 个副本，那么每个主分片就会有 2 个对应的副本分片，总共

就有 3 个相同数据的分片（1 个主分片 + 2 个副本分片）。在写入数据时，需要等待

所有副本分片都完成写入操作，才能确认写入成功，这保证了数据的一致性，但也会

在一定程度上影响写入性能，所以需要根据实际业务场景合理配置副本数量。

二、搭建 Elasticsearch 环境

2.1 安装前准备

1. JDK 环境：Elasticsearch 基于 Java 开发，运行前必须确保系统安装了 Java

Development Kit（JDK），且版本需符合要求，建议安装 JDK 11 或更高版本。可通

过在命令行输入 java -version 验证是否安装 JDK 及版本信息，若未安装，需前往

Oracle 官方网站下载并安装对应操作系统版本的 JDK 。

2. 操作系统：Elasticsearch 支持多种操作系统，如 Linux（常见的 CentOS、Ubuntu

等）、Windows、macOS 等。不同操作系统在安装和配置步骤上会稍有差异，需留意

官方文档说明。例如在 Linux 系统中，需关注系统内核版本、文件权限等问题；在

Windows 系统中，要注意环境变量配置等。

3. 硬件资源：根据数据量和应用场景预估所需硬件资源。若处理大规模数据和高并发请

求，建议配置较高内存、多核 CPU 以及高速存储设备。一般来说，生产环境中每个节

点至少分配 2GB 以上内存，数据量较大时，可适当增加内存和存储容量。同时，要确

保服务器网络稳定，具备足够带宽支持节点间通信和数据传输。

2.2 安装步骤详解

1. Linux 系统：

1. 下载安装包：访问 Elasticsearch 官方网站

（https://www.elastic.co/downloads/elasticsearch ），选择适合 Linux 系统的

版本，通常是.tar.gz 格式压缩包。使用 wget 命令下载，如 wget

https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.3-linux-

x86_64.tar.gz。

2. 解压安装包：使用命令 tar -xzf elasticsearch-7.17.3-linux-x86_64.tar.gz 解

压，解压后可将文件移动到指定目录，如 mv elasticsearch-7.17.3-linux-

x86_64 /usr/local/elasticsearch 。

3. 创建用户并授权：由于 Elasticsearch 不允许使用 root 用户启动，需创建新用

户。例如，使用 sudo useradd -m -d /home/elastic -s /bin/bash elastic 创建

elastic 用户，并用 sudo passwd elastic 设置密码，再通过 sudo chown -R

elastic:elastic /usr/local/elasticsearch 赋予新用户对 Elasticsearch 安装目录的

权限。

4. 配置文件：进入/usr/local/elasticsearch/config 目录，编辑 elasticsearch.yml

配置文件，可根据需求修改集群名称、节点名称、网络主机等参数。如将

network.host 设置为 0.0.0.0，允许外部访问；修改 cluster.name 为自定义集

群名称。

5. 启动服务：切换到 elastic 用户，进入/usr/local/elasticsearch/bin 目录，执

行./elasticsearch 启动 Elasticsearch，若要在后台运行，可使用

nohup ./elasticsearch &命令。

2. Windows 系统：

1. 下载安装包：从 Elasticsearch 官方网站下载适合 Windows 系统的版本，通常

为.zip 格式压缩包。

2. 解压安装包：将下载的压缩包解压到指定目录，如 C:\elasticsearch-7.17.3 。

3. 配置环境变量（可选）：若希望在任何命令提示符下方便运行 Elasticsearch

相关命令，可将 Elasticsearch 的 bin 目录添加到系统环境变量 Path 中，例如

将 C:\elasticsearch-7.17.3\bin 添加到 Path 。

4. 启动服务：以管理员身份打开命令提示符，进入 Elasticsearch 的 bin 目录，执

行 elasticsearch.bat 启动 Elasticsearch，启动成功后可在命令行看到相关启动

信息。

3. macOS 系统：

1. 下载安装包：从 Elasticsearch 官方网站下载适合 macOS 系统的.dmg 安装

包。

2. 安装 Elasticsearch：双击下载的.dmg 文件，将 Elasticsearch 图标拖移到

“Applications” 文件夹中进行安装。

3. 启动服务：打开终端，进入 Elasticsearch 的安装目录（通常在

/Applications/elasticsearch-7.17.3/bin），执行./elasticsearch 启动，也可通过

brew（若已安装 Homebrew）安装和管理 Elasticsearch，使用 brew install

elasticsearch 安装，再用 brew services start elasticsearch 启动。

2.3 配置参数调整

1. 集群名称（cluster.name）：用于标识 Elasticsearch 集群，具有相同集群名称的节点

会自动组成一个集群。在 elasticsearch.yml 文件中配置，默认值为 “elasticsearch”，

建议根据业务场景改为有意义的名称，如 “my - ecommerce - cluster”，方便管理和区

分不同集群，确保不同环境（开发、测试、生产）中的集群名称不同，防止节点误加

入其他集群。

2. 节点名称（node.name）：每个节点在集群中的唯一标识，默认是随机生成的 UUID

前 7 个字符。在 elasticsearch.yml 中配置，可设置为有意义的名称，如 “prod - data -

node - 1”，便于在集群中识别和管理节点，也可设置为服务器主机名称，如

node.name: ${HOSTNAME} 。

3. 网络绑定地址（network.host）：指定节点绑定的 IP 地址，默认只绑定到环回地址

127.0.0.1（IPv4）或::1（IPv6），仅适用于单个开发节点在本地运行。若要与其他服

务器上的节点通信并形成集群，需绑定到非环回地址，如 network.host:

192.168.1.10。配置自定义网络设置后，Elasticsearch 会将许多系统启动检查从警告

升级为异常，进入生产模式，需谨慎配置。

剩余29页未读，继续阅读

评论收藏

内容反馈

奔跑吧邓邓子

粉丝: 9w+

《Elasticsearch全攻略：从入门到精通》

Elasticsearch实战指南：从入门到精通

搜索引擎ElasticSearch实战讲义：从入门到精通

ElasticSearch入门到精通到运维全套资料

ElasticSearch入门到精通（基于ELK技术栈ElasticSearch7.8.版本）.rar

elasticsearch视频教程从入门到精通

《ElasticSearch入门到实战》电子书，从入门到进阶实战项目的教程文档，框架SpringBoot框架整合ES.zip

springboot从入门到精通

Elasticsearch经典案例：日志分析和监控系统.zip

Elasticsearch7.8X 入门到精通

Android入门到精通详解（完整书签）

Android开发从入门到精通].扶松柏.扫描版

OpenGLES 2.0 for android 开发教程 从入门到精通和Demo

ElasticSearch入门.pdf

Elasticsearch实战指南：从下载到高级应用全解析.pdf

ElasticStack(ELK)从入门到实践.pdf

OpenGL ES从入门到精通

Android游戏开发从入门到精通

《Android移动应用开发从入门到精通》.(张魏,李.pdf

深入解析AWS Elastic Beanstalk：从入门到实战

ELK入门到精通

Elasticsearch快速入门：基础配置与使用示例

Elasticsearch7.8零基础入门进阶视频教程05.rar

(狂神)ElasticSearch快速入门笔记，ElasticSearch基本操作以及爬虫(Java-ES仿京东实战)

玩转ECS从入门到精通（进阶篇）.zip

android开发从入门到精通(项目案例版)21章源码

云盘es 下载从入门到精通

ES查询客户端，elasticsearch可视化工具 elasticsearch查询客户端

Redhat 7.0使用CentOS 7 的Yum 网络源

cisco路由器双出口配置

最新资源

OpenGLES 2.0 for android 开发教程从入门到精通和Demo