当前位置：首页 > news >正文

ES基础知识

news 2025/9/2 13:35:58

Elasticsearch 是一个基于 Lucene 构建的开源、分布式、RESTful 搜索引擎，专为云计算环境设计，能够实现近乎实时的数据搜索和分析功能，但是不支持ACID事务。

基础概念

文档（Document）：Elasticsearch 中的基本数据单元，使用 JSON 格式表示，每个文档有唯一 ID 和类型。
索引（Index）：文档的集合，类似于关系数据库中的“数据库”概念，每个索引有自己的映射（mapping）和设置（settings）。
类型（Type）：在 7.x 之前，用于表示索引中的文档类别，类似于关系数据库中的“表”。7.x 以后，每个索引只能有一个逻辑映射结构。
分片（Shard）：索引的水平分割单元，每个分片本身是一个功能完整的“索引”，分为主分片（Primary Shard）和副本分片（Replica Shard），分布在不同节点上。
节点（Node）：运行中的 Elasticsearch 实例，节点可以承担不同角色，如数据节点、主节点、协调节点等。

停顿词过滤

停顿词过滤是指在分词过程中去除常见的、没有实际意义的词汇，如“的”、“是”等，以提高搜索效率和准确性。

常见数据类型

text、keyword、integer、long、float 、double、date、boolean、复合数据类型object（json对象）等。

Text和keyword区别

text适合存储全文数据，会进行分词处理，拆分成多个单词或词元，便于进行全文搜索、match查询，不支持精确匹配。

keyword存储不需要分词的字符串，如用户ID、用户名等。适合精确匹配、term查询，不适合全文搜索。

ES和MYSQL区别

Elasticsearch：适合全文搜索、实时数据分析，支持分布式存储和高并发查询。存储非结构化数据的JSON数据。
MySQL：关系型数据库，适合事务处理、复杂查询，支持 ACID 事务，存储结构化数据。

match和term区别

term和match都属于query查询类型，match用于全文匹配，不适合精确。term用于精确匹配，不适合全文。

http://www.dtcms.com/a/354777.html

相关文章：

PostgreSQL15——常用函数

docker一键部署！强大的本地音乐服务器NAS-Music

labelme的安装

数据库服务-主从同步-高可用架构MHA

vue的动态组件keep-alive实现组件缓存和状态保留

解锁制造业增长密码：MES如何适配行业特性？

Linux04：

Electron解压缩文件

【实战笔记】OCI Ubuntu 24.04 + TigerVNC + XFCE + Chrome 开机自启全记录

[吾爱出品] windows桌面课程表

Kafka 4.0 五大 API 选型指南、依赖坐标、上手示例与最佳实践

AI智能教育新实践：从作业批改到薄弱项定位，构建个性化学习新路径

深入理解QLabel：Qt中的文本与图像显示控件

云计算学习100天-第30天

LaunchScreen是啥？AppDelegate是啥？SceneDelegate是啥？ContentView又是啥？Main.storyboard是啥？

生成式 AI 的 “魔法”：以 GPT 为例，拆解大语言模型（LLM）的训练与推理过程

Java线程池深度解析：从原理到实战的完整指南

ABAP - CPI - pass header parameter and filter parameter to odata service

【C语言】函数栈帧的创建与销毁

引入资源即针对于不同的屏幕尺寸，调用不同的css文件

开发避坑指南(41)：Vue3 提示框proxy.$modal.msgSuccess()提示文本换行解决方案

腾讯混元开源视频拟音模型，破解 AI 视频 “无声” 难题

vscode 远程ssh登录免手动输入密码

20.22 QLoRA微调实战：中文语音识别数据准备全流程解密

音合成之二十四微软VibeVoice语音合成模型

2025通用证书研究：方法论、岗位映射与四证对比

【Bluedroid】A2DP Source设备音频数据读取机制分析(btif_a2dp_source_read_callback)

Unity 打包 iOS，Xcode 构建并上传 App Store

Java 大视界 -- 基于 Java 的大数据实时流处理在智能电网分布式电源接入与电力系统稳定性维护中的应用（404）

mac中进行适用于IOS的静态库构建