当前位置: 首页 > news >正文

离线安装elasticdump并导入和导出数据

离线安装elasticdump

在 CentOS 或 RHEL 系统上安装 elasticdump,你可以使用 npm(Node.js 的包管理器)来安装,因为 elasticdump 是一个基于 Node.js 的工具。以下是步骤

先在外网环境下安装

  1. 下载nodejs和npm(注意x86和aarch64的包不同)
wget https://nodejs.org/dist/v12.22.11/node-v12.22.11-linux-arm64.tar.gz

我下这个版本才能用npm install elasticdump -g下载
2. 解压

tar -zxvf node-v12.22.11-linux-arm64.tar.gz -C /usr/lib/
  1. 创建软链接
mv /usr/lib/node-v12.22.11-linux-arm64 /usr/lib/nodejs
ln -s /usr/lib/nodejs/bin/npm /usr/bin
ln -s /usr/lib/nodejs/bin/node /usr/bin
  1. 验证能否正常使用
node -v
npm -v
  1. 安装elasticdump
npm install elasticdump -g
  1. 创建elasticdump软链接
ln -s /usr/lib/nodejs/lib/node_modules/elasticdump/bin/elasticdump /usr/local/bin/elasticdump
  1. 验证安装
elasticdump --version
  1. 导出缓存包
    查看npm缓存路径
npm config get cache

我的是/root/.npm,把elasticdump安装后的缓存目录打包

cd /root
tar -zcf npm-cahce.tgz .npm
  1. 把导出的npm-cache.tgz 保存下来

拷贝安装包到内网环境

  1. 参见外网步骤安装nodejs和创建软链接
  2. 拷贝npm-cache.tar到/root,并解压缩
mv npm-cache.tar /root
cd /root
tar -zxf npm-cahce.tgz
  1. --cache-min这个参数是指超过多少分钟,才去网络下载,设置足够大就会从缓存安装
npm install --cache /root/.npm --optional --cache-min 9999999 -shrinkwarp false elasticdump
  1. 创建软链接
ln -s /usr/lib/nodejs/lib/node_modules/elasticdump/bin/elasticdump /usr/local/bin/elasticdump
  1. 检测环境,安装成功,会看到elasticdump帮助信息,导出数据时需要查看这些帮助参数的用法:
elasticdump --help

导入和导出数据

导出索引数据

  1. 将源 ES 实例中的索引数据导出为 JSON 文件:
elasticdump \--input=http://localhost:9200/your_index_name \--output=your_index_data.json \--type=data
  1. 导出索引映射,将索引的映射(mapping)导出为 JSON 文件,以确保导入时保持相同的结构:

如果有认证,则下方input输入账户密码username:password

elasticdump \--input=http://username:password@source_elasticsearch:9200/your_index_name \--output=your_index_mapping.json \--type=mapping
  1. 导出索引的settings(即索引的配置如:分片数、副本数等)
elasticdump \--input=http://localhost:9200/my_index \--output=my_index_settings.json \--type=settings

导入数据

  1. 导入索引映射:(已经有索引结构了可不导入)当索引模板有变动时建议导入
elasticdump \--input=your_index_mapping.json \--output=http://localhost:9200/your_index_name \--type=mapping
  1. 导入索引数据,设置limit一次性导入多少条(默认100条):
    当索引不存在时会自动创建
elasticdump \--input=your_index_data.json \--output=http://localhost:9200/your_index_name \--type=data \--limit=10000
  1. --ignore-errors 参数可以忽略导入过程中出现的错误,例如 _id 冲突的错误。这样,当导入数据时,如果目标索引中已经存在 _id 相同的文档,导入操作不会覆盖原有数据,而是跳过这些冲突的文档
elasticdump \--input=my_index_dump.json \--output=http://localhost:9200/my_index \--type=data \--ignore-errors
  1. 验证数据导入
    在目标 ES 实例中验证数据是否成功导入:
curl -X GET "http://target_elasticsearch:9200/your_index_name/_search?pretty"

如果返回的结果与原始索引中的数据一致,说明数据迁移成功

相关文章:

  • Android Studio 获取配置资源与第三方包信息详解
  • ProfiNet转DeviceNet边缘计算网关多品牌集成实践:污水处理厂设备网络融合全流程解析
  • [特殊字符] Kotlin与C的类型别名终极对决:typealias vs typedef,如何让代码脱胎换骨?
  • 大模型API中转平台选择指南:如何找到优质稳定的服务
  • 从头开始掌握扩散概率模型
  • 知识就是力量——一些硬件的使用方式
  • 【Lua语言】Lua语言快速入门
  • C++用于保留浮点数的两位小数,使用宏定义方法(可兼容低版本Visual Studio)
  • 【内置函数】84个Python内置函数全整理
  • 每日OJ_牛客_kotori和素因子_DFS_C++_Java
  • Warcraft Logs [Classic] [WCL] BOSS ID query
  • 关于viewpager常见的泄漏
  • 23种设计模式全解析及其在自动驾驶开发中的应用
  • Rsync+sersync2实现目录实时同步
  • 模拟SSE流式输出的四种方法
  • 黑马商城(四)网关
  • velocity模板引擎
  • C语言用if else求三个数最小值的一题多解
  • 页内碎片和页外碎片的区别
  • 第十届团体程序设计天梯赛-上理赛点随笔
  • 专访 | 杜普兰蒂斯:爱上中国文化,下一步努力提升速度
  • 民生访谈|支持外贸企业拓内销,上海正抓紧制定便利措施
  • 三大猪企一季度同比均实现扭亏为盈,营收同比均实现增长
  • 临港迎来鸿蒙智行“尚界”整车及电池配套项目,首款车型今秋上市
  • ​关键词看中国经济“一季报”:韧,长期向好看底气
  • 第1现场|无军用物资!伊朗港口爆炸已遇难40人伤1200人