当前位置: 首页 > news >正文

mysql实时同步到es

测试了多个方案同步,最终选择oceanu产品,底层基于Flink cdc
1、实时性能够保证,binlog量很大时也不产生延迟
2、配置SQL即可完成,操作上简单

下面示例mysql的100张分表实时同步到es,优化备注等文本字段的like查询

创建SQL作业

CREATE TABLE from_mysql (
  id int,
  cid int NOT NULL,
  gid bigint NOT NULL,
  content varchar,
  create_time TIMESTAMP(3)  ,
  PRIMARY KEY (id) NOT ENFORCED
) WITH (
  'connector' = 'mysql-cdc',
  'hostname' = 'mysql-ip',
  'port' = '3306',
  'username' = 'mysqluser',
  'password' = 'mysqlpwd',
  'database-name' = 'mysqldb',
  'debezium.snapshot.locking.mode' = 'none',
  'table-name' = 'tb_test[0-9]?[0-9]',
  'server-id' = '100-110',
  'server-time-zone' = 'Asia/Shanghai',
  'debezium.skipped.operations' = 'd',
  'debezium.snapshot.mode' = 'schema_only',
  'debezium.min.row.count.to.stream.results' = '50000'
);

CREATE TABLE to_es (
  id string,
  tableid int,
  tablename string,
  cid int NOT NULL,
  gid string NOT NULL,
  content string,
  create_time string,
  PRIMARY KEY (id,companyId) NOT ENFORCED
) WITH (
   'connector.type' = 'elasticsearch', 
   'connector.version' = '7', 
   'connector.hosts' = 'http://ip:9200',
   'connector.index' = 'myindex',
   'connector.document-type' = '_doc',
   'connector.username' = 'elastic',
   'connector.password' = 'password123',
   'update-mode' = 'upsert',
   'connector.key-delimiter' = '$',
   'connector.key-null-literal' = 'n/a',
   'connector.failure-handler' = 'retry-rejected',
   'connector.flush-on-checkpoint' = 'true',
   'connector.bulk-flush.max-actions' = '10000',
   'connector.bulk-flush.max-size' = '2 mb',
   'connector.bulk-flush.interval' = '2000',
   'connector.connection-max-retry-timeout' = '300',
   'format.type' = 'json'
);

INSERT INTO to_es
SELECT
concat(CAST(id as string),'-',CAST(mod(cid,100) AS VARCHAR)) as id, 
id tableid,
tablename,
cid,
gid,
content,
DATE_FORMAT(create_time, 'yyyy-MM-dd HH:mm:ss') as create_time
from from_mysql

这里主要注意字段类型
scan.startup.mode:“initial”(默认,同步历史数据),“latest-offset” 同步增量数据
最后insert可以加where,只同步需要的行数据

es配置

配置好mapping、setting和自己的分词器

使用自字义分词是因为字段中所有涉及的标点符号、空格等都可以来检索

PUT myindex-20230314/
{ 
  "mappings": {
    "properties": {
      "id":{
        "type": "text"
      },
      "tableid":{
        "type": "long"
      },
      "cid":{
        "type": "long"
      },
      "gid":{
        "type": "text",
    "analyzer": "my_analyzer"
      },
      "content":{
        "type": "text",
    "analyzer": "my_analyzer"
      },
			"create_time" : {
          "type" : "keyword"
        }
    }
  },
  "settings": {
    "index":{
      "number_of_shards": "10",
      "number_of_replicas": "1",
      "refresh_interval" : "1s",
      "translog": {
        "sync_interval": "30s",
        "durability": "async"
      },
      "codec": "best_compression",   
    "analysis": {
      "analyzer": {
        "my_analyzer": {
          "tokenizer": "my_tokenizer",
          "filter": [
            "lowercase"
          ]
        }
      },
      "tokenizer": {
        "my_tokenizer": {
          "type": "ngram",
          "min_gram": 1,
          "max_gram": 2,
          "token_chars": [
            "letter",
            "digit","whitespace","punctuation","symbol"
          ]
        }
      }
    }
    }
  }
}

使用别名,方便后续的维护

 POST /_aliases
{
    "actions": [
        { "add":    { "index": "myindex-20230314", "alias": "myindex" }}
    ]
}

之前测试的

  • canal单进程延迟越来越大,单独配置历史数据同步
  • go-mysql-elasticsearch经常报错重新同步
  • logstash同步100张分表不知道怎么配置

oceanus是收费的对于运维人员不足的情况,可以参考,有精力的可以考虑flink。

相关文章:

  • 介绍一下Promise
  • 基于ffmpeg+openGL ES实现的视频编辑工具(一)
  • 鸿蒙与跨端迁移的重要性
  • Day15-后端Web实战-登录认证——会话技术JWT令牌过滤器拦截器
  • 扣子(coze)-又又又又又又进行了计费规则调整
  • C语言04
  • [NKU]C++基础课(五)补充:结构体
  • 邮件安全之发件人伪造
  • stm32单片机个人学习笔记15(I2C通信协议)
  • 如何在本地和服务器新建Redis用户和密码
  • 用《软件方法》引导AI全流程高效开发
  • SpringMVC的基本使用
  • Linux性能监控工具汇总
  • Java——this关键字
  • Python爬虫系列教程之第十二篇:爬虫异常处理与日志记录
  • 14、《SpringBoot+MyBatis集成(2)——进阶配置XML与注解的灵活运用》
  • 25年2月通信基础知识补充:多普勒频移与多普勒扩展、3GPP TDL信道模型
  • 使用JWT实现微服务鉴权
  • HbuilderX如何运行到手机模拟器,安卓模拟器
  • 玩机日记 12 群晖部署AList并配置SSL,安装opkg,使用rclone挂载到本地
  • 如何查看域名以前是做什么网站的/优化关键词排名的工具
  • 有域名后怎么建网站/今晚赛事比分预测
  • 青岛栈桥介绍/肇庆百度快照优化
  • 网站服务器设置地点/线上推广网络公司
  • 佛山哪家网站建设比较好/如何推广自己的产品
  • 周口网站制作公司哪家好/怎么被百度收录