当前位置: 首页 > news >正文

阿里云 OceanBase 可观测最佳实践

阿里云 OceanBase

OceanBase 数据库是蚂蚁集团不基于任何开源产品,完全自研的原生分布式关系数据库软件,在普通硬件上实现金融级高可用,具备卓越的水平扩展能力,全球首家通过 TPC-C 标准测试的分布式数据库,单集群规模超过 1500 节点。产品具有云原生、强一致性、高度兼容 MySQL 等特性,承担支付宝 100% 核心链路,在国内几十家银行、保险公司等金融客户的核心系统中稳定运行。

OceanBase 具有数据强一致、高可用、高性能、在线扩展、高度兼容 SQL 标准和主流关系型数据库、低成本等特点。OceanBase 至今已成功应用于支付宝全部核心业务:交易、支付、会员和账务等系统以及阿里巴巴淘宝(天猫)收藏夹和P4P 广告报表等业务。

OceanBase 监控是金融级分布式数据库的“生命体征仪”,只有实时掌握集群、租户、节点、会话四层 5 秒级指标,才能在秒级发现副本漂移、SQL 抖动或节点故障,避免级联雪崩;它直接决定能否兑现“三地五中心”零数据丢失承诺,是业务连续性与合规审计的底线保障。

观测云

观测云是一款专为 IT 工程师打造的全链路可观测产品,它集成了基础设施监控、应用程序性能监控和日志管理,为整个技术栈提供实时可观察性。这款产品能够帮助工程师全面了解端到端的用户体验追踪,了解应用内函数的每一次调用,以及全面监控云时代的基础设施。此外,观测云还具备快速发现系统安全风险的能力,为数字化时代提供安全保障。

采集器配置

  1. 登录观测云控制台
  2. 点击【集成】菜单,选择【云账号管理】
  3. 点击【添加云账号】,选择【阿里云】,填写界面所需的信息,如之前已配置过云账号信息,则忽略此步骤
  4. 点击【测试】,测试成功后点击【保存】,如果测试失败,请检查相关配置信息是否正确,并重新测试
  5. 点击【云账号管理】列表上可以看到已添加的云账号,点击相应的云账号,进入详情页
  6. 点击云账号详情页的【集成】按钮,在未安装列表下,找到阿里云 OceanBase,点击【安装】按钮,弹出安装界面安装即可。

关键指标

指标名描述单位
active_memstore_used当前活跃 MemStore 已使用内存字节
active_session活跃会话数
all_session总会话数
block_cache_hit_ratioBlock Cache 命中率%
block_cache_req_totalBlock Cache 总请求数
block_cache_sizeBlock Cache 大小字节
bloom_filter_cache_hit_ratioBloom Filter Cache 命中率%
bloom_filter_cache_req_totalBloom Filter Cache 总请求数
bloom_filter_cache_sizeBloom Filter Cache 大小字节
client_connections客户端连接数
clog_cache_hit_ratioClog Cache 命中率%
clog_cache_req_totalClog Cache 总请求数
clog_cache_sizeClog Cache 大小字节
clog_trans_log_total_size事务日志总大小字节
cpu_percentCPU 使用率%
io_byteIO 总字节数字节
io_countIO 总次数
io_read读 IO 总字节数字节
io_read_byte读 IO 字节数字节
io_read_count读 IO 次数
io_read_rt读 IO 平均响应时间毫秒
io_read_size读 IO 平均大小字节
io_rtIO 平均响应时间毫秒
io_sizeIO 平均大小字节
io_write写 IO 总字节数字节
io_write_byte写 IO 字节数字节
io_write_count写 IO 次数
io_write_rt写 IO 平均响应时间毫秒
io_write_size写 IO 平均大小字节
load_11 分钟系统负载
location_cache_hit_ratioLocation Cache 命中率%
location_cache_req_totalLocation Cache 总请求数
major_freeze_trigger触发 Major Freeze 次数
memory_buffers缓冲区内存字节
memory_free空闲内存字节
memory_percent内存使用率%
memstore_limitMemStore 上限字节
memstore_percentMemStore 使用率%
memstore_write_lock_fail_countMemStore 写锁失败次数
memstore_write_lock_succ_countMemStore 写锁成功次数
net_recv网络接收字节数字节
net_send网络发送字节数字节
net_throughput网络吞吐量字节/秒
ob_background_waitevent_count后台等待事件数
ob_clog_disk_percentClog 磁盘使用率%
ob_clog_ioClog IO 次数
ob_clog_io_byteClog IO 字节数字节
ob_clog_io_timeClog IO 时间毫秒
ob_clog_io_utilClog IO 利用率%
ob_clog_ls_max_replayed_scn最大回放 SCN
ob_cpu_percentOB CPU 使用率%
ob_data_disk_percent数据磁盘使用率%
ob_data_disk_used_size数据磁盘已用大小字节
ob_data_io数据 IO 次数
ob_data_io_byte数据 IO 字节数字节
ob_data_io_time数据 IO 时间毫秒
ob_data_io_util数据 IO 利用率%
ob_data_required_size数据需求大小字节
ob_host_real_time_iops实时 IOPS次/秒
ob_host_real_time_throughput实时吞吐量字节/秒
ob_no_idle_waiting_time非空闲等待时间毫秒
ob_process_existsOB 进程是否存在布尔
ob_sql_eventSQL 事件数
ob_sql_event_in_parseSQL 解析中事件数
ob_sql_event_in_pl_parsePL 解析中事件数
ob_sql_event_in_plan_cachePlan Cache 中事件数
ob_sql_event_in_px_execution并行执行中事件数
ob_sql_event_in_sequence_load序列加载中事件数
ob_sql_event_in_sql_executionSQL 执行中事件数
ob_sql_event_in_sql_optimizeSQL 优化中事件数
ob_tenant_data_size租户数据大小字节
ob_tenant_disk_used_percentage租户磁盘使用率%
ob_tenant_log_disk_total_bytes租户日志磁盘总大小字节
ob_tenant_log_disk_used_bytes租户日志磁盘已用大小字节
ob_tenant_memory_percent租户内存使用率%
ob_tenant_server_data_size租户在 Server 上的数据大小字节
ob_tenant_server_required_size租户在 Server 上的需求大小字节
ob_waitevent_count等待事件数
ob_worktime工作时间毫秒
opened_cursors_count打开的游标数
plan_cache_hit_ratioPlan Cache 命中率%
plan_cache_sizePlan Cache 大小字节
qps每秒查询数次/秒
qps_rt查询平均响应时间毫秒
request_dequeue_count请求出队数
request_enqueue_count请求入队数
request_queue_time请求排队时间毫秒
row_cache_hit_ratioRow Cache 命中率%
row_cache_req_totalRow Cache 总请求数
row_cache_sizeRow Cache 大小字节
rpc_packet_in入 RPC 包数
rpc_packet_in_rt入 RPC 包平均响应时间毫秒
rpc_packet_out出 RPC 包数
rpc_packet_out_rt出 RPC 包平均响应时间毫秒
server_connectionsServer 连接数
slow_sql_count慢 SQL 数
sql_all_count总 SQL 数
sql_all_rtSQL 平均响应时间毫秒
sql_all_rt_p_90SQL 90分位响应时间毫秒
sql_all_rt_p_95SQL 95分位响应时间毫秒
sql_all_rt_p_99SQL 99分位响应时间毫秒
sql_delete_countDELETE 语句数
sql_distributed_count分布式 SQL 数
sql_insert_countINSERT 语句数
sql_insert_rtINSERT 平均响应时间毫秒
sql_insert_rt_p_90INSERT 90分位响应时间毫秒
sql_insert_rt_p_95INSERT 95分位响应时间毫秒
sql_insert_rt_p_99INSERT 99分位响应时间毫秒
sql_local_count本地 SQL 数
sql_other_count其他 SQL 数
sql_other_rt其他 SQL 平均响应时间毫秒
sql_other_rt_p_90其他 SQL 90分位响应时间毫秒
sql_other_rt_p_95其他 SQL 95分位响应时间毫秒
sql_other_rt_p_99其他 SQL 99分位响应时间毫秒
sql_remote_count远程 SQL 数
sql_replace_countREPLACE 语句数
sql_select_countSELECT 语句数
sql_select_rtSELECT 平均响应时间毫秒
sql_select_rt_p_90SELECT 90分位响应时间毫秒
sql_select_rt_p_95SELECT 95分位响应时间毫秒
sql_select_rt_p_99SELECT 99分位响应时间毫秒
sql_update_countUPDATE 语句数
sql_update_rtUPDATE 平均响应时间毫秒
system_event_commit_count提交类系统事件数
system_event_commit_waites提交类等待事件数
system_event_concurrency_count并发类系统事件数
system_event_concurrency_waites并发类等待事件数
system_event_configuration_count配置类系统事件数
system_event_configuration_time_waites配置类等待事件数
system_event_network_count网络类系统事件数
system_event_network_waites网络类等待事件数
system_event_other_count其他系统事件数
system_event_other_time_waites其他等待事件数
system_event_system_io_count系统 IO 事件数
system_event_system_io_waites系统 IO 等待事件数
system_event_user_io_count用户 IO 事件数
system_event_user_io_waites用户 IO 等待事件数
total_memstore_usedMemStore 总使用量字节
tps每秒事务数次/秒
trans_commit_log_count事务提交日志数
trans_commit_log_sync_rt事务提交日志同步耗时毫秒
transaction_commit_count事务提交数
transaction_commit_rt事务提交耗时毫秒
transaction_count事务总数
transaction_multi_partition_count跨分区事务数
transaction_partition_count事务涉及分区数
transaction_rollback_count事务回滚数
transaction_rollback_rt事务回滚耗时毫秒
transaction_rt事务平均响应时间毫秒
transaction_single_partition_count单分区事务数
transaction_timeout_count事务超时数
uptime运行时长
wait_event_count等待事件总数
wait_event_rt等待事件平均耗时毫秒

场景视图

登录观测云控制台,点击「场景」 -「新建仪表板」,输入 “”, 选择 “阿里云 OceanBase”,点击 “确定” 即可添加视图:

监控器(告警)

观测云内置了监控器模板,可以选择从模版创建监控器,并开启适合业务的监控器以及时通知相关成员关注问题,触发条件、频率等信息可以依据实际业务进行调整。

登录观测云控制台,点击「监控」 -「新建监控器」,输入 “OceanBase”, 选择对应的监控器,点击 “确定” 即可添加。

总结

观测云集成阿里云 OceanBase,实时采集性能、租户、资源等指标与慢查询日志,提供统一可视化监控与告警,助力高效运维。

http://www.dtcms.com/a/552867.html

相关文章:

  • vitest单元测试测试vue中了element项目安装与运行笔记
  • NineData社区版 V4.6.0 正式发布!SQL 窗口新增4个数据源,新增支持OceanBase等多条数据复制和对比链路
  • 仿RabbitMQ实现消息队列(一)--项目介绍
  • 建设网站的法律声明正规赚佣金的平台
  • BUG与测试用例
  • 【spring boot 使用apache poi 生成和处理word 文档】
  • 橙米网站建设做网站查询违章
  • AI用于自动化办公指南
  • 从“手动试错”到“自动化闭环”:实车OTA测试的效率革命
  • 智能电器:重构生活的科技力量
  • OpenAI拟借AI估值重构浪潮冲击1.1万亿美元IPO——基于市场情绪因子与估值量化模型的深度分析
  • redis事务与Lua脚本
  • 【技术选型】前端框架:Vue vs React - 组合式API与Hooks的哲学之争
  • 网站建设网网站建设全网营销客户资源
  • Python 数据可视化:用 Matplotlib 绘制多维度对比图表
  • 【axf文件解析与J-Link通讯实战(五)】PySide6图形界面与数据可视化集成
  • Android 权限管理:适配 Android 14 运行时权限申请(含后台定位)
  • 涡阳网站优化wordpress进入后台空白
  • 【实战案例】火语言 RPA 采集小说站已完结书名(自动翻页判断),保存到Excel 全流程(附完整脚本)
  • 基于微信小程序的背单词系统x1o5sz72(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • 力扣hot100-------11、盛最多水的容器(java版)
  • Visual Basic 菜单编辑器
  • 本地部署轻量级持续集成工具 Drone CI 并实现外部访问
  • gitlab-ci中cicd+helm实现devops自动化部署到k8s
  • 网站欢迎页面怎么做江门建站公司模板
  • 评论回复网站怎么做郑州百度搜索优化
  • Rust开发之使用derive宏自动实现Trait(Clone、Debug)
  • 15. setState的更新是异步的吗
  • Qwen2.5-VL开源,斩获多榜单冠军!
  • Prometheus和Grafana简介