当前位置: 首页 > news >正文

强杀服务、重启系统及断电对 TDengine 影响

在这里插入图片描述

  1. 背景介绍

最近发现 TDengine 企业用户及社区论坛用户中都有反馈服务器断电后导致 TDengine 无法启动的问题,服务器突然断电对 TDengine 影响有多大,这里做了个专业的测试, 让你能够了解到断电对 TDengine 的影响。

  1. 测试方案

在有大量数据写入及查询的情况下,制造异常,异常后启动 TAOSD 服务,检查 TAOSD 服务是否能够正常启动,并通过日志文件查找是否有损坏的文件及是否进行了修复行为。

异常主要分两大类:

1)非物理断电异常

  • 杀 taosd 进行(kill taosd)
  • 强杀 taosd 进行 (kill -9 taosd)
  • 操作系统重启(reboot 命令)
  • 点击关机按钮关机后再启动

2)物理断电异常

使用定时断点插座,每10 分钟掐断电源一次

  1. 测试数据及结论
  • 整体数据:

    分类操作实验次数TAOSD 无法启动是否有文件损坏文件修复成功率
    非物理断电强杀 taosd 进程246 次0 次7 次100%
    系统重启(reboot)579 次0 次0 次-
    物理断电掐断电源177 次12 次56 次78%

    测试结论:
    1)物理断电是造成文件损坏及导致 TAOSD 无法启动的主要原因
    2)非物理断电造成的文件损坏基本都能自修复
    3)系统重启是一个有通知的退出行为,几乎不会造成文件损坏

  • 物理断电场景下文件损坏:

    序号损坏文件类型实验次数损坏次数损坏率修复成功次数修复成功率
    1WAL 文件1773520%2983%
    2WAL meta-ver 文件17710.5%00%
    3VNODE 下 current.json 文件17752.8%00%
    4VNODE 下 .head .data .stt 文件17752.8%240%
    5ROCKDB 文件17731.6%00%

    测试结论:
    1)文件损坏和写文件频次正相关,WAL 文件写频次最高,损坏也最高
    2)WAL 文件损坏修复率最高,剩下类型文件除 .head 与.data 可互修外,其它很难自修复

说明:

1)次数是指一次实验中或有多个文件损坏,仍计为一次
2)修复是指程序自动修复,非人工修复

  1. 无法启动解决方案

当有文件损坏时, TAOSD 是无法启动的,可分为以下几个场景解决:

  • 数据为价值重要数据:联系涛思技术人员尝试人工修复
  • 数据丢一些也能接受:尝试备份受损文件后删除
  • 数据是测试数据,可清空数据目录即可启动 TAOSD

TAOSD 无法启动后会在日志中记录损坏文件位置及名称,可确定损坏的是什么文件。

注意:通过删除受损文件的方式可能会导致一部分数据丢失的现象。

  1. 避免方案

导致文件损坏的主要原因是服务器突然断电,如果机房供电不稳,可通过成熟的 UPS 方案来保证,若没有这个条件,也可以通过购买带有服务器断电后可回写缓存数据的硬盘来解决。

  1. 总结
  • 非物理断电的软异常,如强杀 TDengine 服务、系统重启等,磁盘都有机会把缓存中数据落盘,所以造成文件损坏的概率不大,即使产生了,也是有预期内的不完整,能够自我修复好。
  • 物理断电,造成的影响会比较大,往往文件损坏的结果无预期,很多情况下无法自我修复,造成 TAOSD 服务无法启动。
  • 为了避免故障,建议尽可能提供稳定的机房电源,或增加 UPS 备用电源设备,也可以使用带断电保护的磁盘来减小故障的产生。

关于 TDengine

TDengine 专为物联网IoT平台、工业大数据平台设计。其中,TDengine TSDB 是一款高性能、分布式的时序数据库(Time Series Database),同时它还带有内建的缓存、流式计算、数据订阅等系统功能;TDengine IDMP 是一款AI原生工业数据管理平台,它通过树状层次结构建立数据目录,对数据进行标准化、情景化,并通过 AI 提供实时分析、可视化、事件管理与报警等功能。

http://www.dtcms.com/a/617857.html

相关文章:

  • Odoo 19 制造与会计集成深度解析报告
  • 免费网站软件正能量医院网站建设方案计划书
  • 软件架构趋势:云原生与大模型的融合与重塑
  • 做网站会员登陆长春网站运做思路
  • 排序java
  • Substance 3D Stager:电商“虚拟摄影”工作流
  • 实验题辅导
  • 【Python TensorFlow】BiTCN-BiLSTM双向时间序列卷积双向长短期记忆神经网络时序预测算法(附代码)
  • 番禺制作网站平台邢台123信息网
  • 网页制作软件有那些石家庄seo网站排名
  • 高级边界扫描 --6-- Silicon Nail测试调试
  • Linux 序列化技术、自定义协议实现及守护进程
  • 【Javaweb学习|黑马笔记|Day5】Web后端基础|java操作数据库
  • ArcGIS地统计综合实战 | 洛杉矶臭氧浓度预测-pretict-pretictable-pretiction
  • 【Agent零基础入门课程】告别黑盒:HelloAgents架构深度解析
  • PyTorch 零基础入门:从张量到 GPU 加速完全指南
  • Gradient Accumulation (梯度累积) in PyTorch
  • C++ 哈希表 常用接口总结 力扣 1. 两数之和 每日一题 题解
  • 百度云可以做网站吗wordpress文学模版
  • 数据库高可用架构-分表分库
  • C# 1116 流程控制 常量
  • ASC学习笔记0022:在不打算修改属性集时访问生成的属性集
  • 国外简约企业网站大连做环评网站
  • 【实际项目3】C#把文件夹中的RGB图片变为Gray图片
  • 学习C#调用OpenXml操作word文档的基本用法(7:Style类分析-5)
  • 【微服务】【Nacos 3】 ② 深度解析:AI模块介绍
  • 湖州网站seowordpress页面重定向
  • 10场景思考:OLAP系统在监控中的作用
  • 数据结构之二叉树-链式结构(下)
  • 云南省建设考试中心网站长春自助建站软件