当前位置: 首页 > news >正文

额,收到阿里云给的赔偿了!

众所周知,就在刚过去不久的11月12号,阿里云突发了一次大规模故障,影响甚广。

以至于连咱们这里评论区小伙伴学校的洗衣机都崩了(手动doge)。

这么关键的双11节点,这么多热门业务和产品,这么大规模的崩盘故障,不一会儿这个事情便被推上了热搜。

而就在近日,阿里云官网上就该故障也给出了一份故障复盘报告,而报告中则给出了这次事件的问题原因。

细看一下不难发现,说到底,在代码级还是存在逻辑缺陷问题。当然阿里云在报告中也给出了一系列相应的改进措施:

  • 增加AK服务白名单生成结果的校验及告警拦截能力。
  • 增加AK服务白名单更新的灰度验证逻辑,提前发现异常。
  • 增加AK服务白名单的快速恢复能力。
  • 加强云产品侧的联动恢复能力。

其实当时发生这个事情时,正好是周日的傍晚,当时自己正在家里吃晚饭,所以对于这波故障的直接感受并不明显。

本来对这个事情都没太注意了,不过就在前几天,突然收到了一条来自于阿里云的赔偿短信。

出于好奇,我也登进阿里云的控制台尝试领取了一下。

果然,50很快就到账了(不过是代金券。。)。

而赔偿对象则为阿里云的对象存储OSS服务。

看到这里我才想起来,因为之前自己用的阿里云对象存储OSS来存东西,所以收到这条赔偿短信也就不奇怪了。

不过,它这条短信里所谓的SLA赔偿到底是按照什么标准来的呢?

同样出于好奇,我也看了一下阿里云SLA定义与详细规则。这次的赔偿也是按照不同产品的服务等级协议来划分的。

比如我这次受影响的的使用产品就是阿里云的对象存储OSS,而其对应产品的服务等级协议里也明确规定有具体的赔偿标准。

后台显示当时对象存储OSS的服务可用性为99.9884%。

按照阿里云承诺的当前产品服务可用性不低于99.99%的标准,很明显这就触发赔偿了。

而具体赔付比例按照上面产品服务等级协议里的描述,则来到了10%这个档。

看到这里,我也不禁想起了前段时间语雀的故障赔付,当时语雀的补偿方案是针对个人用户赠送6个月的会员服务。

对于这样类似的赔偿结果,有的用户表示愿意继续给产品一次机会,当然也有用户会表示无法原谅并弃用之。

其实这种长时间、大规模的故障,对于一些重度依赖云产品的用户或者业务来说打击往往是致命的。而这些事后给出的所谓的SLA内的赔偿和客户实际所承担的业务损失来说往往是杯水车薪,压根就覆盖不住,这还不谈客户为此所额外付出的人力物力成本。

因此对于这些云服务商而言,除了赔偿,更重要的还是多研究研究如何加强故障预防和处理,持续提升服务的稳定性和可靠性才是关键。

注:本文在GitHub开源仓库「编程之路」 https://github.com/rd2coding/Road2Coding 中已经收录,里面有我整理的6大编程方向(岗位)的自学路线+知识点大梳理、面试考点、我的简历、几本硬核pdf笔记,以及程序员生活和感悟,欢迎star。

相关文章:

  • 模拟退火算法应用——求解TSP问题
  • 【Python基础】协程(迭代器、生成器、协程、gevent介绍)
  • EASYEXCEL(一)
  • 有一种浪漫,叫接触Linux
  • 面试:ShardingSphere问题
  • 服务器数据恢复—服务器重装系统导致逻辑卷发生改变的数据恢复案例
  • 笔记二十、使用路由Params进行传递参数
  • JAVA文件IO, File类, 字符流,字节流
  • vue+uniapp校园寻物失物招领平台 微信小程序1f6z5
  • 振南技术干货集:znFAT 硬刚日本的 FATFS 历险记(8)
  • nodejs669在线图书借阅管理系统vue前端
  • Matlab进阶绘图第34期—双三角热图
  • 机器学习的复习笔记2-回归
  • springBoot设置多数据源
  • css实现水波纹效果
  • 2024年天津艺术职业学院专升本报名工作的通知
  • python读取PDF文件中的指定页码的范围并存储到指定的文件名
  • Java中的Integer.bitCount浅析
  • 初识JVM(简单易懂),解开JVM神秘的面纱
  • C语言面试之旅:掌握基础,探索深度(面试实战之c语言关键词中篇)
  • 长期对组织隐瞒真实年龄,广元市城发集团原董事韩治成被双开
  • 北外滩集团21.6亿元摘上海虹口地块,为《酱园弄》取景地
  • 蔡达峰:推动食品安全法全面有效实施,为维护人民群众身体健康提供有力法治保障
  • 总奖池超百万!第五届七猫现实题材征文大赛颁奖在即
  • 异域拾异|大脚怪的形状:一项神秘社会学研究
  • 硅料巨亏后弘元绿能割肉求生:逾12亿元内蒙古公司股权转让协鑫