当前位置: 首页 > news >正文

aws 实战小bug

 使用方法

  1. 看到题目 → 先判断场景类别(EC2、S3、RDS、VPC、权限等)

  2. 按表格检查关键点 → 快速写答案

  3. 答案逻辑要写清楚:原因 → 检查点 → 解决办法

  4. 思路不对,重新再来,慢慢来,你可以的


 计算类(EC2 / ECS / Lambda / EKS)

场景常见问题解题思路
EC2 SSH 失败SG 未开 22;无公网 IP;密钥错误检查 SG → 公网 IP → Key Pair → 系统日志
ECS 无法拉取镜像ECR 权限不足;镜像不存在确认 ECR 镜像存在 → 任务执行角色有 ecr:GetAuth 权限
Lambda 无响应Handler 错误;权限不足检查函数入口 → IAM Role → CloudWatch 日志
EKS Pod 无外网NAT 配置错误;SG 拦截确认 Pod 在私有子网 → 路由表指向 NAT → SG 放行

 存储类(S3 / EBS / EFS / Glacier)

场景常见问题解题思路
S3 403 ForbiddenBucket Policy 禁止访问;Block Public Access 打开检查权限策略 → 关闭 Block Public Access → 配置正确的 IAM Role
S3 静态网站打不开没有 index.html;没启用静态托管开启 Static Website Hosting → 确认 index.html 上传
EBS 无法挂载没有挂载点;未格式化检查 lsblkmkfs 格式化 → mount 挂载
EFS 无法访问SG 未开 NFS(2049);挂载点错误SG 放行 2049 → 检查挂载点配置

数据库类(RDS / DynamoDB / ElastiCache)

场景常见问题解题思路
RDS 无法连接SG 未开 3306/5432;子网不通检查 SG → VPC 路由表 → 正确的用户名/密码
DynamoDB 写入失败主键缺失;IAM 权限不足确认主键字段一致 → 检查 dynamodb:PutItem 权限
Redis 无法连接SG 未开 6379;无密码SG 放行 6379 → 检查配置文件 requirepass

 网络类(VPC / NAT / ALB / CloudFront)

场景常见问题解题思路
私有子网无外网NAT Gateway 配置错误确认私有子网路由表指向 NAT → NAT 在公有子网
ALB 无法访问后端Target Group 健康检查失败检查 SG → 健康检查路径 → 目标服务是否监听
VPC Peering 不通路由未配置;CIDR 重叠确认路由表双向配置 → 无 CIDR 冲突
CloudFront 缓存不更新旧缓存未清理执行 Invalidation → 检查缓存策略

安全类(IAM / KMS / Secrets Manager)

场景常见问题解题思路
AccessDeniedIAM 策略缺少权限检查 IAM Policy → Resource ARN → 最小权限原则
AssumeRole 失败Trust Policy 错误检查角色信任关系 → sts:AssumeRole 权限
KMS 解密失败没有 kms:Decrypt 权限IAM Policy 添加解密权限
Secrets Manager 无法获取Lambda 缺少权限为 Lambda 绑定 secretsmanager:GetSecretValue

 监控与运维(CloudWatch / CloudTrail / Config)

场景常见问题解题思路
CloudWatch 告警未触发指标错误;时间窗口太短确认指标(CPU、Network)→ 调整 Evaluation Period
CloudTrail 无日志Trail 未开启;无写入 S3 权限开启全局 Trail → 检查 S3 Bucket Policy
Config 规则不生效资源未纳管确认资源类型在 Config 规则中

冷门场景

  • S3 跨区域复制失败 → 检查版本控制 + IAM 权限

  • Aurora 读写分离异常 → 用错 Endpoint(reader / writer)

  • Lambda 超时 → 默认 3 秒,需要调整 Timeout

  • ECR 镜像过期 → 生命周期策略清理了镜像

  • Route 53 域名解析失败 → 检查记录类型、TTL、是否启用别名

  • Step Functions 执行失败 → 某个 Lambda 无权限

题目:某 AWS 服务出现问题(如 EC2 无法 SSH 登录)
思路

  1. 现象描述:无法 SSH

  2. 可能原因:SG 未开放 22、没有公网 IP、Key Pair 错误

  3. 排查步骤

    • 检查 SG 是否允许 0.0.0.0/0:22

    • 确认实例分配了公网 IP

    • 核对私钥文件权限是否为 400

  4. 解决办法

    • 修改 SG,放行 22

    • 为实例绑定弹性 IP

    • 使用正确的 Key Pair

http://www.dtcms.com/a/393584.html

相关文章:

  • NumPy 系列(一):numpy 数组基础
  • VSCode 的 launch.json 配置
  • OpenLayers地图交互 -- 章节六:范围交互详解
  • 分布式专题——15 ZooKeeper特性与节点数据类型详解
  • 分布式专题——16 ZooKeeper经典应用场景实战(上)
  • Torch-Rechub学习笔记-task2
  • Hadoop分布式计算平台
  • hive调优系列-1.调优须知
  • 爆炸特效:Unity+Blender-01
  • 解决切换 Node 版本后 “pnpm 不是内部或外部命令”问题
  • flag使用错误出现bug
  • 【Kafka面试精讲 Day 20】集群监控与性能评估
  • SQL 注入攻防:绕过注释符过滤的N种方法
  • 微软常用运行库
  • 在Kubernetes(k8s)环境中无法删除持久卷(PV)和持久卷声明(PVC)的解决方案
  • 【连载7】 C# MVC 跨框架异常处理对比:.NET Framework 与 .NET Core 实现差异
  • 芯脉:面向高速接口的SoC架构与完整性设计<3>
  • ArrayList与LinkedList深度对比
  • AI IDE 综合评估:代码能力与上下文连续性深度分析
  • OceanBase备租户创建(一):通过CREATE STANDBY TENANT
  • C++ 多态:从概念到实践,吃透面向对象核心特性
  • ​​如何用 Webpack 或 Vite 给文件名(如 JS、CSS、图片等静态资源)加 Hash?这样做有什么好处?​​
  • QT-数据库编程
  • FastAPI + APScheduler + Uvicorn 多进程下避免重复加载任务的解决方案
  • 数据库造神计划第十八天---事务(1)
  • Docker在Linux中离线部署
  • 面阵vs线阵工业相机的触发方式有什么不同?
  • 【Hadoop】HBase:构建于HDFS之上的分布式列式NoSQL数据库
  • 拉取GitHub源码方式
  • 【国二】【C语言】改错题中考察switch的用法、do while执行条件的用法