当前位置: 首页 > wzjs >正文

电商网站架构设计今天三亚最新通知

电商网站架构设计,今天三亚最新通知,php网站开发教程,绍兴柯桥建设局网站1. 项目背景 AWS的官方文档,关于Glue和Vpc配置部分已经比较旧了,按照官方文档配置的流程始终跑不通,花了一番时间和波折后,才终于完整的跑通了。 在数据分析和商业智能(BI)领域,我们常需要将存…

1. 项目背景

AWS的官方文档,关于Glue和Vpc配置部分已经比较旧了,按照官方文档配置的流程始终跑不通,花了一番时间和波折后,才终于完整的跑通了。

在数据分析和商业智能(BI)领域,我们常需要将存储在 Amazon S3 上的原始数据加载到 Amazon Redshift Serverless,进行清理和转换后,再导入 Amazon QuickSight 进行可视化分析。本文将介绍如何使用 AWS Glue 读取 S3 文件,上传数据到 Redshift,并导出到 QuickSight,同时解决 VPC 访问问题

2. 架构流程

  1. 数据存储:S3 作为数据源,存放 CSV、JSON 或 Parquet 文件。

  2. 数据 ETL:Glue 读取 S3 数据,转换格式后上传到 Redshift。

  3. 数据分析:Redshift 存储清洗后的数据,提供 SQL 查询能力。

  4. 可视化展示:QuickSight 连接 Redshift 进行数据分析。

  5. VPC 配置:Redshift 运行在私有子网,需要 VPC 连接让 Glue 和 QuickSight 访问它。

    AWS整体流程配置顺序:

    配置VPC --> 创建 Redshfit 的IAM  --> 创建含Glue读写权限的IAM --> 创建Redshift 命名空间         --> 创建Glue任务  --> Quicksight 创建VPC配置 --> 读取Redshift

3. 详细操作步骤

3.1  VPC配置 (最重要的一个环节) 

  创建VPC: 其他选项按照默认的配置,手动开启DSN设置。(或者直接使用默认的VPC)

创建子网,互联网网关,子网和路由按照默认的做配置,之后自己需要再手动配置路由,所有的配置的时候下拉框都选择刚刚创建的VPC

路由需要加入0.0.0.0/0 igw,才能访问公网  (如果使用默认VPC,此处需要确认,没有的话手动加一下)

配置网络ACL,入站和出站规则:

然后再点击子网关联,编辑子网,把创建的子网加入进去

创建一个安全组,把所有流量都配置到源为安全组名称自己的配置上

终端节点,添加vpce-svc-0704d47ebfd5f32fc,s3,redshift,sts,kms, secretsmanager,这几个都必须要,缺一不可。

3.2  创建 Amazon Redshift Serverless 集群

  1. 登录 AWS 控制台,进入 Amazon Redshift Serverless控制面板。

  2. 创建工作组,配置需注意:

  3. Performance and cost controls:选择基本容量

    • RPU选择这个地方是大坑,天坑,一定要慎重选择,默认值是128, 一定要根据自己的数据大小看清楚合适的配置。(一个 RPU 提供 16 GB 内存),如果配置太高,哪怕只是执行简单一条查询,每次都按配置的RPU进行搜索计费。
      Amazon Redshift Serverless 的计算容量     Amazon Redshift Serverless 的计费

    • 网络和安全:选择配置的VPC,或者默认VPC,选择 私有子网

    • 安全组:选择一个自定义的安全组,记住名称,这个安全组后面还需要做一些配置

    • 增强型 VPC 路由:打开

    • IAM

  4. 创建表结构:写sql创建,例如:

    CREATE TABLE zyytest1 (id INT PRIMARY KEY,test_f1 VARCHAR(255),create_time TIMESTAMP
    );

    3.3  在 S3 上传数据

     在 S3 上传数据 zyytest1__max__3.json

    [{"id":5, "test_f1": "test_value_6", "create_time": "2025-03-26T10:00:06"},{"id":7, "test_f1": "test_value_7", "create_time": "2025-03-26T10:00:07"},{"id":8, "test_f1": "test_value_8", "create_time": "2025-03-26T10:00:08"}
    ]

    3.4  配置 AWS Glue 读取 S3 数据并上传到 Redshift

            3.4.1  创建 Glue VPC网络

             进入 AWS Glue 控制台,选择 Connections > Create connection

              选择Network --> next --> 选择3.1 里搭建的VPC,子网,安全组,保存default_vpc。创建完之后状态是ready就是正常的。

            3.4.2  创建 Glue 数据连接

                    进入 AWS Glue 控制台,选择 Connections > Create connection。

                    选择redshift --> 填写name:redshift-dev,把刚刚创建的redshift用户名命名填写上,保存后显示Ready,就是正常的可用状态。

    如果配置完不可用,可以点击这个Test connection  来测试连接是否正常

            3.4.3  创建 Glue Visual 

            点Visual ETL,选择S3,配置路径后,先查看schema是否正确

    配置完之S3的路径之后,可以在左下角看到schema

     正确的话进行下一步,选择Redshift,配置数据库连接,查看数据库表的schema是否正确。

           

    这个IAM记得配置上,就可以看到数据库的schema,在左下角。

    然后点击Script,可以看到图形化的配置生成的Script,并且可以在这个Script上,用python脚本更改配置。

    到这一步就证明VPC和Redshift的数据库都通了,接下来就可以摸索按照自己的需要,选择用图形化的方式配置更合适,或者用脚本的方式更合适了。

    配置完保存之后运行一遍,成功的话,在redshift查询下是否完整存入,如果缺少数据,需要手动指定schema。

            3.4.4  如果查询失败,再检查下IAM配置,选择合适的策略 
                    
            3.4.5  Job details 检查配置

    3.5 配置QuickSight VPC 

    点击右上角管理Quicksight --> 管理VPC链接 --> 添加VPC链接,把3.1配置的vpc,子网,安全组附加上去

    3.6 配置 Amazon QuickSight 访问 Redshift

    找到数据集 --> 新数据集 --> Redshift手动连接 ,选择刚刚创建的vpc,配置redshift的数据库账号密码,点击验证连接,验证通过后,创建数据源

    点击分析,新分析,创建界面化的表格,进行DIY。

    4. 总结

    • AWS Glue 负责从 S3 读取数据,转换后写入 Redshift

    • VPC 配置 解决 Glue 和 QuickSight 无法访问 Redshift 的问题。

    • QuickSight 连接 Redshift 进行 数据可视化

    通过该流程,我们可以自动化数据管道,实现从 S3 -> Glue -> Redshift -> QuickSight 的完整数据流,为企业 BI 提供高效的数据分析能力! 🚀

    参考链接:

    AWS Glue官方文档

    http://www.dtcms.com/wzjs/782216.html

    相关文章:

  5. 网站建设营改增wordpress 分类页id
  6. 用插件做网站可信网站认证有什么用
  7. 外贸建站推广公司wordpress素材下载源码
  8. excel如何做超链接网站超市建网站
  9. 学校网站模板注意事项如何让百度抓取网站
  10. 网站建设需要多久深圳平台型网站建设公司
  11. 信息门户网站制作wordpress shell
  12. 网站电脑基础培训班国际知名平面设计网站
  13. 毕业设计网站开发实施步骤做动画合成的视频网站
  14. 远程教育网站建设方案wordpress 自定义文章列表
  15. 重庆seo网站设计didv WordPress
  16. 制作app连接网站汕头推广平台
  17. 网站推广上首页国内做的比较好的协会网站
  18. 和政网站建设邢台网站制作多少钱
  19. 制作网站建网站wordpress onclick
  20. c网站建设为什么有的网站点不开
  21. 网站续费申请郑州发布最新消息今天
  22. 外贸网站分类asp网站访问量大
  23. 在百度里面做个网站怎么做的做网站能力介绍
  24. 唯品会官网一家做特卖的网站怎样进行网站开发
  25. 郑州做网站远辰网页制作学习
  26. 福州网站开发招聘重庆百度搜索优化
  27. 小型网站开发语言python基础教程网易
  28. 焦作 做 网站秦皇岛建设网
  29. 做网站 视频外链卡盟网站怎么做图片大全
  30. 淄博网站建设报价怎么查网站的域名备案价格
  31. 深圳网站建设推广优化免费创建属于自己的网站
  32. 网站怎么添加代码做网站要钱吗
  33. 游戏开发网站建设福建建设执业资格注册管理中心网站
  34. 外国人做的汉字网站2022年今天新闻联播