当前位置: 首页 > news >正文

只做男士衬衫的网站建设网站公司怎么分工

只做男士衬衫的网站,建设网站公司怎么分工,商标设计软件生成器,广州骏域网站建设专家 V物联网海量数据湖分析架构(推荐实践) ┌──────────────┐ │ IoT设备端 │ └──────┬───────┘│(MQTT/HTTP)▼ ┌──────────────┐ │ EMQX等 │ 可选(也可…

物联网海量数据湖分析架构(推荐实践)

┌──────────────┐
│   IoT设备端   │
└──────┬───────┘│(MQTT/HTTP)▼
┌──────────────┐
│    EMQX等     │   可选(也可设备直接接Kafka/MQ)
└──────┬───────┘│(MQTT→Kafka Bridge)▼
┌──────────────┐
│    Kafka     │   ★ 数据总线,高并发缓冲与削峰
└──────┬───────┘││(流式消费)▼
┌────────────────────────┐
│   Flink/Spark Streaming │   ★ 流/批处理,数据清洗、聚合、分桶分区、批量落盘
│   (写数据湖/OSS)      │
└──────┬───────────┬─────┘│           ││           ││(7天内热数据) │(数据湖分区归档)▼           ▼
┌──────────────┐   ┌────────────────────────────┐
│   MongoDB    │   │    OSS/S3/MinIO 数据湖区    │
│(短期热数据)│   │  Parquet/ORC分区批量归档存储│
└──────────────┘   │(如year=2025/month=05/…)   │└────────────┬───────────────┘│┌───────────────┴──────────────┐▼                              ▼Trino/Presto/StarRocks             离线分析/可视化★ 分布式SQL分析引擎直接查OSS湖区(支持中位数、P95、聚合统计)

架构分层说明与选型理由

1. 采集层

  • IoT设备端 → EMQX(可选)→ Kafka
  • 负责承接海量并发,Kafka做主消息缓冲和削峰,方便后端弹性扩容。

2. 计算与写入层

  • Flink/Spark Streaming
  • 实时消费Kafka消息,数据预处理、格式校验、异常数据隔离。
  • 批量写入MongoDB(仅7天热数据)用于短期API查询。
  • 按时间/设备等分区批量归档到OSS/数据湖(Parquet/ORC格式),实现低成本无限扩容。

3. 存储层

  • MongoDB

    • 只保存近7天热数据,满足实时接口和最新查询需求。
    • 定期自动清理过期数据,降低成本。
  • OSS/S3/MinIO(数据湖区)

    • 主存储,Parquet/ORC分区存储全部历史数据,适用于大批量聚合分析。
    • 按时间、设备等多级分区,检索效率高。

4. 分析与服务层

  • Trino/Presto/StarRocks

    • 直接用SQL连接OSS数据湖,支持max/min/avg/median/p95/窗口聚合等分析。
    • 支持多用户高并发大规模历史数据查询,完全无需再将OSS数据批量倒回MongoDB。
  • 可选:离线分析/BI可视化工具

    • 如Superset、Tableau,连接Trino等实现数据报表和大屏。

核心优势

  • 超强弹性:Kafka、Flink、OSS/数据湖全部可横向扩容。
  • 冷热分层、成本低:MongoDB只做热数据,OSS承担所有归档数据,节省高性能数据库资源。
  • 超强分析能力:Trino/Presto等支持SQL直查海量历史,聚合/分位点分析性能极佳,毫无压力。
  • 开发和运维简单:如同MyBatis查MySQL一样用SQL查数据湖,逻辑简单,技术栈成熟。

数据湖分区和存储规范举例

  • 存储格式:Parquet(列式存储,压缩高效,分析性能好)

  • 分区策略

    oss://iot-data-bucket/iot_data/year=2025/month=05/day=20/device_id=xxxx/part-xxxxx.parquet
    

    或简单时间分区+字段过滤

  • 每条数据内容

    device_idtsparam_aparam_b
    xxx0012025-05-20 10:01:2312.38.6
    xxx0022025-05-20 10:01:2415.47.8

查询范例(以Trino为例)

SELECTdate_trunc('minute', ts) AS minute,avg(param_x) AS avg_value,max(param_x) AS max_value,min(param_x) AS min_value,approx_percentile(param_x, 0.5) AS median_value,approx_percentile(param_x, 0.95) AS p95_value
FROMhive.iot_data
WHEREdevice_id = 'your_device_id'AND ts BETWEEN TIMESTAMP '2025-05-19 00:00:00'AND TIMESTAMP '2025-05-19 23:59:59'
GROUP BYdate_trunc('minute', ts)
ORDER BYminute;

常见问题解答

  • OSS数据能实时查吗?
    通常数据归档延迟可做到分钟级,Trino等SQL引擎查OSS/MinIO的数据几乎是实时的,性能远超传统数据库聚合。

  • Java应用如何查?
    和查MySQL一样,用Trino/Presto的JDBC驱动发SQL即可,不需要自研复杂代码。

  • 如果业务刚迁移,原有MongoDB接口怎么办?
    前7天热数据照常查MongoDB,历史分析走SQL数据湖即可,两者可并行平滑过渡。


补充:核心技术选型

场景推荐组件
消息中间件Kafka
流式处理Flink/Spark Streaming
热数据缓存MongoDB
数据湖/归档存储OSS/S3/MinIO + Parquet
SQL分析Trino/Presto/StarRocks
BI与报表Superset/Tableau等
http://www.dtcms.com/a/583370.html

相关文章:

  • 麦德龙网站建设目标网站页面布局用什么做
  • 3.1、Python-列表
  • 网站设计师培训做网站域名怎么选有利于seo
  • 餐饮网站建设方案书炫客网站建设
  • ABB RobotStudio许可功能premium不可用(从布局创建系统不成功)解决办法
  • 网站设置反爬虫的主要原因建筑网格布是用什么材料
  • 滕州网站建设 助企网络做相册网站logo
  • 潍坊网站建设 世纪环球16楼大航母网站建设在哪里
  • 九江网站网站建设兰州网站制作要多少钱
  • 东莞做网站公司首选高端建站方案
  • 一个人是否可以做公司网站把公司建设成为 现代化企业
  • 2025-11-07 ZYZ28-NOIP模拟赛-Round3 hetao1733837的record
  • 零知IDE——STM32F407VET6驱动SHT40温湿度传感器与ST7789实现智能环境监测系统
  • 中国人做的比较好的shopify网站公司网页怎么关闭
  • 大语音模型有什么作用和特点
  • 网站建设公司的市场定位专业的移动网站建设公
  • wordpress 选择插件南昌网络排名优化
  • wordpress 注册 密码专业搜索引擎seo公司
  • mipi dsi图像
  • 网站开发合作意向协议书房产信息网网站
  • 企业管理网站建设wordpress 熊掌
  • 深度学习入门:基于Python的理论与实现(理论研究)
  • 网站开发合同样本兴义网站建设网站建设
  • 网站的常用建设技术有哪些网站建设义乌
  • 360元网站建设链接搜索引擎
  • Visual Studio Installer Projects 打包msi程序
  • 如何自己做网站站长廊坊关键词排名
  • 哪里做网站比较号万江区网站建设公司
  • 金州网站建设做网站字体要求
  • 三维技术 + AI 动画,焕活古镇科技人文新表达,天南文化助力 2025 年世界互联网大会乌镇峰会