当前位置: 首页 > news >正文

Doris专题1- 什么是Doris

1. 概述

  • 定义:基于 MPP 架构的高性能、实时分析型数据库
  • 特点:高效、简单、统一,亚秒级查询响应
  • 适用场景
    • 高并发点查询
    • 高吞吐复杂分析
    • 报表分析、即席查询、统一数仓构建、数据湖联邦查询加速

2. 发展历程

  • 起源于百度广告报表业务(Palo)
  • 2017年开源,2018年捐赠给Apache基金会
  • 2022年6月成为Apache顶级项目
  • 社区规模:600+贡献者,120+月活跃贡献者

3. 应用现状

  • 全球5000+中大型企业使用
  • 中国互联网Top 50公司中80%长期使用
  • 覆盖金融、电信、制造、能源、医疗、政务等传统行业
  • 主流云厂商均提供托管服务

4. 核心架构

4.1 两种架构模式

  • 存算一体架构

    • Frontend (FE):查询解析、元数据管理、节点管理

    • Backend (BE):数据存储、查询计划执行

    • 角色分工:

      角色功能
      Master元数据读写,通过BDB JE协议同步
      Follower元数据读取,可升级为Master
      Observer元数据读取,提升查询并发,不参与选主
  • 存算分离架构(3.0+)

    • 元数据层:查询解析、元数据管理
    • 计算层:无状态BE节点,弹性伸缩
    • 存储层:S3、HDFS、OSS等共享存储

5. 核心特性

5.1 高可用

  • 多副本存储 + Quorum协议
  • 自动故障隔离
  • 支持同城/异地容灾

5.2 高兼容

  • 完全兼容MySQL协议和语法
  • 支持标准SQL
  • 无缝对接MySQL生态工具

5.3 实时数仓

  • 秒级数据入库
  • 亚秒级查询响应
  • 向量化引擎 + MPP架构 + Pipeline执行引擎

5.4 湖仓一体

  • 外部数据源联邦查询
  • 数据湖与数据仓库无缝集成

5.5 灵活建模

  • 宽表模型、预聚合模型、星型/雪花模型
  • 支持视图、物化视图、实时多表关联

6. 技术特点

6.1 存储引擎

  • 列式存储:高压缩比,减少IO扫描
  • 索引支持
    • Sorted Compound Key Index
    • Min/Max Index
    • BloomFilter Index
    • Inverted Index
  • 存储模型
    • 明细模型 (Duplicate Key Model)
    • 主键模型 (Unique Key Model)
    • 聚合模型 (Aggregate Key Model)

6.2 查询引擎

  • MPP架构:节点间/节点内并行执行
  • 向量化引擎:性能提升5-10倍
  • Pipeline执行引擎:多核并行,减少数据拷贝
  • 优化器:CBO + RBO + HBO 结合

6.3 高级功能

  • 自适应查询执行 (AQE)
  • 运行时过滤 (Runtime Filter)
  • 物化视图(单表自动刷新,多表异步刷新)

7. 生态集成

  • BI工具:Smartbi、DataEase、FineBI、Tableau、Power BI、Superset
  • 数据源:RDBMS、PolarDB、数据湖(Hive、Iceberg、Hudi)
  • 部署方式:本地部署、各大云平台托管服务

8. 总结

Apache Doris作为一款现代实时分析型数据库,凭借其高性能、高兼容、易用性等特性,已成为企业级数据分析的重要选择,特别适合需要实时洞察和复杂分析的业务场景。

http://www.dtcms.com/a/442706.html

相关文章:

  • Linux文件系统---软硬连接
  • 如何建立商城网站拼团小程序制作平台
  • 火车头wordpress建站群网站移动站
  • 【51单片机32个灯,第一次亮1,2。第二次亮2,3。第三次亮3,4。。。。】2023-2-10
  • 【LangChain】P12 LangChain 提示词模板深度解析(三):实例化参数
  • 智能数据交换系统:内涵、架构、优化与发展趋势
  • 手机金融界网站网站单页是什么意思
  • 14.伪修复提交与来自“收容所”的坐标
  • 余姚做网站哪家好北京市工程信息网
  • 如何构建汽车电子与芯片半导体行业的一体化质量堡垒:全星质量管理QMS系统功能分析
  • 常微分方程万能解的形式
  • 专门做美剧的网站咸宁手机网站建设
  • sed使用手册
  • 网站开发搭建ssc p2p 互助做网站第一步做什么
  • 做教育网站有什么好处搜狗推广
  • 成品网站模板源码 网站源码模板 html源码下载
  • Scrapy 框架深度解析:架构、组件与工作流程
  • 网站例子谷歌搜索引擎免费
  • 深圳专业设计网站平台做网站为什么可以自学
  • Ruby CGI 编程
  • 【数形结合】当天先到者等未到者20分钟,见面概率
  • 广州广告制作有限公司优化工具 wordpress
  • 企业网站建设需要费用什么是4c品牌建设模型
  • 专门做简历的网站有哪些网站建设社区交流
  • 网站备案有什么要求吗html5开发手机网站
  • YOLO入门教程(番外):卷积神经网络—图像卷积
  • 上海网站开发开发好的公司网站网站建设考虑要素
  • 有用的LOGO设计集锦
  • web前端学习 langchain
  • 站长工具seo推广 站长工具查询网页设计的主题说明