当前位置: 首页 > news >正文

Apache Cloudberry 亮相 2025 IvorySQL 生态大会暨 PostgreSQL 高峰论坛

6 月 27 日至 28 日,IvorySQL 2025 生态大会暨 PostgreSQL 高峰论坛在泉城济南顺利召开。本届大会由 IvorySQL 开源数据库社区主办、瀚高基础软件股份有限公司承办,吸引了来自国内外的数据库技术专家、开发者与开源爱好者齐聚一堂,聚焦数据库内核优化、AI 融合、云原生架构、开源生态共建等前沿议题,为全球开源从业者奉献了一场产业技术盛宴。

会上,两位 Apache Cloudberry PPMC 成员——酷克数据研发 VP 杨瑜与酷克数据开源负责人王殿进,分别围绕 Cloudberry 的内核技术演进与全球化开源协作实践,分享了最新进展与深度洞察。

延续与突破:基于 PostgreSQL 的下一代 MPP 数据仓库
在「引擎之心:PostgreSQL 及衍生内核深度探索与前瞻」分论坛中,Apache Cloudberry PPMC 成员、酷克数据研发 VP 杨瑜带来了《基于 PostgreSQL 的新一代 MPP 数据仓库》演讲。

Apache Cloudberry 由最初的 Greenplum 核心团队发起,目前在 Apache 基金会孵化中,是下一代基于开源 PostgreSQL 内核打造的 MPP(大规模并行处理)数据仓库。 在内核层面,Cloudberry 基于 PostgreSQL 14.4,通过内核级优化与创新,进一步释放了 PostgreSQL 的通用性与灵活性,支撑复杂 OLAP 场景下的大规模分布式查询。作为 Cloudberry 的核心贡献者,酷克数据在持续推动项目发展的同时,基于其开源功能推出了多项增强特性,尤其在以下领域实现突破:

向量化执行引擎:已覆盖 Scan、Join、Agg 等多种算子,通过 SIMD 并行与 PAX(行列混合存储格式),显著提升了 CPU 利用率和 I/O 吞吐(筹备开源阶段)。
动态并行执行(Dynamic DOP):可根据数据量和查询复杂度实时调整并发度,避免传统 MPP 系统的可扩展性瓶颈。
数据湖和流处理融合:通过 Data Lake Connector 无缝对接 Iceberg、Hudi 等主流湖格式,直读对象存储中的 Parquet、ORC,减少冗余 ETL,结合 Flink CDC、Kafka_fdw 支持近实时数据同步。(部分开源)
安全合规层面:已实现包括 SM2、RSA、SM4、AES 等加解密算法、透明数据库加密(TDE)、集中认证等多项企业级能力,使得产品安全性达到金融与电信的行业级别要求。
“Cloudberry 不仅是 Greenplum 的延续,更是 PostgreSQL 在分布式场景下的一次进化与补全。” 杨瑜表示,“我们坚持‘上游优先’,持续将核心特性回馈社区,期望用可持续的开源演进,连接全球开发者与企业用户。”

杨瑜还介绍了 Apache Cloudberry 社区发展路线图,如升级 Cloudberry 内核由 PostgreSQL 14.4 到 16 版本,完善 ORCA 优化器、支持更多并行算子,实现物化视图在外部表场景下的可用性;支撑大规模向量搜索与推理,服务 LLM 时代企业的快速增长需求。

社区共建:开源协作的本地化与全球化新样本
在由Apache Cloudberry PPMC 成员/HashData 开源负责人王殿进出品的「源力聚桥:开源协作的全球化实践与人才破壁」分论坛中,王殿进分享了《PostgreSQL 本地化实践:原生语言项目贡献之路》,结合十余年一线开源社区经验,探讨了 “代码之外”的开源贡献路径。

PostgreSQL 作为一个近 30 年历史的国际化项目,其 NLS(原生语言支持)对于全球范围内非英语用户至关重要,但长期被低估。Cloudberry 团队在持续向上游贡献内核特性的同时,也有效推动了 PostgreSQL NLS 中文语言项目的工作进展。

王殿进强调:“开源从来不只是写代码,每个人都能找到适合自己的切入口,参与 NLS 中文翻译是有意向参与 PostgreSQL 贡献的社区成员最容易参与的贡献方式,但其价值常被忽视。”

结语
从内核技术创新到全球化社区协作,酷克数据正以稳健开放的方式,携手全球开发者共建 Apache Cloudberry 社区。我们深知“上游优先(Upstream First)”的价值,Cloudberry 社区的成长不仅在于自身发展,更在于积极推动 PostgreSQL 上游生态的繁荣。开源不仅是代码的共享,更是全球开发者间技术信任网络的编织与持续协作。正是这无数看似微小却不可或缺的努力相互连接,共同驱动着数据库技术的不断进步。

http://www.dtcms.com/a/268529.html

相关文章:

  • c# Process.Start异常解决办法
  • 【一起来学AI大模型】支持向量机(SVM):核心算法深度解析
  • 支持向量机(SVM)在心脏MRI分类(心肌病检测)中的应用与实现
  • 最简单的实验室资产管理系统,使用Flask,mysql,html(四、知识补充)
  • C++学习笔记01(自学草稿)
  • 【用 Scapy 实现一个简单的局域网 MAC 地址扫描工具】
  • 20250707-2-第二章:Kubernetes 核心概念-K8s集群架构,生产部署K8s两_笔记
  • 环路滤波:精密ADC时钟系统的相位噪声净化器
  • 源码推送到gitee码云仓库
  • stm32--SPI原理应用W25Q64(二)
  • 国产时序数据库 TDengine:Docker 部署、协议端口及 DBeaver 连接全攻略
  • JVM系列五:字节码与执行引擎深度解析
  • uniapp运行项目到ios基座
  • WebRTC 双向视频通话
  • LeetCode 面试题 02.02. 返回倒数第 k 个节点
  • Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频质量评估与智能修复(337)
  • Kettle + 大数据实战:从数据采集到分布式处理的完整流程指南
  • Kafka生产者的初始化
  • Angular V20 新特性
  • QML TextEdit组件
  • 【BFS】 P10864 [HBCPC2024] Genshin Impact Startup Forbidden II|普及+
  • 使用3.20.3版本的protoc编译proto2和proto3
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(四十一) -> 获取自定义编译参数
  • 百度开源文心 4.5 系列开源大模型 GitCode 本地化部署,硅基流动:文心 vs. DeepSeek vs. Qwen 3.0 深度测评
  • 【apply from: “$flutterRoot/packages/flutter_tools/gradle/flutter.gradle“作用】
  • 云计算领域“XaaS”是什么?
  • 使用CocoaPods集成第三方SDK - 从零开始完整指南
  • 开源 C# .net mvc 开发(七)动态图片、动态表格和json数据生成
  • H3初识——入门介绍之路由、路由元数据
  • Maven 依赖管理中的 <optional> 与 <scope>标签