当前位置: 首页 > news >正文

使用 Couchbase Analytics Service 的典型步骤

下面是使用 Couchbase Analytics Service 的典型步骤,包括部署、配置、创建数据集、运行查询以及监控优化等环节。

首先,您需要安装并启用 Analytics 服务;然后将节点加入集群并重平衡;接着在 Analytics 中映射数据服务的集合(Collections)以创建 Analytics 数据集;随后通过多种接口执行 SQL++ for Analytics 查询;最后通过 Web 控制台或 REST API 监控 Analytics 服务的运行指标,并根据需要进行分区、索引和资源隔离的优化。

1. 安装与部署 Analytics 服务

  1. 下载并安装 Couchbase Server Enterprise Edition(Analytics 是企业版专属功能)
  2. 在 Web 控制台的 ServersAdd Server 中,输入新节点 IP 和管理员凭据,并仅勾选 DataAnalytics 服务;点击 Add Server 完成添加,然后执行 Rebalance (docs.couchbase.com)。
  3. 如果是将已有节点加入集群,可在该节点的 Web 控制台点击 Join Existing Cluster,同样只勾选 DataAnalytics,输入集群信息并 Rebalance (docs.couchbase.com)。
  4. 最终确认集群中已启用 Analytics 服务:在控制台左侧导航栏选择 Analytics,页面应显示 Analytics Dashboard (docs.couchbase.com)。

2. 初始化集群与资源隔离

  • 独立节点:由于 Analytics 查询通常是大规模、长时运行任务,建议将 Analytics 服务部署在专用节点,避免与 Data、Query、Index 等服务争用资源 (docs.couchbase.com)。
  • 节点配置:确保操作系统允许 Analytics 相关进程(如 cbas, cbas-engine 等)访问文件和网络端口,特别是在启用了安全软件或严格安全策略的环境中 (docs.couchbase.com)。

3. 创建 Analytics 数据集(Collections)

  1. 打开 Analytics Workbench(在 Web 控制台的 Data ToolsAnalytics)或使用 REST API/cbq shell 连接至端口 8095(或 18095) (docs.couchbase.com) (docs.couchbase.com)。

  2. 使用 SQL++ DDL 映射您想分析的 Data Service 集合,例如:

    ALTER COLLECTION `travel-sample`.inventory.airportADD ANALYTICS COLLECTION analytics.airport;
    ALTER COLLECTION `travel-sample`.inventory.hotelADD ANALYTICS COLLECTION analytics.hotel;
    

    这会在 Analytics 服务中创建对应的 shadow collections(数据的实时副本),并自动开始 DCP 同步 (docs.couchbase.com)。

  3. 可视化操作:在 Workbench 中也可点击 Map From Data Service Collections,并选择目标 bucket/collection,一键完成映射。

4. 执行分析查询

  • 接口:支持 Analytics Workbench 图形界面、cbq shell 命令行及 REST API 三种方式运行 SQL++ for Analytics 查询 (docs.couchbase.com) (docs.couchbase.com)。

  • 示例验证:可先执行简单测试:

    "It's time for a vacation!";
    

    如能正确返回字符串,说明服务已正常就绪 (docs.couchbase.com)。

  • 常见查询:支持复杂的 join、聚合、分组、排序等操作,适合大规模数据集上的交互式或批量分析 (docs.couchbase.com)。

5. 监控与管理

  1. Analytics 指标:通过 Couchbase REST API 查询 cbas 系列指标(如 cbas_active_links, cbas_direct_memory_used_bytes 等),实时了解并发链接数、内存使用、延迟分区等信息 (docs.couchbase.com)。
  2. Web 控制台 Dashboard:在 Dashboard 页面,选择相关节点和服务,即可查看各类统计图表及报警信息 (docs.couchbase.com)。
  3. 查询历史与审计:Analytics Workbench 会记录所有执行过的查询(不含结果),支持跨会话持久化,便于重现与审计 (docs.couchbase.com)。

6. 性能优化与最佳实践

  • 分区策略:根据数据量和查询模式,合理设置 hash 分区字段,以均衡各节点负载并降低跨节点通信开销 (docs.couchbase.com)。
  • 索引设计:在高频过滤列上创建 secondary index,可大幅提升查询性能;对于 ad hoc 全表扫描场景,可依赖 Analytics 的并行处理优势,无需索引 (docs.couchbase.com)。
  • 资源隔离:将 Analytics 服务部署在独立节点,并分配充足的内存与 CPU 核心,以应对 MPP 处理的高并行度需求 (docs.couchbase.com)。

通过以上步骤,您即可在 Couchbase 集群中成功部署、配置并使用 Analytics 服务,实现对大规模 JSON 数据的实时并行分析。若需进一步了解命令详解或 REST API 参考,请参阅官方文档。

相关文章:

  • [GESP202406 七级] 黑白翻转
  • FAISS(Facebook AI Similarity Search)
  • 单片机-STM32部分:6、不同编程方式-寄存器、标准库、HAL库、LL库
  • Scrapy框架之Scrapyd部署及Gerapy分布式爬虫管理框架的使用
  • MCU缓存架构设计与优化策略
  • MySQL关于锁的面试题
  • 【详细教程】ROC曲线的计算方式与绘制方法详细介绍
  • 基于SeaFormer的YOLOv8性能提升策略—轻量高效注意力模块Sea_AttentionBlock在语义分割中的应用研究
  • 性能比拼: HTTP/2 vs. HTTP/3
  • 【算法】随机快速排序和随机选择算法
  • QT编程练习20250507
  • 【C++】C++中this指针的介绍及使用
  • k8s部署OpenELB
  • RT Thread Studio创建软件和硬件RTC工程
  • ROBOVERSE:面向可扩展和可泛化机器人学习的统一平台、数据集和基准
  • SQL 子查询
  • 如何设置飞书多维表格,可以在扣子平台上使用
  • 《硬件视界》专栏介绍(持续更新ing)
  • Selenium Web自动化测试学习笔记(一)
  • C++命名空间、内联与捕获
  • 第四轮伊美核谈判将于11日在阿曼举行
  • 1450亿元!财政部拟发行2025年中央金融机构注资特别国债(二期)
  • 蔡达峰:推动食品安全法全面有效实施,为维护人民群众身体健康提供有力法治保障
  • 上海:企业招用高校毕业生可享受1500元/人一次性扩岗补助
  • 新疆维吾尔自治区乌鲁木齐市米东区政协原副主席朱文智被查
  • 来论|建设性推进缅北和平进程——中国的智慧与担当