当前位置: 首页 > news >正文

doris:阿里云 MaxCompute

MaxCompute 是阿里云上的企业级 SaaS(Software as a Service)模式云数据仓库。

什么是 MaxCompute

连接 MaxCompute​

示例​

-- 1. 创建Catalog。
CREATE CATALOG mc PROPERTIES (
  "type" = "max_compute",
  "mc.default.project" = "xxx",
  "mc.access_key" = "xxxx",
  "mc.secret_key" = "xxx",
  "mc.endpoint" = "http://service.cn-beijing-vpc.MaxCompute.aliyun-inc.com/api"
);

-- 2. 切换到新创建的Catalog下。
SWITCH mc;

-- 下面的步骤就和使用Mysql一样了。

-- 3. 查看该Catalog下所有的数据库。
SHOW DATABASES;

-- 4. 使用数据库, 这里的xxx为第三步展示出来结果的任意一个数据库。
USE xxx;

-- 5. 查看该数据库下所有的表。
SHOW TABLES;

-- 6. 进行SQL查询。
select * from tb  limit 10;

创建 Catalog 的基本属性​

参数说明
type固定为 max_compute.
mc.default.project想要访问的 MaxCompute 项目名称。可以在 MaxCompute 项目列表 中创建和管理。
mc.access_keyAccessKey。可以在 阿里云控制台 中创建和管理。
mc.secret_keySecretKey。可以在 阿里云控制台 中创建和管理。
mc.endpointMaxCompute 开通的地域。请参照下文的如何获取Endpoint 和 Quota来配置。

创建 Catalog 的可选属性​

参数默认值说明
mc.quotapay-as-you-goQuota 名称。请参照下文的 如何获取Endpoint 和 Quota 来配置。
mc.split_strategybyte_size设置 split 的划分方式,可设置为按照字节大小划分 byte_size 和按照数据行数划分 row_count
mc.split_byte_size268435456每个 split 读取的文件大小,单位为字节,默认为 256MB,当且仅当 "mc.split_strategy" = "byte_size" 时生效
mc.split_row_count1048576每个 split 读多少行,当且仅当 "mc.split_strategy" = "row_count" 时生效

列类型映射​

MaxComputeDoris备注
TINYINTTINYINT
TINYINTTINYINT
SMALLINTSMALLINT
INTINT
BIGINTBIGINT
BINARY不支持
FLOATFLOAT
DOUBLEDOUBLE
DECIMAL(precision,scale)DECIMAL(precision,scale)
VARCHAR(n)VARCHAR(n)
CHAR(n)CHAR(n)
STRINGSTRING
DATEDATE
DATETIMEDATETIME(3)可以通过SET [global] time_zone = 'Asia/Shanghai'来指定时区
TIMESTAMP不支持
TIMESTAMP_NTZDATETIME(6)MaxCompute 的 TIMESTAMP_NTZ 精度为 9, Doris 的 DATETIME 最大精度只有 6,故读取数据时会将多的部分直接截断。
BOOLEANBOOLEAN
ARRAYARRAY
MAPMAP
STRUCTSTRUCT
JSON不支持

使用须知​

  1. 自 2.1.7 版本开始,MaxCompute Catalog 基于 开放存储 SDK 开发。
  2. 开放存储 SDK 的使用有一定的限制,请参照该 文档 中 使用限制 的章节。
  3. MaxCompute 中的 Project 相当于 Doris 中的 DataBase。

如何获取 Endpoint 和 Quota​

  1. 如果您使用数据传输服务独享资源组,请参照该 文档 中 使用独享数据服务资源组 章节中的 2.授权 来开启相应的权限,并在 配额(Quota)管理 列表中,查看并复制对应的 QuotaName,指定 "mc.quota" = "QuotaName"。此时您可以选择 VPC / 公网来访问 MaxCompute,但是走 VPC 的带宽有保障,公网带宽资源小。

  2. 如果您使用按量付费,请参照该 文档 中 使用开放存储(按量付费) 的章节,来开启开放存储 (Storage API) 开关,并给 Ak,SK 对应的用户赋予权限。此时您的 mc.quota 为默认值 pay-as-you-go,不需要额外指定该值。此时您只能使用 VPC 来访问 MaxCompute。

  3. 通过第 1/2 步,您已经知道该如何访问 MaxCompute,下面需要根据 阿里云 Endpoints 文档 中的 地域Endpoint对照表 来配置 mc.endpoint 。使用 VPC 访问的用户,需要根据 各地域Endpoint对照表(阿里云VPC网络连接方式) 表中的 VPC网络Endpoint 列来配置 mc.endpoint 。使用公网访问的用户,可以选择 各地域Endpoint对照表(阿里云经典网络连接方式) 表中的 经典网络Endpoint 列、或者选择 各地域Endpoint对照表(外网连接方式) 表中的 外网Endpoint 列来配置 mc.endpoint

相关文章:

  • 菜鸟开发之MySQL常见字段值处理
  • 代码社区开源协议
  • QWEN2.5_0.5 微调生成文件目录
  • 重构及封装
  • 【高并发】高速将图片提交到flask、fastapi等主流服务框架
  • 【学习笔记】【AI医生】2-4 项目详细分析及DeepSeek适用场景
  • QT系列教程(18) MVC结构之QItemSelectionModel模型介绍
  • 使用 MyBatis-Plus 实现数据库的多租户管理
  • NineData 社区版正式上线,支持一键本地化部署
  • Git前言(版本控制)
  • 深度学习系列79:Text2sql调研
  • LiveCommunicationKit OC 实现
  • Java开发者如何接入并使用DeepSeek
  • 【设计模式】掌握建造者模式:如何优雅地解决复杂对象创建难题?
  • 【JavaWeb学习Day23】
  • 网络-五大拓扑结构
  • 设计模式之建造者模式:原理、实现与应用
  • P8683 [蓝桥杯 2019 省 B] 后缀表达式
  • 鸿蒙应用开发—数据持久化之SQLite
  • 数据库SQL的配置和练习题
  • 1309家县医院已达到三级医院能力,还有哪些短板要补?
  • 上海国际电影电视节 | 奔赴电影之城,开启光影新程
  • “集团结婚”:近百年前革新婚俗的尝试
  • 这个东西每道菜里都有,却可能让你得一身病,做好这些能避免
  • 交响4K修复版《神女》昨晚上演,观众听到了阮玲玉的声音
  • 以色列在加沙发起新一轮强攻,同步与哈马斯展开无条件谈判