SnowPro Core Certification
Snowflake正式进入中国市场,作为一款划时代的企业数据平台产品,笔者有幸在工作中使用。
同时打算考一下SnowPro Core认证,该认证包含了Snowflake大量基础支持。在这里,记录一些比较难记的考点。
Snowflake不同Edition的区别
功能项 | Standard Edition | Enterprise Edition | Business Critical Edition | VPS Edition |
---|---|---|---|---|
Column-Level Security(列级安全) | ❌ 不支持 | ✅ 支持动态数据掩码与 External Tokenization | ✅ | ✅ |
Row-Level Security(行级安全) | ❌ | ✅ | ✅ | ✅ |
Object Tagging(对象标签) | ❌ | ✅ | ✅ | ✅ |
Time Travel 数据回溯 | 最多 1 天 | 最多 90 天(可配置) | 最多 90 天 | 最多 90 天 |
Fail-safe 时长 | 7 天 | 7 天 | 7 天 | 7 天 |
PHI 数据支持(HIPAA/HITRUST) | ❌ | ❌ | ✅(需签署 BAA) | ✅ |
账户故障转移(Failover)与恢复(Failback) | ❌ | ❌ | ✅ | ✅ |
完全隔离环境(硬件隔离) | ❌ | ❌ | ❌ | ✅ |
External Tokenization(外部令牌化) | ❌ | ✅ | ✅ | ✅ |
差分隐私(Differential Privacy) | ❌ | ✅ | ✅ | ✅ |
安全视图(Secure Views) | ✅ | ✅ | ✅ | ✅ |
多因子认证(MFA) | ✅ | ✅ | ✅ | ✅ |
SSO / 联邦认证 | ✅ | ✅ | ✅ | ✅ |
Snowflake里的预设时间时长
配置项 | 默认值 | 说明 |
---|---|---|
Query Result Retention in Worksheets | 保存至用户会话结束 | 查询结果在 Snowsight 中保留直到用户关闭会话或刷新页面。Classic Console 中也类似。 |
Query Result Cache TTL | 24 小时 | 查询结果缓存默认保留 24 小时,只要底层数据未更改。 |
Time Travel 保留时间 | 1 天(Standard Edition)最多 90 天(Enterprise 及以上) | 可用于恢复误删数据或查看历史版本。 |
Fail-safe 保留时间 | 7 天(所有版本) | Snowflake 内部用于灾难恢复,用户无法直接访问。 |
Statement Timeout(查询超时) | 172,800 秒(即 2 天) | 默认查询最大运行时间,超过则自动取消。可通过 STATEMENT_TIMEOUT_IN_SECONDS 参数修改。 |
Session Idle Timeout | 无限制(默认不超时) | 会话默认不会因空闲而自动断开,但管理员可设置 SESSION_IDLE_TIMEOUT_IN_SECONDS 。 |
Warehouse Auto-Suspend | 10 分钟 | 默认在空闲 10 分钟后自动挂起,可自定义。 |
Warehouse Auto-Resume | 启用 | 默认启用自动恢复,查询触发时自动唤醒仓库。 |
Max Concurrent Queries per Warehouse | 无限制 | Snowflake 会自动调度资源,理论上无硬性限制,但性能受限于虚拟仓库大小。 |
Max Columns per Table | 1,600 列 | 表中最多可定义 1600 个列。 |
Max Characters per VARCHAR | 16 MB | 单个 VARCHAR 字段最大可存储约 16MB 字符。 |
Max File Size for COPY INTO | 16 GB(压缩后) | 单个文件最大支持 16GB 压缩数据。 |
其他
🧮 查询与资源管理
Query Result Cache TTL:24 小时
Statement Timeout 默认值:172800 秒(2 天)
Auto-Suspend 默认值:10 分钟(可设置最短 5 分钟)
Auto-Resume 默认启用
最小计费单位:1 分钟,之后按秒计费
📁 数据加载与共享
Snowpipe:自动数据加载,按事件计费
Stage 类型:Internal、External(S3、Azure Blob、GCS)
Data Sharing:无需复制数据即可共享,支持跨账户
Cloning:零复制克隆,支持数据库、表、Schema 等
🧪 开发与扩展功能
UDF 类型:SQL UDF、JavaScript UDF、External Functions
Tasks:定时或依赖触发的自动化任务
Streams:变更数据捕获(CDC)
Materialized Views:预计算视图,自动刷新
📊 管理与监控
Account Usage Schema:查询资源使用情况
Information Schema:查询元数据
Resource Monitors:设置预算限制,防止超支
Warehouses 支持并发查询:自动调度,无硬性限制