简介
NVIDIA cuBB SDK 提供了基于 GPU 加速的 5G 信号处理流水线,其中包括用于 L1 PHY 的 cuPHY 和用于 L2 调度器的 cuMAC,通过将所有处理保持在高性能 GPU 内存中,实现了前所未有的吞吐量和效率。
Aerial cuBB 是软件定义的、可扩展的、模块化的、高度可编程且云原生的,无需任何固定功能加速器。它使生态系统能够灵活采用其商业产品所需的模块。
Aerial cuBB 具有以下关键组件:
以下是来自 Aerial cuBB “Getting Started”页面的中文翻译:
启动入门(Getting Started)
Aerial cuBB 将 5G 和 AI 框架的 Aerial 软件与 NVIDIA 加速计算平台融合,为电信运营商提供 TCO 降低机制,并解锁基础设施货币化能力。
Aerial cuBB 文档内容结构
下表列出了 Aerial cuBB 开发者文档中不同部分的说明。
| 文档部分 | 描述 |
|---|
| 产品简介(Product Brief) | 深入探讨了 Aerial cuBB 所支持的标准和配置。 |
| 版本说明(Release Notes) | 概述了 Aerial cuBB 最近版本在功能与配置上的变更。 |
| 安装指南(Installation Guide) | 描述如何安装 Aerial cuBB。 |
| 快速开始(Quickstart) | 描述如何运行 cuBB 软件示例。 |
| 集成指南(Integration Guide) | 提供与 CUDA RAN MAC 调度器控制平面(cuMAC-CP)和 NVIPC 消息标准相关的参考信息。 |
| 开发者指南(Developer Guide) | 提供 cuPHY 库软件栈的参考信息。 |
产品简介(Product Brief)
本节包含对 Aerial cuBB 所支持的标准和配置的深入探讨。
cuPHY 功能概览
本节概述了 cuPHY 中支持的功能。
支持的功能
Aerial CUDA-Accelerated RAN 第 1 层(Layer 1)
Aerial CUDA-Accelerated RAN 遵循 3GPP Release 15 标准规范,为 gNB 提供所需的第 1 层能力。
3GPP Release 15
Aerial cuPHY 遵循 3GPP Release 15 标准规范,为 gNB 的第 1 层提供如下能力:
整体 PHY 能力包括:
-
传输信道上的错误检测,并向高层进行指示
-
传输信道的 FEC 编码 / 解码
-
混合 ARQ(HARQ)软合并
-
将编码后的传输信道进行速率匹配到物理信道
-
将编码后的传输信道映射到物理信道
-
物理信道的功率加权
-
物理信道的调制与解调,包括:
- 频率和时间同步
- 无线电特性测量并向高层指示
- 多输入多输出(MIMO)天线处理
- 发射分集(TX diversity)
- 数字与模拟波束成形
- 射频(RF)处理
PHY 前传接口(PHY FH Interface)
Aerial CUDA-Accelerated RAN PHY 整体能力
功能特性
| 功能 | 配置 | 支持情况 |
|---|
| 标准支持 | 3GPP 5G NR Rel 15 | P |
| 双工方式 | TDD | Y |
| 窄带带宽(MHz) | 30 MHz, 40 MHz, 50 MHz, 80 MHz | P |
| 信道带宽(MHz) | 100 MHz | Y |
| 子载波间隔(kHz) | 30 kHz | Y |
| 最大子载波数(最大 RB 数 × 每 RB 子载波数)= 273 × 12 | 3276 | Y |
| 下行波形 | CP-OFDM | Y |
| 上行波形 | CP-OFDM | Y |
| DFT-s-OFDM(数据和控制) | Y |
| 可配置为 DFT-s-OFDM(数据和控制) | Y |
| 下行 SU-MIMO 层数 | 最多 4 层 | Y |
| 上行 SU-MIMO 层数 | 1, 2 | Y |
发射天线数(物理天线)
接收天线数(物理天线)
时隙格式
| 项目 | 配置 | 支持 |
|---|
| 时隙格式 | DDDSUUDDDD,S = 6:4:4(DL:G:UL) | Y |
载波聚合
| 项目 | 配置 | 支持 |
|---|
| 载波聚合 | 可配置组件载波 | Y |
| 可配置 BWP 数 | 最多 4 个 | Y |
BBU-RRU 分拆选项
最大下行吞吐(单用户,4T4R 配置)
最大上行吞吐(单用户,4T4R 配置)
TS 38.211 数字体系、物理资源、调制、序列、信号生成
Aerial CUDA-Accelerated RAN PHY 数字体系(Numerologies)
数字体系:普通循环前缀(Normal CP)
| 数字体系(μ) | 配置 | 支持 |
|---|
| μ = 0 | SCS = 15 kHz,14 符号/时隙,10 时隙/帧,1 时隙/子帧,Normal CP | N |
| μ = 1 | SCS = 30 kHz,14 符号/时隙,20 时隙/帧,2 时隙/子帧,Normal CP | Y |
| μ = 2 | SCS = 60 kHz,14 符号/时隙,40 时隙/帧,4 时隙/子帧,Normal CP | N |
| μ = 3 | SCS = 120 kHz,14 符号/时隙,80 时隙/帧,8 时隙/子帧,Normal CP | N |
| μ = 4 | SCS = 240 kHz,14 符号/时隙,160 时隙/帧,16 时隙/子帧,Normal CP | N |
数字体系:扩展循环前缀(Extended CP)
| 数字体系(μ) | 配置 | 支持 |
|---|
| μ = 2 | SCS = 60 kHz,12 符号/时隙,40 时隙/帧,4 时隙/子帧,Extended CP | N |
Aerial CUDA-Accelerated RAN PHY 整体物理资源
| 功能 | 支持 |
|---|
| 天线端口 | Y |
| 资源栅格 | Y |
| 资源单元(RE) | Y |
| 资源块(RB) | Y |
| 公共资源块(CRB) | Y |
| 物理资源块(PRB) | Y |
| 虚拟资源块(VRB) | Y |
带宽部分(BWP)
Aerial CUDA-Accelerated RAN PHY 物理资源 – BWP
- BWP 用于动态调整 UE 工作的载波带宽和数字体系。
- 一个 BWP 是在给定载波上、给定数字体系 μᵢ 下的一组连续公共资源块的子集。
- 一个 UE 在上行和下行方向最多可配置 4 个 BWP。
| 功能 | 说明 | 支持 |
|---|
| BWP | 动态调整 UE 所在载波的带宽与数字体系;BWP 是在某一载波上、数字体系 μᵢ 对应的一组连续 CRB 子集;UE 在 UL/DL 最多可配置 4 个 BWP | Y |
| 默认启动配置不使用 BWP,可在小区 OOS 状态下按载波启用 BWP | N | |
| 默认启动配置不使用 BWP,可在启动时按载波启用 BWP | N | |
Aerial CUDA-Accelerated RAN 整体载波聚合
| 功能 | 描述 | 支持(仿真) |
|---|
| 载波聚合 | 在多小区上进行传输,可支持带内与带间配置 | Y |
| 100 MHz | 最多 2 个小区聚合(1CC, 2CC) | Y |
| 最多 4 个小区聚合(1CC, 2CC, 3CC, 4CC) | Y |
| 窄带载波聚合(Z MHz) | 可配置最多 4 个组件载波 | Y |
Aerial CUDA-Accelerated RAN PHY 调制映射器
调制方式
| 调制方式 | 支持 |
|---|
| π/2 BPSK | Y |
| BPSK | Y |
| QPSK | Y |
| 16QAM | Y |
| 64QAM | Y |
| 256QAM | Y |
Aerial CUDA-Accelerated RAN PHY 序列生成
| 功能 | 描述 | 支持 |
|---|
| 序列生成 | 伪随机序列生成;泛用伪随机序列由长度为 31 的 Gold 序列定义 | Y |
| 低 PAPR 序列生成 类型 1 | | Y |
| 低 PAPR 序列生成 类型 2 | | Y |
OFDM 基带信号生成(上行 DFT-S-OFDM)
| 功能 | 配置 | 支持 |
|---|
| 信号生成 | 除 PRACH 和 RIM-RS 之外的所有信道;预计由 RU 支持 | |
| PRACH | 预计由 RU 支持 | |
| RIM-RS | 预计由 RU 支持 | |
上行波形
TS 38.211 信道
Aerial CUDA-Accelerated RAN 物理总体信道与参考信号
类别:下行信道(TX)
| 项目 | L1 要求 | 支持 |
|---|
| PDSCH 处理 | PDSCH processing | Y |
| PDCCH 处理 | PDCCH processing | Y |
| PBCH 处理 | PBCH processing | Y |
下行信号(TX)
| 信号 | 支持 |
|---|
| PDSCH 的 DMRS | Y |
| PDCCH 的 DMRS | Y |
| PBCH 的 DMRS | Y |
| PSS, SSS | Y |
| CSI-RS, TRS | Y |
| PT-RS | N |
下行物理资源
| 项目 | 描述 | 支持 |
|---|
| 天线端口 | PDSCH 使用从 1000 起始的天线端口 | Y |
| PDCCH 使用从 2000 起始的天线端口 | Y |
| CSI-RS 使用从 3000 起始的天线端口 | Y |
| SS/PBCH 块使用从 4000 起始的天线端口 | Y |
类别:上行信道(RX)
| 项目 | L1 要求 | 支持 |
|---|
| PUSCH 处理 | Y | |
| PUCCH 处理 | Y | |
| PRACH 处理 | Y | |
上行信号(RX)
| 信号 | 支持 |
|---|
| PUSCH 的 DMRS | Y |
| PUCCH 的 DMRS | Y |
| SRS | Y |
| PT-RS | N |
上行物理资源
| 项目 | 描述 | 支持 |
|---|
| 天线端口 | 0 起始:用于 PUSCH 及其解调参考信号 | Y |
| 1000 起始:用于 SRS | Y |
| 2000 起始:用于 PUCCH | Y |
| 4000:用于 PRACH | Y |
Aerial CUDA-Accelerated RAN 信道总体 – PUSCH(物理上行共享信道)
| 功能 | 配置 | 支持 |
|---|
| 码字数 | 1 | Y |
| 扰码(Scrambling) | | Y |
调制方式
| 调制 | 支持 |
|---|
| π/2-BPSK | Y |
| QPSK | Y |
| 16QAM | Y |
| 64QAM | Y |
| 256QAM | Y |
PUSCH 变换预编码模式
| 项目 | 配置 | 支持 |
|---|
| Transform precoding 禁用 | Disable | Y |
| Transform precoding 启用 | Enable | Y |
预编码
HARQ 进程
| 项目 | 配置 | 支持 |
|---|
| HARQ 进程数 | = 1 | Y |
| 最大 HARQ 进程数 | = 16 | Y |
映射与分配
| 功能 | 配置 | 支持 |
|---|
| 映射到虚拟资源块(VRB) | | Y |
| VRB 到 PRB 映射类型 | 非交织 | Y |
| 交织 | N |
传输模式
| 模式 | 配置 | 支持 |
|---|
| SU-MIMO | 最多 4 层 | Y |
| MU-MIMO | 最多 8 层 | Y |
PUSCH DMRS CDM group without data
每 TTI PUSCH 用户数
上行算法
| 功能 | 支持 |
|---|
| UL HARQ 控制 | Y |
| UL 信道估计 LS | Y |
| 均衡器:MRC, MMSE | Y |
| 均衡器:IRC, MMSE | Y |
| 频偏校正(FOC) | Y |
速率匹配
| 参数 | 描述 | 支持 |
|---|
| I_LBRM = 1 | 限制缓冲(Limited Buffer Rate Matching) | Y |
| I_LBRM = 0 | 限制缓冲(Limited Buffer Rate Matching) | Y |
Aerial CUDA-Accelerated RAN 信道总体 – PUCCH(物理上行控制信道)
Format
| 功能 | 配置 | 支持 |
|---|
| UCI 调度编码、AFC、DFT(Format 1) | | N |
调制方式
调度请求 SR
Group hopping
| 配置 | 支持 |
|---|
| neither(都不启用) | Y |
| disable | Y |
| enable | Y |
序列循环移位
频域跳频
| 类型 | 描述 | 支持 |
|---|
| 时隙内频域跳频 / 第二跳 PRB | 支持 | Y |
| 时隙间频域跳频 / 第二跳 PRB | 支持 | Y |
多时隙 PUCCH
| 项目 | 配置 | 支持 |
|---|
| PUCCH 跨多个时隙 | 时隙数 = 2, 4, 8 | N |
频偏校正
| 项目 | 配置 | 支持 |
|---|
| 频偏校正 | PUCCH Format 1, 3 | N |
多 UE 支持
PUCCH UCI HARQ-ACK Polar 编码
| 参数 | 配置 | 支持 |
|---|
| codeblock 大小 | CB size < 359,lift size = 8 | Y |
Aerial CUDA-Accelerated RAN 信道总体 – PRACH(PHY 随机接入信道)
| 功能 | 配置 | 支持 |
|---|
| Format A1 | | N |
| Format A2 | | N |
| Format A3 | | N |
| Format B1 | | N |
| Format B2 | | N |
| Format B3 | | N |
| Format B4 | | Y |
| Format C0 | | N |
| Format C2 | | N |
| Format 0 | | N |
| Format 1 | | N |
| Format 2 | | N |
| Format 3 | | N |
子载波间隔(kHz)
序列循环移位
前导长度
每 TTI PRACH 机会数
随机接入类型
| 项目 | 配置 | 支持 |
|---|
| 基于竞争的随机接入 | | Y |
| 非竞争基随机接入可配置 | | N |
Aerial CUDA-Accelerated RAN UL 参考信号(总体)
PUSCH
| 信号 | 配置 | 支持 |
|---|
| PUSCH DMRS 序列生成(transform precoding 禁用) | | Y |
| PUSCH DMRS 序列生成(transform precoding 启用,既不启用 group hopping 也不启用 sequence hopping) | | Y |
| 启用 group hopping,禁用 sequence hopping | Y |
| 启用 sequence hopping,禁用 group hopping | Y |
PUSCH DMRS 映射到物理资源
| 配置 | 支持 |
|---|
| DM-RS 配置类型 1 | Y |
| DM-RS 配置类型 2 | N |
| UL-DMRS-max-len = 1 | Y |
| UL-DMRS-max-len = 2 | Y |
| UL-DMRS-add-pos = 0 | Y |
| UL-DMRS-add-pos = 1 | Y |
| UL-DMRS-add-pos = 2 | Y |
| UL-DMRS-add-pos = 3 | Y |
PUSCH PTRS(相位跟踪参考信号)
| 配置 | 支持 |
|---|
| transform precoding 未启用 – 序列生成 | N |
| transform precoding 已启用 – 序列生成 | N |
| transform precoding 禁用 – 资源映射 | N |
| transform precoding 启用 – 资源映射 | N |
PUCCH
| 信号 | 配置 | 支持 |
|---|
| PUCCH Format 1 的 DMRS(无时隙内跳频) | | Y |
| PUCCH Format 1 的 DMRS(启用时隙内跳频) | | Y |
| PUCCH Format 2 的 DMRS | | Y |
| PUCCH Format 3 的 DMRS(Format 4 不支持) | 无额外 DM-RS,无跳频 | Y |
| 无额外 DM-RS,有跳频 | Y |
| 有额外 DM-RS,无跳频 | Y |
| 有额外 DM-RS,有跳频 | Y |
SRS
SRS 资源
| 配置 | 支持 |
|---|
| Antenna ports = 1, 1 OFDM 符号 | Y |
| Antenna ports = 1, 2 OFDM 符号 | Y |
| Antenna ports = 1, 4 OFDM 符号 | Y |
| Antenna ports = 2, 1 OFDM 符号 | Y |
| Antenna ports = 2, 2 OFDM 符号 | Y |
| Antenna ports = 2, 4 OFDM 符号 | Y |
| Antenna ports = 4, 1 OFDM 符号 | Y |
| Antenna ports = 4, 2 OFDM 符号 | Y |
| Antenna ports = 4, 4 OFDM 符号 | Y |
SRS 序列生成
| 配置 | 支持 |
|---|
| KTC = 2 | Y |
| KTC = 4 | Y |
| KTC = 8 | Y |
SRS 映射到物理资源
SRS 时隙配置
| 配置 | 描述 | 支持 |
|---|
| SRS 时隙 | 通过高层参数 SRS-Config 指示 | Y |
PTRS
Aerial CUDA-Accelerated RAN 信道总体 – PDSCH(PHY 下行共享信道)
调制方式
| 调制 | 支持 |
|---|
| QPSK | Y |
| 16QAM | Y |
| 64QAM | Y |
| 256QAM | Y |
传输模式
| 模式 | 配置 | 支持 |
|---|
| 4T4R SU-MIMO | 最多 4 层 | Y |
| 64T64R MU-MIMO | 最多 16 层 | Y |
码字数
天线端口数
物理天线数
波束成形权重计算
预编码
| 配置 | 支持 |
|---|
| 非码本预编码(non-codebook) | Y |
| 预编码权重 | Y |
| Type I 单面板码本 | N |
| Type I 多面板码本 | N |
| Type II 码本 | N |
| Type II 端口选择码本 | N |
PDSCH 映射类型
资源分配类型
| 类型 | 说明 | 支持 |
|---|
| Type 0 | 仅 4T4R | Y |
| Type 1 | | Y |
VRB–PRB 映射类型
PDSCH DMRS CDM groups without data
每 TTI PDSCH 用户数
功率控制
Aerial CUDA-Accelerated RAN 信道总体 – PDCCH(物理下行控制信道)
CORESET
| 项目 | 配置 | 支持 |
|---|
| CORESET | Normal | Y |
| RMSI CORESET | | Y |
SSB – RMSI CORESET 复用模式
聚合级别(Aggregation Level)
调制方式
层映射 / 天线端口映射 / VRB 映射
| 功能 | 支持 |
|---|
| 层映射 | Y |
| 天线端口映射 | Y |
| 映射到 VRB | Y |
| VRB 到 PRB(非交织) | Y |
极化码(Polar code)
DMRS(PDCCH)
| 功能 | 配置 | 支持 |
|---|
| DMRS 序列生成 | m-sequence | Y |
| DMRS 映射到物理资源 | | Y |
CCE–REG 映射类型
CORESET OFDM 符号数
功率控制
DCI Format
| Format | 支持 |
|---|
| 0_0 | NA |
| 0_1 | NA |
| 1_0 | NA |
| 1_1 | NA |
| 2_x | NA |
预编码
| 功能 | 描述 | 支持 |
|---|
| 预编码 | 基于 Precoding Matrix Idx 的 DU 侧预编码 | Y |
Aerial CUDA-Accelerated RAN 信道总体 – PBCH(物理广播信道)
Scrambling
| 配置 | 支持 |
|---|
| SS/PBCH block index Lmax = 4 | N |
| SS/PBCH block index Lmax = 8 | N |
| SS/PBCH block index Lmax = 64 | N |
调制
映射到物理资源
DMRS 支持
| 项目 | 配置 | 支持 |
|---|
| DMRS | 支持 | Y |
| DMRS 配置类型 | Type 1 | Y |
| Type 2 | N |
| DMRS Type A 位置 | Pos2, Pos3 | Y |
| DMRS 最大长度 | 1, 2 | Y |
| DMRS 额外位置 | Pos0, Pos1, Pos2, Pos3 | Y |
Aerial CUDA-Accelerated RAN – PHY 下行参考信号(DL)
PDSCH
| 功能 | 配置 | 支持 |
|---|
| PDSCH DMRS 序列生成 | | Y |
| PDSCH DMRS 映射到物理资源 | DM-RS 配置类型 1 | Y |
| DM-RS 配置类型 2 | N |
| DL-DMRS-max-len = 1 | | Y |
| DL-DMRS-max-len = 2 | | Y |
| DL-DMRS-add-pos = 0/1/2/3 | | Y |
PDSCH PTRS 映射
| 配置 | 支持 |
|---|
| LPT-RS = 1 | N |
| LPT-RS = 2 | N |
| LPT-RS = 4 | N |
PDCCH
| 功能 | 配置 | 支持 |
|---|
| PDCCH DMRS 序列生成 | | Y |
| PDCCH DMRS 映射到物理资源 | | Y |
PBCH
| 功能 | 配置 | 支持 |
|---|
| PBCH DMRS 序列生成 | | Y |
| PBCH DMRS 映射到物理资源 | | Y |
CSI 参考信号
CSI-RS 序列生成
| 配置 | 描述 | 支持 |
|---|
| nID | 等于高层参数 ScramblingID | Y |
CSI-RS 映射到物理资源(Row 1–18)
- Row 1: 1 端口, Density = 3, CDMtype = No CDM – Y
- Row 2: 1 端口, Density = 1, 0.5, CDMtype = No CDM – Y
- Row 3: 2 端口, Density = 1, 0.5, CDMtype = FD-CDM2 – Y
- Row 4: 4 端口, Density = 1, CDMtype = FD-CDM2 – Y
- Row 5: 4 端口, Density = 1, CDMtype = FD-CDM2 – Y
- Row 6: 8 端口, Density = 1, CDMtype = FD-CDM2 – Y
- Row 7: 8 端口, Density = 1, CDMtype = FD-CDM2 – Y
- Row 8: 8 端口, Density = 1, CDMtype = CDM4 (FD2, TD2) – Y
- Row 9–18: 各种更高端口数与 CDM 组合 – N
RIM
| 功能 | 配置 | 支持 |
|---|
| RIM-RS 通用 | 第一种类型 RIM-RS 可用于承载信息 | N |
| 第二种类型依配置而定 | N |
| RIM-RS 序列生成 | | N |
| RIM-RS 映射到物理资源 | | N |
| RIM-RS 配置 | Enough indication 禁用 / 启用 | N / N |
定位参考信号(Positioning Reference)
所有 LPRS / Kcomb 配置项均为 N。
同步信号(Synchronization Signals)
| 功能 | 配置 | 支持 |
|---|
| SSB 数字体系 | 30 kHz | Y |
| SSB 预编码 | 支持 | Y |
| SSB burst 集合 | 单一 burst set 内 2 个 SS block | Y |
同步信号生成与映射
| 项目 | 描述 | 支持 |
|---|
| PSS 生成及映射 | | Y |
| SSS 生成及映射 | | Y |
| SS/PBCH block 内 PSS 映射 | Y | |
| SS/PBCH block 内 SSS 映射 | Y | |
| SS/PBCH block 内 PBCH 与 DM-RS 映射 | Y | |
| SS/PBCH block 的时频结构与时间位置 | Y | |
TS 38.212 复用与信道编码
Aerial CUDA-Accelerated RAN – 复用与信道编码总体
通用过程
| 功能 | 配置 | 支持 |
|---|
| CRC 计算 | CRC 长度 6, 11, 16, 24 全部支持 | Y |
| 码块分段与码块 CRC 附加 | Polar / LDPC | Y |
传输信道到物理信道映射 – UL
| 映射 | 支持 |
|---|
| UL-SCH → PUSCH | Y |
| RACH → PRACH | Y |
| UCI → PUCCH, PUSCH | Y |
传输信道到物理信道映射 – DL
| 映射 | 支持 |
|---|
| DL-SCH → PDSCH | Y |
| BCH → PBCH | Y |
| PCH → PDSCH | Y |
| DCI → PDCCH | Y |
信道编码方案
| 功能 | 支持 |
|---|
| Polar 编码 | Y |
| LDPC 编码 | Y |
| 小块长信道编码 | Y |
速率匹配
| 项目 | 支持 |
|---|
| Polar 码速率匹配 | Y |
| LDPC 码速率匹配 | Y |
| 小块长编码速率匹配 | Y |
码块拼接
- 通过顺序拼接各码块的速率匹配输出实现
- 支持 LDPC / Polar
上行传输信道与控制信息
| 功能 | 支持 |
|---|
| 随机接入信道 | Y |
| 上行共享信道(含 LDPC graph 选择、速率匹配、码块拼接、数据信令复用) | Y |
| 上行控制信息(PUCCH/PUSCH) | Y |
下行传输信道与控制信息
| 功能 | 支持 |
|---|
| 广播信道 | Y |
| 下行共享信道与寻呼信道 | Y |
| 下行控制信息(DCI 格式、CRC 附加、信道编码) | Y |
| PUCCH 上 UCI 复用(符合 38.212 – 6.3.1.1) | Y |
TS 38.213 控制用物理层过程
Aerial CUDA-Accelerated RAN – PHY 控制过程总体
UE 过程(不适用于基站)大部分标记为 NA,不再逐条翻译,保留 “NA”。
PHY RACH
| 类别 | 要求 | 支持 |
|---|
| Type-1 随机接入过程 | L1 要求 | Y |
| Type-2 随机接入过程 | L1 要求 | N |
UCI 在 PUSCH 上的报告
| 项目 | 要求 | 支持 |
|---|
| UCI 短块码 | 输入 1–11 bit,输出 32 bit | Y |
| UCI 比特复用到 PUSCH | CSI part 1 最大 48 bit | Y |
| CSI part 1+2 最大 48 bit | Y |
| UCI-on-PUSCH 缩放(带数据/不带数据) | 0.5/0.65/0.8/1 | N |
| HARQ 信息长度最大 128 | | Y |
| Semi-static offset | | N |
| Dynamic offset | | N |
UCI 在 PUCCH 上的报告
全部为 N。
BWP Operation
| 项目 | 要求 | 支持 |
|---|
| BWP 数量 | 可配置最多 4 个 | Y |
| PDCCH Type0 CSS 相关 CORESET 资源设置与监控参数 | 各频段与 SCS 组合 | N(全部 N) |
| IAB / 双栈切换 | | N |
TS 38.214 数据用物理层过程
Aerial CUDA-Accelerated RAN – PHY 数据过程总体
UL PUSCH 过程
| 类别 | 要求 | 支持 |
|---|
| 传输方案 | Codebook-based / Non-codebook-based | Y / Y |
| 资源分配 | Type 0(仅 4T4R) | N |
| Type 1 | Y |
| MCS 表 | Table64QAM / Table256QAM / Table64QAMLowSE | Y |
| PUSCH 映射类型 | Type A / Type B | Y / Y |
| CBG 重传位图 | Enable / Disable | N / Y |
前传接口(FH Interfaces)
Aerial CUDA-Accelerated RAN – 4T4R L1–L2 接口(基于 SCF FAPI)
控制接口消息(10.02)
Config.request / response, Start.request, Stop.request / indication, Error.indication, Param.request / response – 全部 4T4R,支持 Y。
数据接口消息
DL_TTI.request, UL_TTI.request, UL_DCI.request, SLOT errors, TX_Data.request, Rx_Data.indication, CRC.indication, UCI.indication, SRS.indication, RACH.indication – 全部 4T4R,支持 Y。
Aerial CUDA-Accelerated RAN – PHY 前传接口总体
IOT 配置
| 功能 | 描述 | 支持 |
|---|
| TDD IOT Profile | 单 GPU 同时支持 TDD 模式和 TDD pattern | Y |
| NR TDD IOT Profile 1/2 | NR-TDD-FR1-CAT-A-NoBF / CAT-A-DBF | Y |
O-RAN CUS 平面(7.2-x split)
| 功能 | 描述 | 支持 |
|---|
| 同时 O-RU 类别支持 | CAT-A(PDSCH 预编码)与 CAT-B | Y |
波束成形
IQ 压缩与位宽
| 功能 | 描述 | 支持 |
|---|
| IQ 精度 | 固定点 14bit | Y |
| BFP IQ 压缩 | 9bit | Y |
O-DU 定时
同步
| 功能 | 配置 | 支持 |
|---|
| G.8275.1 全时钟 | LLS-C3 + PTP + SyncE | Y |
传输特性
| 功能 | 描述 | 支持 |
|---|
| eCPRI | 应用层分片 + 前传 QoS | Y |
Section 类型
| 类型 | 描述 | 支持 |
|---|
| Section Type 1 | DL/UL 信道 | Y |
| Section Type 3 | PRACH | Y |
| 单 C-plane 消息中的多 section | | Y |
数字增益 / 缩放
| 功能 | 描述 | 支持 |
|---|
| UL 增益纠正 / DL 参考电平调整 | | Y |
接收窗口监控
规模
| 项目 | 描述 | 支持 |
|---|
| 规模 | 支持最多 8 个峰值 / 16 个平均 100MHz 载波 | Y |
测量(Measurements)
Aerial CUDA-Accelerated RAN – PHY 测量(4T4R)
PUSCH 测量
RSS, RSRP, 噪声+干扰功率(pre/post-eq)、SINR(pre/post-eq)、Timing Advance – 全部 4T4R,支持 Y。
PUCCH 测量
Format 0/1/2/3 的 RSS、RSRP、Pn+i、Timing Advance – 4T4R,全部 Y。
Format 4 相关全部 N。
PRACH 测量
Pn+i、Preamble 信号强度 – 4T4R,Y。
SRS 测量
SNR、接收信号强度、Timing Advance – 4T4R,Y。
所有信道测量
前 / 后均衡的测量可配置 – 4T4R,N。
TS 38.104 基站射频收发 – 性能一致性
Aerial CUDA-Accelerated RAN – PHY 性能一致性总体
PUSCH
| 功能 | 配置 | 支持 |
|---|
| PUSCH(transform precoding 禁用) | 4T4R | Y |
| PUSCH(transform precoding 启用) | 4T4R | Y |
| UCI 复用在 PUSCH 上 | 4T4R | Y |
PUCCH 性能(Format 0–4,多时隙等)
全部 4T4R,对应性能要求均 N。
PRACH 性能
误检概率 / 检测要求 – N。
Aerial CUDA-Accelerated RAN 面向 5G gNB 的功能概览
1. gNB 能力概述与亮点
1.1 总体说明
| 项目 | 内容 |
|---|
| 模块 | Aerial CUDA-Accelerated RAN PHY Layer |
| 目的 | 为 5G gNB 的能力、流程和接口提供依赖的 PHY 支撑,确保 gNB 侧功能可用 |
1.2 功能亮点(Highlights)
| 类别 | 功能项 | 说明 |
|---|
| UCI/控制面 | PUCCH Format 1 I+N 与 SINR | 支持 PUCCH Format 1 上的噪声+干扰与 SINR 测量 |
| UCI on PUSCH 的 DTX | 支持在 PUSCH 上传输 UCI 时的 DTX 处理 |
| 波束与 O-RU | 预定义 BeamId | 支持预定义 BeamId 波束成形 |
| Foxconn O-RU 支持 | 已与多款富士康 O-RU 完成互通 |
| 小区能力 | 小区生命周期管理 | 支持小区激活/去激活、OOS/IS 切换 |
| 4T4R TDD 7 波束 | 支持 4T4R TDD 配置下的 7 个波束 |
| 参考信号 | 8 端口 CSI-RS | 支持 8 端口 CSI-RS 配置 |
| 动态 OAM | OOS 状态下动态配置 | 支持在小区停服状态下更新多项前传与 IQ 配置参数 |
1.3 动态 OAM 可配置参数
| 参数名 | 说明 |
|---|
| Dest MAC | 前传目的 MAC 地址 |
| VLAN ID | 前传 VLAN ID |
| exponent_dl | 下行 IQ 缩放指数 |
| dl_iq_data_fmt | 下行 IQ 数据格式 |
| ul_iq_data_fmt | 上行 IQ 数据格式 |
| exponent_ul | 上行 IQ 缩放指数 |
| max_amp_ul | 上行最大幅度限制 |
| section_3_time_offset | Section 3 时间偏移 |
| pusch_prb_stride | PUSCH PRB 步长 |
| prach_prb_stride | PRACH PRB 步长 |
| fh_len_range | 前传长度范围配置 |
| lower_guard_bw | 前传带宽下保护带 |
| gps_alpha(跨小区共享) | GPS α 参数 |
| gps_beta(跨小区共享) | GPS β 参数 |
| prachRootSequenceIndex | PRACH 根序列索引 |
| prachZeroCorrConf | PRACH 零相关配置 |
| numPrachFdOccasions | PRACH 频域 Occasions 数量 |
| restrictedSetConfig | 受限集合配置 |
| prachConfigIndex | PRACH 配置索引 |
| K1 | K1 定时参数 |
1.4 其他系统级亮点
| 功能项 | 配置 / 范围 | 说明 |
|---|
| 前传距离扩展 | 至 50 km | 支持更长前传光纤距离 |
| 并行前传端口 | 多端口 | 支持同时多个前传端口以提升前传总带宽 |
| BWP | 多 BWP 支持 | 每小区支持多个 BWP |
| 4T4R TDD 带宽 | 10 / 30 / 40 / 50 / 80 MHz | 多种窄带/中带配置 |
| 载波聚合组合 | 100+80 / 100+40 / 80+40 / 100+80+40 MHz | 支持 2CC/3CC 聚合 |
| L1 启动时间 | ≤ 30 秒 | 自冷启动到就绪 |
| 多 L2 支持 | 单卡多 L2 | 单块融合板卡上支持多个 L2 实例 |
| Cell-Id 起始 | 各 pod 均从 0 起 | Cell-Id 分配统一从 0 开始 |
2. 能力(Capabilities)
2.1 同构小区生命周期管理(Cell State Mgmt)
| 功能项 | 说明 | 支持 |
|---|
| 小区激活 / 去激活 | 将载波从 OOS(停服)切换到 IS(在服),及反向操作 | Y |
2.2 前传端口倒换验证(Active–Standby C/U/S 平面)
| 功能项 | 说明 | 支持 |
|---|
| 前传端口倒换 | 主前传端口故障时,在同一 BF3 卡内切换到次级前传端口,将 C/U/S 平面业务迁移到次级端口而无需停止 L1 | Y |
3. 流程(Procedures)
3.1 波束与载波移动性(Beam & Carrier Mobility)
| 场景 | 描述 | 支持 |
|---|
| gNB 间切换(Inter-gNB HO) | UE 从一个 gNB 切换到另一个 gNB;涉及 UL RRC 转移、UE 上下文修改请求/响应、UE 上下文释放;源与目标 gNB 可处于不同频段 | N |
| DU 内切换(Intra-DU HO) | 小区级移动性:通过 UE 上下文修改流程在新载波(跨小区)上建立连接;源与目标小区可处于不同频段 | Y |
| 波束移动性(Beam Mobility) | UE 在同一载波覆盖范围内切换到新的波束(小区内) | N |
| 低速移动性 | 通过 3GPP 信道建模满足 38.104 中的行人移动要求 | N |
| 高速移动性 | 支持最高 70 mph 车速(多普勒约 400 Hz) | N |
3.2 上行功率控制(UL Power Control)
| 功能项 | 描述 | 支持 |
|---|
| 单 UE 功率控制 | 基站对单个 UE 发起的上行功率控制 | Y |
| UE 组功率控制 | 基站对 UE 组发起的上行功率控制 | Y |
3.3 载波聚合(Carrier Aggregation)
| 功能项 | 描述 | 支持 |
|---|
| 多小区载波聚合 | 在多个小区上的传输聚合,支持带内和带间配置 | Y |
| 100MHz 带宽:2 小区连续聚合 | 同一频段,1CC + 2CC,带内连续 | Y |
| 100MHz 带宽:2 小区不连续聚合 | 同一频段,1CC + 2CC,带内不连续 | Y |
| 4 小区带间聚合 | 1CC、2CC、3CC、4CC 带间不连续聚合 | Y |
| 窄带载波聚合 | 窄带场景下最多 4 个组件载波可配置 | Y |
4. 接口(Interfaces)
4.1 gNB 标准接口支持情况
| 接口 | 标准 | 说明 | 支持 |
|---|
| NG | TS 38.410 | gNB 与 5GC 之间的 NG 接口 | Y |
| Xn | TS 38.420 | gNB 间 Xn 接口 | N |
| F1 | TS 38.470 | gNB-CU 与 gNB-DU 间 F1 接口 | Y |
| E1 | TS 38.460 | CU-CP 与 CU-UP 间 E1 接口 | N |
| 前传 ORAN | ORAN 7.2 CUS v3 | O-RU 前传分拆接口 | Y |
| E2 | O-RAN E2 | RIC 接口 | N |
| O1 | O-RAN O1 | 管理与编排接口 | N |
5. 网络、业务与 KPI(Network, Services, KPIs)
5.1 高层亮点
| 项目 | 配置 / 结果 |
|---|
| eCPRI/RF 线缆环境 | 验证 4 个峰值小区(cabled),8 个峰值小区(eCPRI-only) |
| MIMO 层数 | 4T4R 配置下验证 4 DL 层 + 2 UL 层 |
| UE/TTI | 验证 6 UE / TTI |
| 前传能力 | 支持同时多前传端口 |
| 多 L2 支持 | 多个 L2 实例,每个 L2 管理不同小区 |
| OTA 验证 | 完成 1 小区 OTA 端到端验证 |
5.2 E2E 性能概要
| 场景 | 拓扑 | 吞吐性能 |
|---|
| eCPRI 连接测试仪 | 8 峰值小区(CN + RAN + UE-EM)通过 eCPRI 连接测试设备 | DL 聚合 11.2 Gbps;UL 聚合 1.68 Gbps |
| RF 线缆连接 O-RU | 4 峰值小区(CN + RAN + UE-EM)通过射频线缆连接 O-RU | DL 聚合 5.72 Gbps;UL 聚合 800 Mbps |
| OTA 连接 UE 终端 | 1 小区 OTA(CN + RAN + CUE) | DL 955 Mbps;UL 105 Mbps |
| OTA 频段 | n78 与 CBRS 频段 OTA 测试已完成 | — |
| AI-RAN 场景 | MIG 使能下验证峰值小区性能 | — |
5.3 4T4R 总体配置与 KPI
| 项目 | 配置 / 数值 |
|---|
| 3GPP 版本 | Release 15 SA |
| ORAN 分拆 | TDD 7.2 Cat A |
| 子载波间隔(SCS) | 30 kHz |
| Sub-6 频段(欧洲) | n78 德国:3700–3800 MHz |
| Sub-6 频段(美国) | n48 US CBRS:3550–3700 MHz |
| 信道带宽 | 100 MHz |
| MIMO 层 | DL:4 层;UL:2 层 |
| 100 MHz 小区数量 | 最多 4 个峰值小区;最多 8 个峰值小区 |
| 每小区峰值吞吐 | DL:1.46 Gbps;UL:210 Mbps |
| RRC 已连接 UE 数(线缆环境) | 100 UE / 小区 |
| RRC 已连接 UE 数(OTA 环境) | 8 UE / 小区 |
| UE/TTI | DL:16 UE/TTI;UL:16 UE/TTI |
| 帧结构与时隙格式 | DDDSUUDDDD,S=6:4:4(DL:G:UL);另支持 DSUUU、DDDSU |
| 用户面时延 | RRC 已连接状态下,上下行单向 10 ms |
| 同步与定时 | IEEE 1588v2 PTP / SyncE;ORAN LLS-C3 |
| MTU 尺寸 | 1500 / 8192 字节 |
| 调制方式 | DL:256 QAM;UL:256 QAM |
| Soak 测试时长 | 8 小时 |
6. O-RU 生态(ORU Ecosystem)
6.1 Aerial CUDA-Accelerated RAN O-RU 生态
| 厂家 | 型号 | 配置 | 频段 | 场景 |
|---|
| Foxconn | RPQN-7801E | 4T4R | 3.7–3.8 GHz | 室内 |
| Fujitsu | TA08029-B059 | 4T4R | 3.6–3.7 GHz | — |
| Foxconn | RP0N-7800 | 4T4R | 3.7–3.8 GHz | 室外 |
| Foxconn | RPQN-4800E | 4T4R | CBRS 3.55–3.7 GHz | 室内 |
7. UE 生态(UE Ecosystem)
7.1 Aerial CUDA-Accelerated RAN UE 生态
| 类型 | 型号 / 描述 | 配置 | SU-MIMO 层数 |
|---|
| 摄像机 | FourFaith F-SC241-216-5G | 4DL, 1UL | SU-MIMO |
| 摄像机 | FourFaith F-SC241-216-5G (EU) | 4DL, 2UL | SU-MIMO |
| CUE | OnePlus Nord 5G AC2003(EU/UK) | 4DL, 1UL | SU-MIMO |
| CUE | Oppo Reno 5G | 4DL, 1UL | SU-MIMO |
| CUE | Samsung S22 | 4DL, 1UL | SU-MIMO |
| CUE | Samsung S23 | 4DL, 1UL | SU-MIMO |
| CUE | Xiaomi 13 Pro | 4DL, 2UL | SU-MIMO |
| CUE | Google Pixel 8 | 4DL, 1UL | SU-MIMO |
| 可编程 UE | NI X410 + OAI 协议栈 | 4DL, 1UL | SU-MIMO |
8. 5G 基础设施集成(5G Infrastructure Integration)
8.1 5G RAN 集成
| 网元 | 功能描述 | 支持 |
|---|
| gNB | 基带功能:多天线信号处理、无线误码检测与纠错、安全相关处理、无线资源管理 | Y |
| O-RU | 射频功能:数字/模拟转换、射频信号发射(频段/功率符合要求),包含天线进行辐射 | Y |
| UE | 终端设备:手机、路由器、平板、HMD、CPE 等 | Y |
8.2 5G 移动核心网(NGC)集成
| 功能模块 | 全称 | 主要功能 | 支持 |
|---|
| AMF | Access and Mobility Mgmt Function | 连接与可达性管理、移动性管理、接入认证与授权、位置服务 | Y |
| SMF | Session Mgmt Function | 会话与 IP 分配、UPF 选择、QoS 控制、用户面路由控制 | Y |
| PCF | Policy Control Function | 策略规则管理,由其他控制面功能执行 | Y |
| UDM | Unified Data Mgmt | 用户身份管理、认证凭据生成 | Y |
| AUSF | Authentication Server Function | 核心认证服务器功能 | Y |
| UDR | Unified Data Repository | 订户数据存储库,供 UDM 等模块使用 | Y |
| NCHF | New Charging Function | 计费与与计费系统交互的全流程支撑 | Y |
| CP-SDSF | Structured Data Storage Function | 存储结构化数据的辅助服务 | Y |
| CP-UDSF | Unstructured Data Storage Function | 存储非结构化数据的辅助服务 | Y |
| CP-NEF | Network Exposure Function | 向第三方服务暴露能力,进行数据内外部表示转换 | N |
| CP-NRF | NF Repository Function | 网络功能服务发现 | N |
| CP-NSSF | Network Slice Selector Function | 为 UE 选择网络切片以进行差异化服务 | N |
| UP-UPF | User Plane Function | RAN 与互联网间转发,执行策略、合法监听、流量统计与 QoS 执行 | Y |
9. 部署拓扑(Network Deployment Topologies)
9.1 5G NSE 整体拓扑支持
| 拓扑类型 | 配置 | 支持 |
|---|
| 本地孤岛(On-Prem Isolated Island) | gNB + CN + MEC 应用共址 | Y |
| 共址低时延 MEC + 集中式 5GC | MEC 应用 + gNB + UPF;集中式 5G 核心网(CUPS + SBA)降低用户面时延 | N |
| 园区分布式 MEC(时延容忍) | 分布式 MEC + 共址 (gNB + UPF + CN),非时延敏感应用可复用现有企业网络流 | Y |
| CUPS 架构支持 | 控制/用户面分离架构 | N |
10. 端到端参考 BOM 与组件清单(Reference BOM & Components)
10.1 5G 基础设施组件清单
| 组件类别 | 硬件 / 软件版本 | 支持 |
|---|
| gNB 服务器 | SMC Grace Hopper MGX Server + BF3 NIC | Y |
| Dell PowerEdge R750 + A100X | Y |
| Altran L2+ | Y |
| CN 服务器 | Dell PowerEdge R750 | Y |
| Altran CN | Y |
| 前传交换机 | Dell PowerSwitch S5248F-ON | Y |
| Adva FSP 150 XG400 | Y |
| Spectrum SN3750X | Y |
| Ciena 5164 | Y |
| Cisco N9K-C93180YC-FX3S | Y |
| GM | QULSAR Qg 2 Multi-Sync Gateway | Y |
10.2 线缆与 PDU
| 类别 | 型号 / 描述 | 支持 |
|---|
| 光纤跳线 | Dell C2G 1m LC-LC 50/125 OM4 双工多模(Aqua,3ft) | Y |
| DAC | NVIDIA MCP1650-V01AE30 200GbE QSFP28 1.5m | Y |
| NVIDIA MCP1600-C001E30N 100GbE QSFP28 1m | Y |
| 光纤 | Beyondtech 5m LC–LC OM3 多模 PVC 2.0mm | Y |
| 铜缆 | CableCreation 3ft Cat5/Cat6 以太网线 | Y |
| PDU | Tripp Lite 1.4kW 单相监控型 PDU(LX 平台接口,8×5-15R,5-15P,12ft,1U,TAA) | Y |
10.3 光模块与以太网交换机
| 类别 | 型号 / 描述 | 支持 |
|---|
| 光模块 | Finisar SFP–RJ45 模块 | Y |
| Intel Ethernet SFP+ SR 光模块 | Y |
| Dell SFP28-25G-SR 模块 | Y |
| 以太网交换机 | Netgear ProSafe Plus JGS524E 机架式交换机 | Y |
Supported Systems(支持的系统)
1. 概述
| 项目 | 内容 |
|---|
| 模块 | Aerial cuPHY |
| 类型 | 软件定义的工作负载(software-defined workload) |
| 部署平台 | 运行于 NVIDIA 认证的 EGX 服务器 |
| 平台栈 | 基于 CUDA OS 平台,以及 GPU / NIC / CPU 固件与相关工具链 |
| 本节目的 | 说明 Aerial cuPHY 工作负载与 NVIDIA 平台栈之间的配置依赖关系 |
2. Highlights(亮点)
| 类别 | 描述 |
|---|
| GH MGX 性能 | Grace Hopper MGX 系统支持 20 个 4T4R 峰值小区 / 20 个 4T4R 平均 BFP9 小区 |
| Massive MIMO | 支持 64T64R Massive MIMO(16DL / 8UL)@ 100MHz,基于 SRS 的波束成形 |
3. Aerial CUDA-Accelerated RAN Overall Platform Qualification(平台认证情况)
3.1 系统列表
| 平台类型 | 系统型号 | 角色 |
|---|
| Grace Hopper 平台 | Grace Hopper MGX | gNB、RU 仿真器(RU emulator) |
| x86 平台 | Dell PowerEdge R750 | 仅 RU 仿真器(RU emulator only) |
3.2 详细配置
3.2.1 Grace Hopper MGX
| 项目 | 配置 |
|---|
| CPU | 72 核 NVIDIA Grace CPU |
| GPU | NVIDIA H100 Tensor Core GPU |
| 系统内存 | 480GB LPDDR5X(带 ECC) |
| GPU 显存 | 支持 96GB HBM3 |
| 网卡 | BF3 NIC × 2 |
| 主要应用 | gNB、RU emulator |
3.2.2 x86 平台(Dell R750)
| 项目 | 配置 |
|---|
| 服务器型号 | Dell R750(Server Skew 10-AYCG) |
| CPU | Intel Xeon Gold 6336Y,2.4GHz,24 核 / 48 线程 |
| 总线 | PCIe Gen4 |
| 内存 | 512GB DDR4 |
| 存储 | 2TB |
| 网卡 | BF3 NIC |
| 主要应用 | 仅 RU emulator 使用 |