音视频直播全链路技术手册:核心术语与实战应用解析
一、通用基础概念
1. 推流(Publishing / Stream Push)
定义:将采集到的音视频数据,经过压缩编码和封装打包,通过网络协议发送至媒体服务器或 CDN 的过程。
核心技术点:
音视频采集(摄像头、麦克风、屏幕捕获等)
编码(H.264/H.265/H.266、AAC/Opus)
网络传输(RTMP、SRT、RTP、WebRTC)
应用场景:直播、远程会议、无人机视频回传、监控上云。
2. 拉流(Playback / Stream Pull)
定义:播放端通过播放 URL 从服务器或 CDN 获取音视频流,解码并输出画面和声音。
常用协议:RTSP、HTTP-FLV、HLS、WebRTC。
关键要点:
解码器的选择(软解 / 硬解)
缓冲区优化(低延迟 vs 流畅性)
多终端适配(移动、PC、嵌入式)
3. 推流域名 / 拉流域名
推流域名:推流上传入口地址,对应推流服务器或源站。
拉流域名:播放入口地址,对应 CDN 边缘节点。
注意事项:
中国大陆服务需域名备案
常使用 CNAME 将业务域名解析到平台提供的接入地址
4. AppName 与 StreamName
AppName:逻辑分类名,用于区分业务(如
live
、meeting
)StreamName:单路直播流的唯一标识符(如
camera001
)
组合规则:rtmp://push.example.com/live/camera001
二、编解码与格式
5. 视频编码格式
H.264 / AVC:兼容性最佳,直播行业主流标准。
H.265 / HEVC:更高压缩效率,适合高清和带宽敏感场景。
H.266 / VVC:新一代高效编码,适合 4K/8K、AI 场景,但设备支持有限。
6. 音频编码格式
AAC(Advanced Audio Coding):兼顾质量与压缩效率,直播常用。
Opus:延迟低,适合实时通话、互动直播。
MP3:兼容性强,但延迟与效率不如 AAC/Opus。
7. 容器与封装格式
FLV:流式传输友好,RTMP 常用封装。
TS(MPEG-TS):HLS 等切片协议常用。
MP4:点播与录制文件的常见封装。
三、传输与协议
8. RTMP(Real-Time Messaging Protocol)
低延迟推流协议,基于 TCP,穿透性好,行业广泛使用。
适合直播、推流到 CDN,延迟一般在 1~3 秒。
9. RTSP(Real-Time Streaming Protocol)
基于 TCP/UDP 的流控制协议,常用于摄像机、安防监控、低延迟播放。
延迟可低至 200~500ms。
10. SRT(Secure Reliable Transport)
基于 UDP 的安全、低延迟协议,适合弱网、跨国链路。
支持加密、防丢包重传。
11. WebRTC(Web Real-Time Communication)
浏览器原生实时音视频技术,延迟可低至 200ms,适合强互动场景(在线教育、视频会议)。
12. HLS(HTTP Live Streaming)
基于 HTTP 的分片播放协议,延迟高(通常 5~15 秒),但兼容性和 CDN 支持度极高。
四、直播链路与处理
13. 直播转码(Live Transcoding)
将单路直播流转换为多码率、多分辨率,适应不同网络和终端。
14. 自适应码率(ABR)
根据实时带宽动态选择最佳码率,保证流畅度与画质平衡。
15. 录制(Recording)
将直播流保存为文件(MP4、FLV 等),用于回放或点播。
16. 时移(Time-Shift)
允许观众暂停、回退、跳转直播进度,再切回实时画面。
17. 拉流转推(Relay / Restream)
从源地址拉流,再推送到新地址,支持多平台同步分发。
五、质量优化与监控
18. 超低延迟直播
通过 UDP / WebRTC / SRT 等方式,将延迟压缩至 500ms 以内。
19. 弱网优化
丢包重传、FEC(前向纠错)、码率自适应,保障弱网下的播放体验。
20. 画质评估(VQA, Video Quality Assessment)
通过算法评估清晰度、色彩、平滑度,监控视频质量。
21. 95 峰值带宽
计费或容量规划指标,去掉最高 5% 带宽采样值后的峰值带宽。
六、安全与版权
22. DRM(数字版权管理)
加密视频内容,限制未授权播放和分发。
23. Token 鉴权
推/拉流时使用临时令牌验证身份,防止盗链。
七、附加功能
24. 轮播(Loop Playback)
按设定顺序循环播放内容,常用于广告和信息发布。
25. 垫片(Pre-roll Ad)
主内容播放前插入广告视频,提升变现能力。
26. 延播(Delayed Broadcast)
人为延迟直播,满足安全审核或特殊业务需求。
27. 拉流回源(Origin Fetch)
CDN 缓存未命中时,从源站获取流,保证内容可用。