当前位置：首页 > news >正文

关于ffmpeg的简介和使用总结

news 2025/11/1 8:32:46

主要参考：

全网最全FFmpeg教程，从新手到高手的蜕变指南 - 知乎 (zhihu.com)

FFmpeg入门教程（非常详细）从零基础入门到精通，看完这一篇就够了。-CSDN博客

FFmpeg教程（超级详细版） - 个人文章 - SegmentFault 思否

FFmpeg 是一个开源的跨平台音视频处理框架，在多媒体领域堪称 “神器”。它如同一个万能工具箱，涵盖了录制、转换、流化等一系列音视频处理功能，支持诸如 AVI、MP4、MOV、FLV、WMV、MPEG、MKV 等海量音视频格式，并且能在 Windows、Mac OS、Linux 等多种操作系统上稳定运行。

最初由法国计算机程序员 Fabrice Bellard 于 2000 年创建，这个项目的名称是 “FF”（代表 “Fast Forward”，快进之意）与 “mpeg”（流行的视频压缩标准 MPEG，即运动图像专家组）的组合。后来由 Michael Niedermayer 接手并持续开发，众多来自 MPlayer 项目的开发者也参与其中，为 FFmpeg 添砖加瓦，使其逐渐成长为功能完备的强大工具。

和其他音视频处理软件相比，FFmpeg 优势显著。比如格式工厂，虽然操作相对简便，有图形化界面，但在功能深度和定制化程度上远不及 FFmpeg，像复杂的滤镜添加、精准的码率控制等高级操作难以实现；再看 Adobe Premiere，虽专业剪辑功能强大，可学习成本高、授权费用不菲，而 FFmpeg 免费开源，学习资源丰富，能满足从基础格式转换到高级编解码、滤镜处理等多样化需求。

FFmpeg是音视频领域的底层基础设施，无论是开发者还是普通用户（通过GUI工具间接使用），几乎所有的多媒体处理背后都有它的身影。掌握FFmpeg的基本用法，能高效解决音视频转码、编辑、流媒体等问题。

ffmpeg是什么语言写的

FFmpeg 主要是用 C 语言编写的，同时也包含少量 汇编语言（针对关键性能模块的优化）和 脚本语言（如 Shell、Python 用于构建和测试）。以下是详细说明：

核心语言构成

部分语言用途
主代码库 C 语言实现音视频编解码、封装/解封装、滤镜处理等核心功能（占比90%以上）。
性能优化汇编语言（ASM）针对CPU指令集（如x86 SSE/AVX、ARM NEON）的硬件加速优化。
构建系统 Shell/Makefile 自动化编译配置（如configure脚本）。
测试工具 Python/Perl 部分测试脚本和工具开发（如fate测试框架）。

为什么选择C语言？

高性能：C语言直接操作硬件和内存，适合音视频编解码的高效处理。

跨平台：易于移植到嵌入式设备（如ARM）、桌面系统（Windows/macOS/Linux）等。

生态成熟：大量音视频标准库（如libx264、libvpx）均以C接口提供。

关键代码示例

C语言核心逻辑（解码示例）
// 简化的FFmpeg解码流程（C代码）
AVFormatContext *fmt_ctx = avformat_alloc_context();
avformat_open_input(&fmt_ctx, "input.mp4", NULL, NULL); // 打开文件
AVCodecContext *codec_ctx = avcodec_alloc_context3(codec);
avcodec_open2(codec_ctx, codec, NULL); // 初始化解码器
AVPacket pkt;
av_read_frame(fmt_ctx, &pkt); // 读取数据包
avcodec_send_packet(codec_ctx, &pkt); // 发送到解码器
汇编优化（x86 SIMD示例）
; FFmpeg中H.264解码的x86 SIMD优化（片段）
movdqu      xmm0, [rsi]   ; 加载16字节数据
paddw       xmm0, xmm1    ; SIMD加法指令
其他语言的辅助角色

Python：用于测试和工具开发（如ffmpeg-python封装库）。

Perl：历史代码中的少量脚本（如生成文档）。

Rust/Go：社区有封装库（如go-ffmpeg），但FFmpeg本身未使用。

如何参与开发？

必备技能：

熟练使用C语言（指针、内存管理、多线程）。

了解音视频基础（编解码、容器格式）。

学习代码：

从简单模块入手（如libavformat中的文件读写）。

提交补丁：

遵循FFmpeg的代码规范（如变量命名、提交日志格式）。

总结

FFmpeg的底层实现是C语言+汇编优化，确保了极致的性能和跨平台能力。如果需要调用FFmpeg的功能，可通过其C API，或使用高级语言（如Python）的封装库（如ffmpeg-python）。

嵌入式中能使用ffmpeg吗

在嵌入式系统中使用 FFmpeg 是可行的，但需要根据硬件资源和应用场景进行裁剪和优化。以下是关键要点和具体实施方案：

能否使用FFmpeg？

可以，但有条件： FFmpeg 本身支持跨平台，但嵌入式设备通常资源有限（内存、CPU性能），需通过以下方式适配：

代码裁剪：禁用非必需模块（如视频编解码器、滤镜）。

交叉编译：针对目标平台（如ARM Cortex-A/MIPS）编译。

硬件加速：利用芯片的编解码引擎（如Rockchip VPU、NVIDIA Jetson NVENC）。

适用场景

场景推荐方案
低端MCU（无OS）不推荐，FFmpeg依赖文件系统和动态内存，适合RTOS或裸机定制化轻量库（如TinyH264）。
嵌入式Linux（ARM-A）裁剪后的FFmpeg + 硬件加速（如树莓派、瑞芯微RK系列）。
实时音视频处理启用FFmpeg的快速解码模式（如-fast参数），或改用WebRTC（更低延迟）。

如何裁剪FFmpeg？

① 配置时禁用非必需功能
# 示例：仅启用H.264解码和MP3解码，禁用其他模块
./configure \--enable-cross-compile \--arch=armv7-a \--target-os=linux \--enable-decoder=h264 \--enable-decoder=mp3 \--disable-avdevice \--disable-swresample \--disable-postproc \--disable-everything-else
关键选项：

--disable-everything + 按需启用模块。

--enable-small：启用优化以减少内存占用。

② 手动裁剪源文件

删除libavcodec中未使用的编解码器源码（如删除vp9.c以减少体积）。

替换动态内存分配为静态分配（需修改FFmpeg源码，风险较高）。

资源占用参考

配置内存占用存储占用适用硬件
全功能FFmpeg >50MB RAM >20MB Flash 高性能SoC（如Jetson）
仅H.264解码+MP3解码 <10MB RAM <2MB Flash Cortex-A7（512MB RAM）
仅Opus音频解码 <1MB RAM <500KB Flash Cortex-M7（带MMU）

硬件加速集成

方案一：调用芯片厂商SDK

如Rockchip的mpp库、NVIDIA的V4L2接口，通过FFmpeg的hwaccel选项启用：

ffmpeg -hwaccel rkmpp -i input.h264 output.yuv

方案二：使用VAAPI/VDPAU

在Linux嵌入式平台（如树莓派）启用GPU加速：

ffmpeg -hwaccel vaapi -i input.mp4 output.mp4

替代方案（资源极度受限时）

音频：

轻量库：Opus（编码）、libmad（MP3解码）。

视频：

纯解码：TinyH264（无B帧支持）。

硬件方案：直接调用芯片厂商的编解码API（如海思Hi35xx的SDK）。

实战示例：树莓派视频播放

① 安装裁剪版FFmpeg

编译时仅启用H.264和硬件加速 ./configure --enable-mmal --enable-decoder=h264 --enable-hwaccel=h264_mmal make -j4

② 播放视频流

使用硬件加速解码 ffmpeg -hwaccel mmal -i input.h264 -f sdl2 "Video Output"

注意事项

许可协议：FFmpeg部分模块为GPL，商用需注意合规性（可选用LGPL配置）。

实时性：默认FFmpeg不保证实时性，需调整线程模型和缓冲策略。

调试工具：使用strace监控系统调用，valgrind检测内存泄漏。

总结

能用，但需裁剪：FFmpeg适合资源较丰富的嵌入式Linux平台（如ARM Cortex-A），通过禁用非必需模块和启用硬件加速可大幅降低资源占用。

替代方案：对于MCU级设备，优先选择轻量库（如Opus、TinyH264）或硬件编解码芯片。

关键步骤：交叉编译、硬件加速集成、动态内存优化。

如果需要具体平台的配置示例（如STM32MP157或全志H3），可进一步提供细节！

嵌入式里编解码库推荐

在嵌入式系统中选择编解码库时，需综合考虑硬件资源（CPU性能、内存大小）、功耗、实时性和许可协议。以下是针对嵌入式环境的推荐编解码库，按音频和视频分类：

一、音频编解码库

轻量级语音编解码

库名称格式/算法特点适用场景
Opus Opus 低延迟（<50ms），支持语音/音乐 VoIP、语音助手（如Alexa）
Speex Speex 专为语音优化，低复杂度对讲机、低功耗设备
Codec2 Codec2 超低比特率（2400bps）军事、卫星通信
AMR-NB/WB AMR 3GPP标准，移动通信兼容老旧嵌入式设备

音乐/通用音频

库名称格式特点适用场景
libmad MP3 定点运算，低内存占用 MP3播放器
AAC ELD AAC 低延迟扩展，适合实时流无线音频传输
TinyALSA PCM 轻量级ALSA接口，支持硬件加速 Linux嵌入式音频驱动

二、视频编解码库

软件编解码（无硬件加速）

库名称格式特点适用场景
TinyH264 H.264 纯解码，适合MCU（需外部RAM）低分辨率监控摄像头
libvpx VP8/VP9 开源，支持实时编码 WebRTC嵌入式终端
x264 H.264 裁剪后可适配ARM Cortex-A 视频录像机
uAVS3e AVS3 国产标准，低专利费广电、监控设备

硬件加速方案

平台/芯片支持编解码特点
Rockchip H.265/H.264 支持4K解码（如RK3399）
TI DaVinci H.264/MPEG-4 工业级稳定性（如DM8148）
NXP i.MX VPU加速低功耗（如i.MX8M Plus）
Allwinner H.264 低成本（如V3s）

三、嵌入式专用工具链

开源框架

名称功能适用场景
GStreamer 模块化音视频流水线复杂多媒体处理（如树莓派）
FFmpeg 裁剪版（禁用非必需模块）定制化需求
Live555 RTSP/RTP流媒体传输网络摄像头

商业解决方案

名称特点典型客户
Dolby MS12 杜比音效编解码高端智能音箱
ARM CMSIS Cortex-M DSP优化库低功耗MCU（如STM32）
Ittiam H.265/AV1硬件优化SDK 专业视频设备

四、选型建议

资源受限设备（MCU级别）

音频：Opus（实时语音）或 libmad（MP3播放）。

视频：TinyH264（仅解码） + 硬件加速芯片（如ESP32-CAM）。

内存优化：启用固定点运算（如Opus的 FIXED_POINT 模式）。

中高端嵌入式（Linux SoC）

音频：GStreamer + ALSA插件（支持AAC/Opus）。

视频：FFmpeg裁剪版（保留H.264） + V4L2硬件加速。

示例命令（FFmpeg裁剪）：

./configure --disable-everything --enable-decoder=h264 --enable-parser=h264 --enable-demuxer=avi

实时性要求高的场景

协议栈：WebRTC（Opus/VP8） + UDP传输。

延迟优化：禁用B帧、降低GOP大小。

五、实战示例

STM32 + Opus编码
// 使用libopus在STM32上编码语音
include <opus.h> 
OpusEncoder *encoder = opus_encoder_create(16000, 1, OPUS_APPLICATION_VOIP, &error);
uint8_t output[100];
int bytes = opus_encode(encoder, pcm_data, frame_size, output, 100);
树莓派视频解码

使用GStreamer播放H.264流 gst-launch-1.0 udpsrc port=5000 ! application/x-rtp,encoding-name=H264 ! rtph264depay ! h264parse ! omxh264dec ! autovideosink

六、注意事项

许可协议：

避免GPL库（如FFmpeg完整版），优先选择MIT/LGPL（如libvpx）。

硬件兼容性：

确认芯片是否支持硬件编解码（如海思Hi3518EV300的H.264加速）。

功耗管理：

编码时动态调整CPU频率（如DVFS技术）。

总结

语音首选：Opus（实时）、Speex（老旧设备）。

视频首选：TinyH264（低端）、libvpx（中端）、硬件加速（高端）。

开发框架：GStreamer（灵活）或 FFmpeg裁剪（高效）。

根据具体需求平衡性能、资源和成本，优先利用硬件加速以降低CPU负载。

查看全文

http://www.dtcms.com/a/181899.html

django的权限角色管理(RBAC)

单片机-STM32部分：10-1、485

TIME - MoE 模型代码 3.4——Time-MoE-main/time_moe/models/modeling_time_moe.py

【并发编程】基于 Redis 手写分布式锁

鸿蒙系统使用ArkTS开发语言支持身份证阅读器、社保卡读卡器等调用二次开发SDK

VBA将PDF文档内容逐行写入Excel

OpenLayers根据任意数量控制点绘制贝塞尔曲线

Lua—元表（Metatable)

c++——二叉树进阶

vue 中的ref

多线程 2 - 死锁问题

c#建筑行业财务流水账系统软件可上传记账凭证财务管理系统签核功能

MindSpore框架学习项目-ResNet药物分类-模型优化

CSS渲染性能优化

STM32实现九轴IMU的卡尔曼滤波

阿里云购买ECS 安装redis mysql nginx jdk 部署jar 部署web

STM32-ADC模数转换器（7）

数据链共享：从印巴空战到工业控制的跨越性应用

Axure ：基于中继器的列表删除、列表编辑

深入理解 TCP：重传机制、滑动窗口、流量控制与拥塞控制

arXiv2025 | TTRL: Test-Time Reinforcement Learning

CDGP数据治理主观题评分标准与得分策略

Linux平台下SSH 协议克隆Github远程仓库并配置密钥

ui组件二次封装（vue）

Android 关闭Activity切换过渡动画

uniapp-商城-50-后台商家信息

C++ 命令模式详解

.Net Mqtt协议-MQTTNet（一）简介

Ubuntu22.04怎么退出Emergency Mode(紧急模式)

【许可证】Open Source Licenses

部分	语言	用途
主代码库	C 语言	实现音视频编解码、封装/解封装、滤镜处理等核心功能（占比90%以上）。
性能优化	汇编语言（ASM）	针对CPU指令集（如x86 SSE/AVX、ARM NEON）的硬件加速优化。
构建系统	Shell/Makefile	自动化编译配置（如configure脚本）。
测试工具	Python/Perl	部分测试脚本和工具开发（如fate测试框架）。

场景	推荐方案
低端MCU（无OS）	不推荐，FFmpeg依赖文件系统和动态内存，适合RTOS或裸机定制化轻量库（如TinyH264）。
嵌入式Linux（ARM-A）	裁剪后的FFmpeg + 硬件加速（如树莓派、瑞芯微RK系列）。
实时音视频处理	启用FFmpeg的快速解码模式（如-fast参数），或改用WebRTC（更低延迟）。

配置	内存占用	存储占用	适用硬件
全功能FFmpeg	>50MB RAM	>20MB Flash	高性能SoC（如Jetson）
仅H.264解码+MP3解码	<10MB RAM	<2MB Flash	Cortex-A7（512MB RAM）
仅Opus音频解码	<1MB RAM	<500KB Flash	Cortex-M7（带MMU）

库名称	格式/算法	特点	适用场景
Opus	Opus	低延迟（<50ms），支持语音/音乐	VoIP、语音助手（如Alexa）
Speex	Speex	专为语音优化，低复杂度	对讲机、低功耗设备
Codec2	Codec2	超低比特率（2400bps）	军事、卫星通信
AMR-NB/WB	AMR	3GPP标准，移动通信兼容	老旧嵌入式设备

库名称	格式	特点	适用场景
libmad	MP3	定点运算，低内存占用	MP3播放器
AAC ELD	AAC	低延迟扩展，适合实时流	无线音频传输
TinyALSA	PCM	轻量级ALSA接口，支持硬件加速	Linux嵌入式音频驱动

平台/芯片	支持编解码	特点
Rockchip	H.265/H.264	支持4K解码（如RK3399）
TI DaVinci	H.264/MPEG-4	工业级稳定性（如DM8148）
NXP i.MX	VPU加速	低功耗（如i.MX8M Plus）
Allwinner	H.264	低成本（如V3s）

名称	功能	适用场景
GStreamer	模块化音视频流水线	复杂多媒体处理（如树莓派）
FFmpeg	裁剪版（禁用非必需模块）	定制化需求
Live555	RTSP/RTP流媒体传输	网络摄像头

名称	特点	典型客户
Dolby MS12	杜比音效编解码	高端智能音箱
ARM CMSIS	Cortex-M DSP优化库	低功耗MCU（如STM32）
Ittiam	H.265/AV1硬件优化SDK	专业视频设备

ffmpeg是什么语言写的

嵌入式中能使用ffmpeg吗

嵌入式里编解码库推荐

相关文章：