当前位置: 首页 > news >正文

Decoder 解码器

Decoder 解码器:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>#include <libavformat/avformat.h>
#include <libavcodec/avcodec.h>
#include <libswscale/swscale.h>#define WORD uint16_t
#define DWORD uint32_t
#define LONG int32_t#pragma pack(2)
typedef struct tagBITMAPFILEHEADER {WORD  bfType;DWORD bfSize;WORD  bfReserved1;WORD  bfReserved2;DWORD bfOffBits;
} BITMAPFILEHEADER, *PBITMAPFILEHEADER;typedef struct tagBITMAPINFOHEADER {DWORD biSize;LONG  biWidth;LONG  biHeight;WORD  biPlanes;WORD  biBitCount;DWORD biCompression;DWORD biSizeImage;LONG  biXPelsPerMeter;LONG  biYPelsPerMeter;DWORD biClrUsed;DWORD biClrImportant;
} BITMAPINFOHEADER, *PBITMAPINFOHEADER;void saveBMP(struct SwsContext *img_convert_ctx, AVFrame *frame, int w, int h, char *filename)
{//1 先进行转换,  YUV420=>RGB24:// int w = img_convert_ctx->frame_dst->width;// int h = img_convert_ctx->frame_dst->height;int data_size = w * h * 3;AVFrame *pFrameRGB = av_frame_alloc();//avpicture_fill((AVPicture *)pFrameRGB, buffer, AV_PIX_FMT_BGR24, w, h);pFrameRGB->width = w;pFrameRGB->height = h;pFrameRGB->format =  AV_PIX_FMT_BGR24;av_frame_get_buffer(pFrameRGB, 0);sws_scale(img_convert_ctx, (const uint8_t* const *)frame->data, frame->linesize,0, frame->height, pFrameRGB->data, pFrameRGB->linesize);//2 构造 BITMAPINFOHEADERBITMAPINFOHEADER header;header.biSize = sizeof(BITMAPINFOHEADER);header.biWidth = w;header.biHeight = h*(-1);header.biBitCount = 24;header.biCompression = 0;header.biSizeImage = 0;header.biClrImportant = 0;header.biClrUsed = 0;header.biXPelsPerMeter = 0;header.biYPelsPerMeter = 0;header.biPlanes = 1;//3 构造文件头BITMAPFILEHEADER bmpFileHeader = {0,};//HANDLE hFile = NULL;DWORD dwTotalWriten = 0;DWORD dwWriten;bmpFileHeader.bfType = 0x4d42; //'BM';bmpFileHeader.bfSize = sizeof(BITMAPFILEHEADER) + sizeof(BITMAPINFOHEADER)+ data_size;bmpFileHeader.bfOffBits=sizeof(BITMAPFILEHEADER)+sizeof(BITMAPINFOHEADER);FILE* pf = fopen(filename, "wb");fwrite(&bmpFileHeader, sizeof(BITMAPFILEHEADER), 1, pf);fwrite(&header, sizeof(BITMAPINFOHEADER), 1, pf);fwrite(pFrameRGB->data[0], 1, data_size, pf);fclose(pf);//释放资源//av_free(buffer);av_freep(&pFrameRGB[0]);av_free(pFrameRGB);
}static void pgm_save(unsigned char *buf, int wrap, int xsize, int ysize,char *filename)
{FILE *f;int i;f = fopen(filename,"w");fprintf(f, "P5\n%d %d\n%d\n", xsize, ysize, 255);for (i = 0; i < ysize; i++)fwrite(buf + i * wrap, 1, xsize, f);fclose(f);
}static int decode_write_frame(const char *outfilename, AVCodecContext *avctx,struct SwsContext *img_convert_ctx, AVFrame *frame, AVPacket *pkt)
{int ret = -1;char buf[1024];ret = avcodec_send_packet(avctx, pkt);if (ret < 0) {fprintf(stderr, "Error while decoding frame, %s(%d)\n", av_err2str(ret), ret);return ret;}while (ret >= 0) {fflush(stdout);ret = avcodec_receive_frame(avctx, frame);if(ret == AVERROR(EAGAIN) || ret == AVERROR_EOF){return 0;}else if( ret < 0){return -1;}/* the picture is allocated by the decoder, no need to free it */snprintf(buf, sizeof(buf), "%s-%d.bmp", outfilename, avctx->frame_number);/*pgm_save(frame->data[0], frame->linesize[0],frame->width, frame->height, buf);*/saveBMP(img_convert_ctx, frame, 160,  120, buf);}return 0;
}int main(int argc, char **argv)
{int ret;int idx;const char *filename, *outfilename;AVFormatContext *fmt_ctx = NULL;const AVCodec *codec = NULL;AVCodecContext *ctx = NULL;AVStream *inStream = NULL;AVFrame *frame = NULL;  AVPacket avpkt;struct SwsContext *img_convert_ctx;if (argc <= 2) {fprintf(stderr, "Usage: %s <input file> <output file>\n", argv[0]);exit(0);}filename    = argv[1];outfilename = argv[2];/* open input file, and allocate format context */if (avformat_open_input(&fmt_ctx, filename, NULL, NULL) < 0) {fprintf(stderr, "Could not open source file %s\n", filename);exit(1);}/* retrieve stream information */if (avformat_find_stream_info(fmt_ctx, NULL) < 0) {fprintf(stderr, "Could not find stream information\n");exit(1);}/* dump input information to stderr *///av_dump_format(fmt_ctx, 0, filename, 0);//av_init_packet(&avpkt);/* set end of buffer to 0 (this ensures that no overreading happens for damaged MPEG streams) *///memset(inbuf + INBUF_SIZE, 0, AV_INPUT_BUFFER_PADDING_SIZE);//idx = av_find_best_stream(fmt_ctx, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0);if (idx < 0) {fprintf(stderr, "Could not find %s stream in input file '%s'\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO), filename);return idx;}inStream = fmt_ctx->streams[idx];/* find decoder for the stream */codec = avcodec_find_decoder(inStream->codecpar->codec_id);if (!codec) {fprintf(stderr, "Failed to find %s codec\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return AVERROR(EINVAL);}ctx = avcodec_alloc_context3(NULL);if (!ctx) {fprintf(stderr, "Could not allocate video codec context\n");exit(1);}/* Copy codec parameters from input stream to output codec context */if ((ret = avcodec_parameters_to_context(ctx, inStream->codecpar)) < 0) {fprintf(stderr, "Failed to copy %s codec parameters to decoder context\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return ret;}/* open it */if (avcodec_open2(ctx, codec, NULL) < 0) {fprintf(stderr, "Could not open codec\n");exit(1);}img_convert_ctx = sws_getContext(ctx->width, ctx->height,ctx->pix_fmt,160, 120,AV_PIX_FMT_BGR24,SWS_BICUBIC, NULL, NULL, NULL);if (img_convert_ctx == NULL){fprintf(stderr, "Cannot initialize the conversion context\n");exit(1);}frame = av_frame_alloc();if (!frame) {fprintf(stderr, "Could not allocate video frame\n");exit(1);}while (av_read_frame(fmt_ctx, &avpkt) >= 0) {if(avpkt.stream_index == idx){if (decode_write_frame(outfilename, ctx, img_convert_ctx, frame, &avpkt) < 0)exit(1);}av_packet_unref(&avpkt);}decode_write_frame(outfilename, ctx, img_convert_ctx, frame, NULL);avformat_close_input(&fmt_ctx);sws_freeContext(img_convert_ctx);avcodec_free_context(&ctx);av_frame_free(&frame);return 0;
}

saveBMP 函数分析

这个函数负责将一帧 AVFrame (假设是 YUV 格式) 转换为 BGR24 格式,并将其保存为 BMP 文件。

void saveBMP(struct SwsContext *img_convert_ctx, AVFrame *frame, int w, int h, char *filename)
{// 定义 saveBMP 函数。// - SwsContext *img_convert_ctx: FFmpeg 的图像转换上下文。// - AVFrame *frame: 输入的原始视频帧 (YUV)。// - int w, int h: 目标 BMP 图像的宽度和高度。// - char *filename: 要保存的 BMP 文件名。// 1 先进行转换, YUV420=>RGB24: (中文注释)int data_size = w * h * 3;           // 计算 BGR24 图像数据的大小 (宽 * 高 * 3 字节/像素)。AVFrame *pFrameRGB = av_frame_alloc(); // 分配一个新的 AVFrame 用于存储转换后的 BGR 数据。pFrameRGB->width = w;                // 设置 BGR 帧的宽度。pFrameRGB->height = h;               // 设置 BGR 帧的高度。pFrameRGB->format = AV_PIX_FMT_BGR24;// 设置 BGR 帧的像素格式为 BGR24 (BMP 通常使用 BGR)。av_frame_get_buffer(pFrameRGB, 0);   // 为 BGR 帧分配数据缓冲区。sws_scale(img_convert_ctx,             // 调用 sws_scale 执行转换和缩放。(const uint8_t* const *)frame->data, // 输入帧的数据指针。frame->linesize,           // 输入帧的行大小数组。0, frame->height,          // 输入帧的起始行和高度 (0 表示从头开始,处理整个高度)。pFrameRGB->data,           // 输出帧的数据指针。pFrameRGB->linesize);      // 输出帧的行大小数组。// 2 构造 BITMAPINFOHEADER (中文注释)BITMAPINFOHEADER header;             // 声明 BMP 信息头。header.biSize = sizeof(BITMAPINFOHEADER); // 设置结构体大小。header.biWidth = w;                  // 设置宽度。header.biHeight = h*(-1);            // 设置高度为负数,表示图像是 *自顶向下* 存储的,这是 BMP 的常见做法。header.biBitCount = 24;              // 设置位深为 24。header.biCompression = 0;            // 设置不压缩。header.biSizeImage = 0;              // 设置图像大小为 0。header.biClrImportant = 0;           // 设置重要颜色数为 0。header.biClrUsed = 0;                // 设置使用颜色数为 0。header.biXPelsPerMeter = 0;          // 设置水平分辨率为 0。header.biYPelsPerMeter = 0;          // 设置垂直分辨率为 0。header.biPlanes = 1;                 // 设置平面数为 1。// 3 构造文件头 (中文注释)BITMAPFILEHEADER bmpFileHeader = {0,}; // 声明并清零 BMP 文件头。DWORD dwTotalWriten = 0;             // (未使用)DWORD dwWriten;                      // (未使用)bmpFileHeader.bfType = 0x4d42;       // 设置文件类型为 'BM'。bmpFileHeader.bfSize = sizeof(BITMAPFILEHEADER) + sizeof(BITMAPINFOHEADER)+ data_size; // 计算总文件大小。bmpFileHeader.bfOffBits = sizeof(BITMAPFILEHEADER)+sizeof(BITMAPINFOHEADER); // 计算数据偏移量。FILE* pf = fopen(filename, "wb");    // 以二进制写入模式打开输出文件。fwrite(&bmpFileHeader, sizeof(BITMAPFILEHEADER), 1, pf); // 写入文件头。fwrite(&header, sizeof(BITMAPINFOHEADER), 1, pf); // 写入信息头。fwrite(pFrameRGB->data[0], 1, data_size, pf); // 写入 BGR 像素数据。fclose(pf);                          // 关闭文件。// 释放资源 (中文注释)av_freep(&pFrameRGB->data[0]);         // 释放 BGR 帧的数据缓冲区 (注意:av_frame_get_buffer 分配的内存通常由 av_frame_free 统一管理,直接释放 data[0] 可能不安全,更好的做法是只调用 av_frame_free)。av_frame_free(&pFrameRGB);             // 释放 BGR 帧结构体。
}

pgm_save 函数分析

这个函数用于将 YUV 帧的 Y 分量 (灰度图) 保存为 PGM 格式的文件。虽然在 main 函数中被注释掉了,但它是一个有用的调试工具。

static void pgm_save(unsigned char *buf, int wrap, int xsize, int ysize,char *filename)
{// 定义 pgm_save 函数。// - buf: Y 分量数据指针。// - wrap: Y 分量的行大小 (linesize)。// - xsize, ysize: 图像的宽和高。// - filename: 输出文件名。FILE *f;                             // 文件指针。int i;                               // 循环变量。f = fopen(filename,"w");             // 打开文件 (文本模式,但 PGM P5 是二进制)。fprintf(f, "P5\n%d %d\n%d\n", xsize, ysize, 255); // 写入 PGM P5 格式的头 (P5 表示二进制灰度图,255 表示最大灰度值)。for (i = 0; i < ysize; i++)          // 循环每一行。fwrite(buf + i * wrap, 1, xsize, f); // 写入该行的像素数据。注意:这里没有处理行大小 (wrap) 可能大于宽度 (xsize) 的情况,但 fwrite 会正确写入 xsize 字节。fclose(f);                           // 关闭文件。
}

main 函数分析

int main(int argc, char **argv)
{int ret;                             // 返回值。int idx;                             // 视频流索引。const char *filename, *outfilename;  // 输入文件名和输出 *基础* 文件名。AVFormatContext *fmt_ctx = NULL;     // 格式上下文。const AVCodec *codec = NULL;         // 解码器。AVCodecContext *ctx = NULL;            // 解码器上下文。AVStream *inStream = NULL;           // 输入视频流。AVFrame *frame = NULL;               // 用于接收解码帧。AVPacket avpkt;                      // 用于读取包。struct SwsContext *img_convert_ctx;  // 图像转换上下文。if (argc <= 2) {                     // 检查参数。fprintf(stderr, "Usage: %s <input file> <output file>\n", argv[0]);exit(0);}filename    = argv[1];               // 获取输入文件名。outfilename = argv[2];               // 获取输出基础文件名。/* open input file, and allocate format context */if (avformat_open_input(&fmt_ctx, filename, NULL, NULL) < 0) { // 打开文件。fprintf(stderr, "Could not open source file %s\n", filename);exit(1);}/* retrieve stream information */if (avformat_find_stream_info(fmt_ctx, NULL) < 0) { // 获取流信息。fprintf(stderr, "Could not find stream information\n");exit(1);}/* dump input information to stderr *///av_dump_format(fmt_ctx, 0, filename, 0); // (注释掉了) 打印文件信息。idx = av_find_best_stream(fmt_ctx, AVMEDIA_TYPE_VIDEO, -1, -1, NULL, 0); // 查找最佳视频流。if (idx < 0) {                         // 检查是否找到。fprintf(stderr, "Could not find %s stream in input file '%s'\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO), filename);return idx;}inStream = fmt_ctx->streams[idx];    // 获取视频流指针。/* find decoder for the stream */codec = avcodec_find_decoder(inStream->codecpar->codec_id); // 查找解码器。if (!codec) {                        // 检查是否找到。fprintf(stderr, "Failed to find %s codec\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return AVERROR(EINVAL);}ctx = avcodec_alloc_context3(NULL);    // 分配解码器上下文。if (!ctx) {                            // 检查分配。fprintf(stderr, "Could not allocate video codec context\n");exit(1);}/* Copy codec parameters from input stream to output codec context */if ((ret = avcodec_parameters_to_context(ctx, inStream->codecpar)) < 0) { // 复制参数。fprintf(stderr, "Failed to copy %s codec parameters to decoder context\n",av_get_media_type_string(AVMEDIA_TYPE_VIDEO));return ret;}/* open it */if (avcodec_open2(ctx, codec, NULL) < 0) { // 打开解码器。fprintf(stderr, "Could not open codec\n");exit(1);}img_convert_ctx = sws_getContext(ctx->width, ctx->height, // 获取图像转换上下文。ctx->pix_fmt,           // 输入宽度、高度、格式。160, 120,               // 输出宽度、高度 (硬编码)。AV_PIX_FMT_BGR24,       // 输出格式 (BGR24)。SWS_BICUBIC, NULL, NULL, NULL); // 缩放算法 (双三次插值)。if (img_convert_ctx == NULL)           // 检查转换上下文是否创建成功。{fprintf(stderr, "Cannot initialize the conversion context\n");exit(1);}frame = av_frame_alloc();            // 分配 AVFrame 用于解码。if (!frame) {                        // 检查分配。fprintf(stderr, "Could not allocate video frame\n");exit(1);}while (av_read_frame(fmt_ctx, &avpkt) >= 0) { // 循环读取数据包。if(avpkt.stream_index == idx){     // 如果包属于视频流。if (decode_write_frame(outfilename, ctx, img_convert_ctx, frame, &avpkt) < 0) // 调用解码和保存函数。exit(1);                     // 如果失败则退出。}av_packet_unref(&avpkt);             // 释放包引用。}decode_write_frame(outfilename, ctx, img_convert_ctx, frame, NULL); // 发送 NULL 包以刷新解码器。avformat_close_input(&fmt_ctx);        // 关闭输入文件。sws_freeContext(img_convert_ctx);      // 释放转换上下文。avcodec_free_context(&ctx);            // 释放解码器上下文。av_frame_free(&frame);                 // 释放 AVFrame。return 0;                            // 程序结束。
}

总结:

这个程序演示了如何:

  1. 使用 libavformat 打开视频文件并读取数据包。
  2. 使用 libavcodec 解码视频数据包为原始 AVFrame
  3. 使用 libswscale 将解码后的帧进行颜色空间转换(例如 YUV 到 BGR)和图像缩放
  4. 手动构建 BMP 文件头和信息头。
  5. 将转换后的图像数据写入 BMP 文件,实现视频抽帧并保存为图片序列的功能。

它是一个将视频转换为一系列 BMP 图像的实用工具。

http://www.dtcms.com/a/359297.html

相关文章:

  • 【MLLM】多模态理解Ovis2.5模型和训练流程(更新中)
  • 工业产品营销:概念、原理、流程与实践指南
  • Ubuntu中通过SSH克隆Windows的远程Git仓库(局域网中挺有用)
  • QWidget和QML模式下阻止槽调用的方法总结
  • Megatron-LM(模型并行)
  • 【ACP】2025-最新-疑难题解析- 练习二汇总
  • STFT和梅尔频谱图
  • 项目管理的关键成功因素
  • 119、【OS】【Nuttx】【周边】效果呈现方案解析:变量展开
  • 【从零开始java学习|第十篇】面向对象
  • 【Blender】二次元人物制作【一】:二次元角色头部建模
  • Gray Code (格雷码)
  • 2025.8.30项目二基于UDP的TFTP文件传输
  • 【ICO】快速制作ICON教材/使用icofx3快速制作ico
  • 【多项式】快速沃尔什变换 (FWT)
  • 复现 RoboDK 机器人校准功能(以Staubli TX2‑90L / TX200机械臂为测试对象)
  • 关于铭飞平台企业官网模板使用中常到的问题、企业官网的百度认证以及IDEA编辑启动器的快捷方法/Apipost本地和云端没法同步的问题解决
  • 如何改变传统教育的消费习惯-第三代结束-第四代开启
  • 数值分析——数据误差对函数值的影响
  • 数据治理进阶——26页如何进行数据治理【附全文阅读】
  • 项目管理方法论有哪些流派
  • TuringComplete游戏攻略(一、基础逻辑电路)
  • Python(五)Python_C API详细
  • 嵌入式Linux输入子系统驱动开发
  • [光学原理与应用-332]:ZEMAX - 序列模式与非序列模式的本质、比较
  • FPGA 实现FOC 无刷电机控制器
  • 电子健康记录风险评分与多基因风险评分的互补性与跨系统推广性研究
  • 洛谷 P1395 会议 -普及/提高-
  • 吴恩达机器学习(四)
  • 10. 函数和匿名函数(二)