FFmpeg学习2：解码数据结构及函数总结

时间 2019-12-14

标签 ffmpeg 学习解码数据结构函数总结繁體版

原文原文链接

在上一篇文章中，对FFmpeg的视频解码过程作了一个总结。因为才接触FFmpeg，仍是挺陌生的，这里就解码过程再作一个总结。
本文的总结分为如下两个部分：html

数据读取，主要关注在解码过程当中所用到的FFmpeg中的结构体。
解码过程当中所调用的函数

在学习的过程主要参考的是dranger tutorial，因此跟着教程在本文的最后使用SDL2.0将解码后的数据输出到屏幕上。git

数据的读取

一个多媒体文件包含有多个流（视频流 video stream，音频流 audio stream，字幕等）；流是一种抽象的概念，表示一连串的数据元素；
流中的数据元素称为帧Frame。也就是说多媒体文件中，主要有两种数据：流Stream 及其数据元素帧Frame，在FFmpeg天然有与这两种数据相对应的抽象：AVStream和AVPacket。github

使用FFmpeg的解码，数据的传递过程可概括以下：缓存

调用avformat_open_input打开流，将信息填充到AVFormatContext中
调用av_read_frame从流中读取数据帧到 AVPacket，AVPacket保存仍然是未解码的数据。
调用avcodec_decode_video2将AVPacket的数据解码，并将解码后的数据填充到AVFrame中，AVFrame中保存的是解码后的原始数据。

上述过程可使用下图表示：
ide

结构体的存储空间的分配与释放

FFmpeg并无垃圾回收机制，所分配的空间都须要本身维护。而因为视频处理过程当中数据量是很是大，对于动态内存的使用更要谨慎。
本小节主要介绍解码过程使用到的结构体存储空间的分配与释放。函数

AVFormatContext 在FFmpeg中有很重要的做用，描述一个多媒体文件的构成及其基本信息，存放了视频编解码过程当中的大部分信息。一般该结构体由avformat_open_input分配
存储空间，在最后调用avformat_input_close关闭。学习
AVStream 描述一个媒体流，在解码的过程当中，做为AVFormatContext的一个字段存在，不须要单独的处理。
AVpacket 用来存放解码以前的数据，它只是一个容器，其data成员指向实际的数据缓冲区，在解码的过程当中可有av_read_frame建立和填充AVPacket中的数据缓冲区，
当数据缓冲区再也不使用的时候能够调用av_free_apcket释放这块缓冲区。
AVFrame 存放从AVPacket中解码出来的原始数据，其必须经过av_frame_alloc来建立，经过av_frame_free来释放。和AVPacket相似，AVFrame中也有一块数据缓存空间，
在调用av_frame_alloc的时候并不会为这块缓存区域分配空间，须要使用其余的方法。在解码的过程使用了两个AVFrame，这两个AVFrame分配缓存空间的方法也不相同
- 一个AVFrame用来存放从AVPacket中解码出来的原始数据，这个AVFrame的数据缓存空间经过调avcodec_decode_video分配和填充。
- 另外一个AVFrame用来存放将解码出来的原始数据变换为须要的数据格式（例如RGB，RGBA）的数据，这个AVFrame须要手动的分配数据缓存空间。代码以下：

AVFrame* pFrameYUV;
pFrameYUV = av_frame_alloc();
// 手动为 pFrameYUV分配数据缓存空间
int numBytes = avpicture_get_size(AV_PIX_FMT_YUV420P,pCodecCtx->widht,pCodecCtx->width);
uint8_t* buffer = (uint8_t*)av_malloc(numBytes * sizeof(uint8_t));
// 将分配的数据缓存空间和AVFrame关联起来
avpicture_fill((AVPicture *)pFrameYUV, buffer, AV_PIX_FMT_YUV420P,pCodecCtx->width, pCodecCtx->height)

首先计算须要缓存空间大小，调用av_malloc分配缓存空间，最后调用avpicture_fill将分配的缓存空间和AVFrame关联起来。
调用av_frame_free来释放AVFrame，该函数不止释放AVFrame自己的空间，还会释放掉包含在其内的其余对象动态申请的空间，例如上面的缓存空间。ui

av_malloc和av_free，FFmpeg并无提供垃圾回收机制，全部的内存管理都要手动进行。av_malloc只是在申请内存空间的时候会考虑到内存对齐（2字节，4字节对齐），
其申请的空间要调用av_free释放。

调用的函数

av_register_all 这个函数不用多说了，注册库所支持的容器格式及其对应的CODEC。
avformat_open_input 打开多媒体文件流，并读取文件的头，将读取到的信息填充到AVFormatContext结构体中。在使用结束后，要调用avformat_close_input关闭打开的流
avformat_find_stream_info 上面提到，avformat_open_input只是读取文件的头来获得多媒体文件的信息，可是有些文件没有文件头或者文件头的格式不正确，这就形成只调用
avformat_open_input可能得不到解码所须要的必要信息，须要调用avformat_find_stream_info进一步获得流的信息。

经过上面的三个函数已经获取了对多媒体文件进行解码的所须要信息，下面要作的就是根据这些信息获得相应的解码器。
结构体AVCodecContext描述了编解码器的上下文信息，包含了流中所使用的关于编解码器的全部信息，能够经过 AVFormatContext->AVStream->AVCodecContext来获得，在有了AVCodecContext后，能够经过codec_id来找到相应的解码器，具体代码以下：指针

AVCodec* pCodec = nullptr;
pCodecCtxOrg = pFormatCtx->streams[videoStream]->codec; // codec context
// 找到video stream的 decoder
pCodec = avcodec_find_decoder(pCodecCtxOrg->codec_id);

avcodec_find_decoder 能够经过codec_id或者名称来找到相应的解码器，返回值是一个AVCodec的指针。
avcodec_open2 打开相应的编解码器
av_read_frame 从流中读取数据帧暂存到AVPacket中
avcodec_decode_video2 从AVPacket中解码数据到AVFrame中

通过以上的过程，AVFrame中的数据缓存中存放的就是解码后的原始数据了。整个流程梳理以下：code

使用SDL2.0显示视频

使用SDL2.0，dranger tutorial中的显示视频部分的代码就不是很适用了，须要作一些修改。不过，SDL2.0显示图像仍是挺简单的。

SDL_Init(SDL_INIT_VIDEO | SDL_INIT_AUDIO | SDL_INIT_TIMER);
    SDL_Window* window = SDL_CreateWindow("FFmpeg Decode", SDL_WINDOWPOS_UNDEFINED, SDL_WINDOWPOS_UNDEFINED,
        pCodecCtx->width, pCodecCtx->height, SDL_WINDOW_OPENGL | SDL_WINDOW_MAXIMIZED);
    SDL_Renderer* renderer = SDL_CreateRenderer(window, -1, 0);
    SDL_Texture* bmp = SDL_CreateTexture(renderer, SDL_PIXELFORMAT_YV12, SDL_TEXTUREACCESS_STREAMING,
        pCodecCtx->width, pCodecCtx->height);
    SDL_Rect rect;
    rect.x = 0;
    rect.y = 0;
    rect.w = pCodecCtx->width;
    rect.h = pCodecCtx->height;
    SDL_Event event;

上述代码为初始化后SDL显示图像所须要的环境，在使用FFmpeg解码数据后

int frameFinished = 0;
    avcodec_decode_video2(pCodecCtx, pFrame, &frameFinished, &packet);
    if (frameFinished)
    {
         sws_scale(sws_ctx, (uint8_t const * const *)pFrame->data, pFrame->linesize, 0,
              pCodecCtx->height, pFrameRGB->data, pFrameRGB->linesize);
         SDL_UpdateTexture(bmp, &rect, pFrameRGB->data[0], pFrameRGB->linesize[0]);
         SDL_RenderClear(renderer);
         SDL_RenderCopy(renderer, bmp, &rect, &rect);
         SDL_RenderPresent(renderer);
    }

上面代码就将解码获得的图像帧使用SDL显示了出来。不过，这里真的只是显示而已，以可以解码速度快速的将整个视频的图像帧显示一遍。

FFmpeg学习2：解码数据结构及函数总结

数据的读取

结构体的存储空间的分配与释放

调用的函数

使用SDL2.0显示视频

本节示例代码 FFmpeg1.cpp