iOS8系统H264视频硬件编解码说明

时间 2019-11-13

标签 ios8 ios 系统 h264 视频硬件解码说明栏目 iOS 繁體版

原文原文链接

公司项目缘由，接触了一下视频流H264的编解码知识，以前项目使用的是FFMpeg多媒体库，利用CPU作视频的编码和解码，俗称为软编软解。该方法比较通用，可是占用CPU资源，编解码效率不高。通常系统都会提供GPU或者专用处理器来对视频流进行编解码，也就是硬件编码和解码，简称为硬编解码。苹果在iOS 8.0系统以前，没有开放系统的硬件编码解码功能，不过Mac OS系统一直有，被称为Video ToolBox的框架来处理硬件的编码和解码，终于在iOS 8.0后，苹果将该框架引入iOS系统。网络

由此，开发者即可以在iOS里面，调用Video Toolbox框架提供的接口，来对视频进行硬件编解码的工做，为VOIP视频通话，视频流播放等应用的视频编解码提供了便利。session

（PS：按照苹果WWDC2014 513《direct access to media encoding and decoding》的描述，苹果以前提供的AVFoundation框架也使用硬件对视频进行硬编码和解码，可是编码后直接写入文件，解码后直接显示。Video Toolbox框架能够获得编码后的帧结构，也能够获得解码后的原始图像，所以具备更大的灵活性作一些视频图像处理。）数据结构

一，VideoToolbox基本数据结构。框架

Video Toolbox视频编解码先后须要应用的数据结构进行说明。iphone

（1）CVPixelBuffer：编码前和解码后的图像数据结构。ide

（2）CMTime、CMClock和CMTimebase：时间戳相关。时间以64-bit/32-bit的形式出现。函数

（3）CMBlockBuffer：编码后，结果图像的数据结构。post

（4）CMVideoFormatDescription：图像存储方式，编解码器等格式描述。测试

（5）CMSampleBuffer：存放编解码先后的视频图像的容器数据结构。

图1.1视频H264编解码先后数据结构示意图

如图1.1所示，编解码先后的视频图像均封装在CMSampleBuffer中，若是是编码后的图像，以CMBlockBuffe方式存储；解码后的图像，以CVPixelBuffer存储。CMSampleBuffer里面还有另外的时间信息CMTime和视频描述信息CMVideoFormatDesc。

二，硬解码使用方法。

经过如图2.1所示的一个典型应用，来讲明如何使用硬件解码接口。该应用场景是从网络处传来H264编码后的视频码流，最后显示在手机屏幕上。

图2.1 H264典型应用场景

1，将H264码流转换成解码前的CMSampleBuffer。

由图1.1所示，解码前的CMSampleBuffer = CMTime + FormatDesc + CMBlockBuffer。须要从H264的码流里面提取出以上的三个信息。最后组合成CMSampleBuffer，提供给硬解码接口来进行解码工做。

H264的码流由NALU单元组成，NALU单元包含视频图像数据和H264的参数信息。其中视频图像数据就是CMBlockBuffer，而H264的参数信息则能够组合成FormatDesc。具体来讲参数信息包含SPS（Sequence Parameter Set）和PPS（Picture Parameter Set）。图2.2显示一个H264码流的结构。

图2.2 H264码流结构

（1）提取sps和pps生成format description。

a，每一个NALU的开始码是0x00 00 01，按照开始码定位NALU。

b，经过类型信息找到sps和pps并提取，开始码后第一个byte的后5位，7表明sps，8表明pps。

c，CMVideoFormatDescriptionCreateFromH264ParameterSets函数来构建CMVideoFormatDescriptionRef。具体代码能够见demo。

（2）提取视频图像数据生成CMBlockBuffer。

a，经过开始码，定位到NALU。

b，肯定类型为数据后，将开始码替换成NALU的长度信息（4 Bytes）。

c，CMBlockBufferCreateWithMemoryBlock接口构造CMBlockBufferRef。具体代码能够见demo。

（3）根据须要，生成CMTime信息。（实际测试时，加入time信息后，有不稳定的图像，不加入time信息反而没有，须要进一步研究，这里建议不加入time信息）

根据上述获得CMVideoFormatDescriptionRef、CMBlockBufferRef和可选的时间信息，使用CMSampleBufferCreate接口获得CMSampleBuffer数据这个待解码的原始的数据。见图2.3的H264数据转换示意图。

图2.3 H264码流转换CMSampleBuffer示意图

2，硬件解码图像显示。

硬件解码显示的方式有两种：

（1）经过系统提供的AVSampleBufferDisplayLayer来解码并显示。

AVSampleBufferDisplayLayer是苹果提供的一个专门显示编码后的H264数据的显示层，它是CALayer的子类，所以使用方式和其它CALayer相似。该层内置了硬件解码功能，将原始的CMSampleBuffer解码后的图像直接显示在屏幕上面，很是的简单方便。图2.4显示了这一解码过程。

图2.4 AVSampleBufferDisplayLayer硬解压后显示图像

显示的接口为[_avslayer enqueueSampleBuffer:sampleBuffer];

（2）经过VTDecompression接口来，将CMSampleBuffer解码成图像，将图像经过UIImageView或者OpenGL上显示。

a，初始化VTDecompressionSession，设置解码器的相关信息。初始化信息须要CMSampleBuffer里面的FormatDescription，以及设置解码后图像的存储方式。demo里面设置的CGBitmap模式，使用RGB方式存放。编码后的图像通过解码后，会调用一个回调函数，将解码后的图像交个这个回调函数来进一步处理。咱们就在这个回调里面，将解码后的图像发给control来显示，初始化的时候要将回调指针做为参数传给create接口函数。最后使用create接口对session来进行初始化。

b，a中所述的回调函数能够完成CGBitmap图像转换成UIImage图像的处理，将图像经过队列发送到Control来进行显示处理。

c，调用VTDecompresSessionDecodeFrame接口进行解码操做。解码后的图像会交由a，b步骤设置的回调函数，来进一步的处理。

图2.5显示来硬解码的过程步骤。

图2.5 VTDecompression硬解码过程示意图

三，硬编码使用方法。

硬编码的使用也经过一个典型的应用场景来描述。首先，经过摄像头来采集图像，而后将采集到的图像，经过硬编码的方式进行编码，最后编码后的数据将其组合成H264的码流经过网络传播。

1，摄像头采集数据。

摄像头采集，iOS系统提供了AVCaptureSession来采集摄像头的图像数据。设定好session的采集解析度。再设定好input和output便可。output设定的时候，须要设置delegate和输出队列。在delegate方法，处理采集好的图像。

注意，须要说明的是，图像输出的格式，是未编码的CMSampleBuffer形式。

2，使用VTCompressionSession进行硬编码。

（1）初始化VTCompressionSession。

VTCompressionSession初始化的时候，通常须要给出width宽，height长，编码器类型kCMVideoCodecType_H264等。而后经过调用VTSessionSetProperty接口设置帧率等属性，demo里面提供了一些设置参考，测试的时候发现几乎没有什么影响，可能须要进一步调试。最后须要设定一个回调函数，这个回调是视频图像编码成功后调用。所有准备好后，使用VTCompressionSessionCreate建立session。

（2）提取摄像头采集的原始图像数据给VTCompressionSession来硬编码。

摄像头采集后的图像是未编码的CMSampleBuffer形式，利用给定的接口函数CMSampleBufferGetImageBuffer从中提取出CVPixelBufferRef，使用硬编码接口VTCompressionSessionEncodeFrame来对该帧进行硬编码，编码成功后，会自动调用session初始化时设置的回调函数。

（3）利用回调函数，将因编码成功的CMSampleBuffer转换成H264码流，经过网络传播。

基本上是硬解码的一个逆过程。解析出参数集SPS和PPS，加上开始码后组装成NALU。提取出视频数据，将长度码转换成开始码，组长成NALU。将NALU发送出去。

图2.6显示了整个硬编码的处理逻辑。

图2.6硬编码处理流程示意图

四，硬编解码的一些编码说明。

因为Video Toolbox是基础的core Foundation库函数，C语言写成，和使用core Foundation全部的其它功能同样须要适应，记得Github有个同志，将其改为了OC语言能方便调用的模式，可是地址忘了，之后有缘找到，就会提供下连接。

如何在iOS平台上实现视频硬解码？

在iOS平台上作视频的解码，通常有三种方案：

一、软解码方案：ffmpeg

缺点：消耗CPU太大，在iphone4s上通常720P 20帧以上就解不动了

二、硬解码方案1：采用私有接口VideoToolBox

优势：CPU消耗极低，解码效率极高

缺点：要使用私有接口VideoToolBox，iOS设备必须越狱

三、硬解码方案2：采用AVPlayer＋httpserver＋HttpLiveStream的组合方案

优势：CPU消耗极低，解码效率极高

缺点：视频有延迟，不适合实时视频通信

这里给出硬解码方案2的流程图:

该方案本人已源代码实现，并验证了稳定性，在iphone5上720P 25帧CPU占用率3%；

具体实现源代码暂时不开源，若须要，可联系我，QQ：349260360 Email：manshilingkai@163.com

纠错：采用AVPlayer，ts流分片在切换的时候会闪屏，要实现ts流切片的无缝对接，必须采用AVQueuePlayer，这个具体方案还需完善。。。

简书：

在iOS中，摄像头录制的视频是mov格式的，虽然mov兼容mp4，可是有些需求须要用到mp4格式的视频文件。在翻边了stackoverflow以后找到了一段转换视频格式的代码。以此记录一下。

AVURLAsset *avAsset = [AVURLAsset URLAssetWithURL:[NSURL fileURLWithPath:path] options:nil];
NSArray *compatiblePresets = [AVAssetExportSession exportPresetsCompatibleWithAsset:avAsset];

if ([compatiblePresets containsObject:AVAssetExportPresetLowQuality])

{

AVAssetExportSession *exportSession = [[AVAssetExportSession alloc]initWithAsset:avAsset presetName:AVAssetExportPresetPassthrough];
    NSString *exportPath = [NSString stringWithFormat:@"%@/%@.mp4",
                            [NSHomeDirectory() stringByAppendingString:@"/tmp"],
                            @"1"];
    exportSession.outputURL = [NSURL fileURLWithPath:exportPath];
    NSLog(@"%@", exportPath);
    exportSession.outputFileType = AVFileTypeMPEG4;
    [exportSession exportAsynchronouslyWithCompletionHandler:^{

        switch ([exportSession status]) {
            case AVAssetExportSessionStatusFailed:
                NSLog(@"Export failed: %@", [[exportSession error] localizedDescription]);
                break;
            case AVAssetExportSessionStatusCancelled:
                NSLog(@"Export canceled");
                break;
                case AVAssetExportSessionStatusCompleted:
                NSLog(@"转换成功");
                break;
            default:
                break;
        }
    }];
}