音视频处理之FFmpeg+SDL视频播放器

一、FFmpeg视频解码器
1.视频解码知识
1).纯净的视频解码流程
压缩编码数据->像素数据 。
例如解码H.264,就是“H.264码流->YUV” 。
2).一般的视频解码流程
视频码流一般存储在一定的封装格式(例如MP4、AVI等)中 。封装格式中通常还包含音频码流等内容 。
对于封装格式中的视频,需要先从封装格式中提取中视频码流,然后再进行解码 。
例如解码MKV格式的视频文件,就是“MKV->H.264码流->YUV”
2.VC下FFmpeg开发环境的搭建
新建控制台工程
打开visual studio
文件 新建 项目 win32控制台应用程序
拷贝FFmpeg开发文件
头文件(*.h)拷贝至项目文件夹的include子文件夹下
导入库文件(*.lib)拷贝至项目文件夹的lib子文件夹下
动态库文件(*.dll)拷贝至项目文件夹下
PS:如果直接使用官网上下载的FFmpeg开发文件 。则可能还需要将MinGW安装目录中的inttypes.h,stdint.h,_mingw.h三个文件拷贝至项目文件夹的include子文件夹下 。
配置开发文件
打开属性面板
解决方案资源管理器->右键单击项目->属性
头文件配置
配置属性->C/C++->常规->附加包含目录,输入“include”(刚才拷贝头文件的目录)
导入库配置
配置属性->链接器->常规->附加库目录,输入“lib” (刚才拷贝库文件的目录)
配置属性->链接器->输入->附加依赖项,输入“avcodec.lib; avformat.lib; avutil.lib; avdevice.lib; avfilter.lib; postproc.lib; swresample.lib; swscale.lib”(导入库的文件名)
动态库不用配置
main()中调用一个FFmpeg的接口函数
例如下面代码打印出了FFmpeg的配置信息
int main(int argc, char* argv[]){ printf("%s", avcodec_configuration()); return 0; }如果运行无误,则代表FFmpeg已经配置完成 。
3.FFmpeg简介
FFmpeg一共包含8个库:
avcodec:编解码(最重要的库) 。
avformat:封装格式处理 。
avfilter:滤镜特效处理 。
avdevice:各种设备的输入输出 。
avutil:工具库(大部分库都需要这个库的支持) 。
postproc:后加工 。
swresample:音频采样数据格式转换 。
swscale:视频像素数据格式转换 。
1).FFmpeg解码流程图见图1:

音视频处理之FFmpeg+SDL视频播放器

文章插图
2).FFmpeg解码函数简介
av_register_all():注册所有组件 。
avformat_open_input():打开输入视频文件 。
avformat_find_stream_info():获取视频文件信息 。
avcodec_find_decoder():查找解码器 。
avcodec_open2():打开解码器 。
av_read_frame():从输入文件读取一帧压缩数据 。
avcodec_decode_video2():解码一帧压缩数据 。
avcodec_close():关闭解码器 。
avformat_close_input():关闭输入视频文件 。
3).FFmpeg相关结构体(类型)见图2:
音视频处理之FFmpeg+SDL视频播放器

文章插图
I、FFmpeg数据结构简介
AVFormatContext
封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息 。
AVInputFormat
每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体 。
AVStream
视频文件中每个视频(音频)流对应一个该结构体 。
AVCodecContext
编码器上下文结构体,保存了视频(音频)编解码相关信息 。
AVCodec
每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体 。
AVPacket
存储一帧压缩编码数据 。
AVFrame
存储一帧解码后像素(采样)数据 。
II、FFmpeg数据结构分析
AVFormatContext
iformat:输入视频的AVInputFormat
nb_streams :输入视频的AVStream 个数
streams :输入视频的AVStream []数组
duration :输入视频的时长(以微秒为单位)
bit_rate :输入视频的码率
AVInputFormat
name:封装格式名称
long_name:封装格式的长名称
extensions:封装格式的扩展名
id:封装格式ID
一些封装格式处理的接口函数
AVStream
id:序号
codec:该流对应的AVCodecContext
time_base:该流的时基
r_frame_rate:该流的帧率
AVCodecContext
codec:编解码器的AVCodec
width, height:图像的宽高(只针对视频)
pix_fmt:像素格式(只针对视频)
sample_rate:采样率(只针对音频)
channels:声道数(只针对音频)


推荐阅读