FFmpeg开发笔记（十八）FFmpeg兼容各种音频格式的播放

最新推荐文章于 2025-08-26 03:18:08 发布

2401_84058604

最新推荐文章于 2025-08-26 03:18:08 发布

阅读量384

点赞数 8

CC 4.0 BY-SA版权

文章标签： ffmpeg 笔记概率论 python

本文链接：https://blog.csdn.net/2401_84058604/article/details/138455368

FFmpeg结合SDL可以播放音频文件，也能播放视频文件中的音频流，《FFmpeg开发实战：从零基础到短视频上线》一书第10章的示例程序playaudio.c支持播放mp3和aac两种格式的音频，却不支持播放其他格式的音频。
因为mp3和aac两个格式拥有标准的规范定义，比如mp3规定每帧音频固定包含1152个样本，而aac规定每帧音频固定包含1024个样本。在它们的解码器实例AVCodecContext中，即可从frame_size字段获取每帧音频的样本数量。
然而其他音频格式（如ogg、amr、wma等）的每帧样本数并不固定，从frame_size字段取到的样本数量为0，这不仅导致SDL初始化失败，还导致重采样过程异常。为了能够播放其他格式的音频，需要对playaudio.c做下列三处修改。
1、从解码器实例获取音频样本数时，如果发现frame_size为0，就要把样本数变量设为512（注意该数值必须为2的n次幂，如256、512、1024等），修改后的赋值代码如下所示：

int out_nb_samples = audio_decode_ctx->frame_size; // 输出的采样数量
if (out_nb_samples <= 0) {
    out_nb_samples = 512;
}

2、在遍历音频帧的时候，要重新计算实际的采样位数，以便确定多少音频数据送给扬声器。具体的计算过程是这样的：先调用swr_convert函数对音频重采样，该函数的返回值为输出的数据大小；这个输入大小乘以声道数量乘以音频样本的位深（位深表示每个音频样本占据几个字节），最终的乘积便是要送给扬声器的音频数据大小。详细的计算代码如下所示：

// 重采样。也就是把输入的音频数据根据指定的采样规格转换为新的音频数据输出
int swr_size = swr\_convert(swr_ctx, // 音频采样器的实例
    &out_buff, MAX_AUDIO_FRAME_SIZE, // 输出的数据内容和数据大小
    (const uint8\_t **) f

最低0.47元/天解锁文章

新学期VIP享超值加赠