使用libavcodec将mp3音频文件解码为pcm音频采样数据【[mp3float @ 0x561c1ec49940] Header missing】

发布时间 2023-06-24 22:37:10作者: 故乡的樱花开了

一.打开和关闭输入文件和输出文件

  想要解决上面提到的问题,我们需要对mp3文件的格式有个大致了解,为了方便讲解,我这里画了个示意图:

ID3V2 包含了作者,作曲,专辑等信息,长度不固定,扩展了 ID3V1 的信息量。
Frame 一系列的帧,个数由文件大小和帧长决定
ID3V1 包含了作者,作曲,专辑等信息,长度为 128BYTE

 

 

 

 

 

 

 

  由于av_parser_parse2()这个方法的输入必须是只包含音频编码数据的“裸流”,所以,我们在读取mp3文件的时候,必须跳过ID3V2标签部分,从Frame开始。所以,我们就必须知道ID3V2标签的总长度。下面,我画了个ID3V2标签头的示意图,方便讲解。

File ID(3) Version(2) Flags(1) Size(4)

  

  其中,Size部分的值是指除ID3V2标签头之外部分的总长度。需要注意的是,在实际计算长度的时候,这4个字节的最高位需要舍弃,也就是说,只用到了28bit。下面,给出代码:  

#define AUDIO_INBUF_SIZE 20480
#define AUDIO_REFILL_THRESH 4096
static FILE* input_file= nullptr;
static FILE* output_file= nullptr;
static const AVCodec* codec= nullptr;
static AVCodecContext* codec_ctx= nullptr;
static AVPacket* pkt= nullptr;
static AVFrame* frame= nullptr;
static AVCodecParserContext* parser= nullptr;
static enum AVCodecID audio_codec_id;

void close_input_output_files(){
    if(input_file!= nullptr){
        fclose(input_file);
        input_file= nullptr;
    }
    if(output_file!= nullptr){
        fclose(output_file);
        output_file= nullptr;
    }
}

int32_t open_input_output_files(const char* input_name,const char* output_name){
    if(strlen(input_name)==0||strlen(output_name)==0){
        cout<<"Error:empty input or output file name."<<endl;
        return -1;
    }
    close_input_output_files();
    input_file=fopen(input_name,"rb");//rb:读取一个二进制文件,该文件必须存在
    if(input_file==nullptr){
        cerr<<"Error:failed to open input file."<<endl;
        return -1;
    }
    output_file=fopen(output_name,"wb");//wb:打开或新建一个二进制文件,只允许写
    if(output_file== nullptr){
        cout<<"Error:failed to open output file."<<endl;
        return -1;
    }
    uint8_t ID3V2_Header[10];
    fread(ID3V2_Header,10,1,input_file);
    long ID3V2_Size=((ID3V2_Header[6]&0x7f)<<21)+((ID3V2_Header[7]&0x7f)<<14)+((ID3V2_Header[8]&0x7f)<<7)+(ID3V2_Header[9]&0x7f)+10;
    fseek(input_file,ID3V2_Size,SEEK_SET);
    return 0;
}

二.音频解码器的初始化以及销毁

int32_t init_audio_decoder(const char* audio_codec){
    if(strcasecmp(audio_codec,"MP3")==0){
        audio_codec_id=AV_CODEC_ID_MP3;
        cout<<"Select codec id:MP3"<<endl;
    }
    else if(strcasecmp(audio_codec,"AAC")==0){
        audio_codec_id=AV_CODEC_ID_AAC;
        cout<<"Select codec id:AAC"<<endl;
    }
    else{
        cerr<<"Error:invalid audio format."<<endl;
        return -1;
    }
    codec=avcodec_find_decoder(audio_codec_id);
    if(!codec){
        cerr<<"Error:could not find codec."<<endl;
        return -1;
    }
    parser= av_parser_init(codec->id);
    if(!parser){
        cerr<<"Error:could not init parser."<<endl;
        return -1;
    }
    codec_ctx= avcodec_alloc_context3(codec);
    if(!codec_ctx){
        cerr<<"Error:could not alloc codec_ctx."<<endl;
        return -1;
    }
    int32_t result=avcodec_open2(codec_ctx,codec, nullptr);
    if(result<0){
        cerr<<"Error:could not open codec."<<endl;
        return -1;
    }
    frame=av_frame_alloc();
    if(!frame){
        cerr<<"Error:could not alloc frame."<<endl;
        return -1;
    }
    pkt=av_packet_alloc();
    if(!pkt){
        cerr<<"Error:could not alloc packet."<<endl;
        return -1;
    }
    return 0;
}
void destroy_audio_decoder(){
    av_parser_close(parser);
    avcodec_free_context(&codec_ctx);
    av_frame_free(&frame);
    av_packet_free(&pkt);
}

三.解码循环体

  解码循环体至少需要实现以下三个功能:

    1.从输入源中循环获取码流包

    2.将当前帧传入解码器,获取输出的音频采样数据

    3.输出解码获取的音频采样数据到输出文件

  从输入源中读取音频数据到缓存: 

int32_t read_data_to_buf(uint8_t* buf,int32_t size,int32_t& out_size){
    int32_t read_size=fread(buf,1,size,input_file);
    if(read_size==0){
        cerr<<"Error:read_data_to_buf failed."<<endl;
        return -1;
    }
    out_size=read_size;
    return 0;
}

  解码循环体:  

int32_t end_of_input_file(){
    return feof(input_file);
}
static int32_t decode_packet(bool flushing){
    int32_t result=0;
    result= avcodec_send_packet(codec_ctx,flushing? nullptr:pkt);
    if(result<0){
        cerr<<"Error:avcodec_send_packet failed,result:"<<result<<endl;
        return -1;
    }
    while(result>=0){
        result= avcodec_receive_frame(codec_ctx,frame);
        if(result==AVERROR(EAGAIN)||result==AVERROR_EOF){
            return 1;
        }
        else if(result<0){
            cerr<<"Error:avcodec_receive_frame failed."<<endl;
            return -1;
        }
        if(flushing){
            cout<<"flushing:";
        }
        write_samples_to_pcm(frame,codec_ctx);
        cout<<"frame->nb_samples:"<<frame->nb_samples<<",frame->channels:"<<frame->channels<<endl;
    }
    return 0;
}
int32_t audio_decoding(){
    uint8_t inbuf[AUDIO_INBUF_SIZE+AV_INPUT_BUFFER_PADDING_SIZE]={0};
    int32_t result=0;
    uint8_t* data= nullptr;
    int32_t data_size=0;
    while(!end_of_input_file()){
        result= read_data_to_buf(inbuf,AUDIO_INBUF_SIZE,data_size);
        if(result<0){
            cerr<<"Error:read_data_to_buf failed."<<endl;
            return -1;
        }
        data=inbuf;
        while(data_size>0){
            result=av_parser_parse2(parser,codec_ctx,&pkt->data,&pkt->size,data,data_size,AV_NOPTS_VALUE,AV_NOPTS_VALUE,0);
            if(result<0){
                cerr<<"Error:av_parser_parse2 failed."<<endl;
                return -1;
            }
            data+=result;
            data_size-=result;
            if(pkt->size){
                cout<<"Parsed packet size:"<<pkt->size<<endl;
                decode_packet(false);
            }
            if (data_size < AUDIO_REFILL_THRESH) {
                memmove(inbuf, data, data_size);
                data = inbuf;
                int len = fread(data + data_size, 1,AUDIO_INBUF_SIZE - data_size, input_file);
                if (len > 0)
                    data_size += len;
            }
        }
    }
    decode_packet(true);
    return 0;
}

  输出解码的音频采样数据:  

int32_t write_samples_to_pcm(AVFrame* frame,AVCodecContext* codec_ctx){
    int data_size= av_get_bytes_per_sample(codec_ctx->sample_fmt);
    if(data_size<0){
        cerr<<"Error:failed to calculate data size."<<endl;
        return -1;
    }
    for(int i=0;i<frame->nb_samples;i++){
        for(int ch=0;ch<codec_ctx->channels;ch++){
            fwrite(frame->data[ch]+i*data_size,1,data_size,output_file);
        }
    }
    return 0;
}

  最终,main函数的实现如下:

int main(){
    const char* input_file_name="../input.mp3";
    const char* output_file_name="../output.pcm";
    const char* codec_name="MP3";
    int32_t result= open_input_output_files(input_file_name,output_file_name);
    if(result<0){
        return result;
    }
    result=init_audio_decoder(codec_name);
    if(result<0){
        return result;
    }
    result=audio_decoding();
    if(result<0){
        return result;
    }
    destroy_audio_decoder();
    close_input_output_files();
    return 0;
}

  解码完成后,可以使用ffplay播放output.pcm文件:

  ffplay -ar 44100 -ar 2 -f f32le -i output.pcm