C++读取wav文件中的PCM数据

前言

wav文件通常会使用PCM格式数据存储音频,这种格式的数据读取出来直接就可以播放,要在wav文件中读取数据,我们首先要获取头部信息,wav的文件结构里面分为多个chunk,我们要做的就是识别这些chunk的信息,获取音频的格式以及数据。

一、如何实现?

首先需要构造wav头部,wav文件音频信息全部保存在头部,我们要做的就是读取wav头部信息,并且记录PCM的相关参数。

1.定义头结构

只定义PCM格式的wav文件头,对于PCM格式的数据只需要下面3个结构体即可。

struct WaveRIFF;
struct WaveFormat;
struct WaveData;

2.读取头部信息

打开文件后需要读取头部信息,需要获取声音的格式以及数据长度。

WaveRIFF riff;
WaveFormat format;
WaveData data;
int userDataSize;
f= fopen(fileName.c_str(), "rb+");
//读取头部信息
fread(&riff, 1, sizeof(riff), f);
fread(&format, 1, sizeof(format),f);
//判读头部信息是否正确
//略
//查找data chunk
//略
//记录数据起始位置

3.读取数据

获取头部信息后,就知道数据在位置及长度了,只需要直接读文件即可。

//跳到数据起始位置
seek(f, _dataOffset, SEEK_SET);
//读取数据
fread(buf, 1, bufLength, f);

二、完整代码

完整代码总用有3部分,头结构、WavFileReader.h、WavFileReader.cpp。

1.头结构

#pragma pack(push,1)
    struct WaveRIFF {
        const    char id[4] = { 'R','I', 'F', 'F' };
        uint32_t fileLength;
        const    char waveFlag[4] = { 'W','A', 'V', 'E' };
    };
    struct WaveFormat
    {
        const    char id[4] = { 'f','m', 't', ' ' };
        uint32_t blockSize = 16;
        uint16_t formatTag;
        uint16_t channels;
        uint32_t samplesPerSec;
        uint32_t avgBytesPerSec;
        uint16_t blockAlign;
        uint16_t  bitsPerSample;
    };
    struct  WaveData
    {
        const    char id[4] = { 'd','a', 't', 'a' };
        uint32_t dataLength;
    };
#pragma pack(pop)

2.WavFileReader.h

#pragma once
#include<string>
/************************************************************************
* @Project:      AC.WavFileWriter
* @Decription:  wav文件读取工具
* 本版本只支持pcm读取,且未处理字节顺序。    riff文件是小端,通常在intel的设备上是没问题的,在java虚拟机上则需要处理。
* @Verision:      v1.0.0.0
* @Author:      Xin Nie
* @Create:      2019/4/10 11:10:17
* @LastUpdate:  2019/4/16 10:45:00
************************************************************************
* Copyright @ 2019. All rights reserved.
************************************************************************/
namespace AC {
    /// <summary>
    /// wav文件读取对象
    /// </summary>
    class WavFileReader {
    public:
        /// <summary>
        /// 构造方法
        /// </summary>
        WavFileReader();
        /// <summary>
        /// 析构方法
        /// </summary>
        ~WavFileReader();
        /// <summary>
        /// 打开wav文件
        /// </summary>
        /// <param name="fileName">文件名</param>
        /// <returns>是否打开成功</returns>
        bool OpenWavFile(const std::string& fileName);
        /// <summary>
        /// 关闭文件
        /// </summary>
        void CloseFlie();
        /// <summary>
        /// 读取音频数据
        /// </summary>
        /// <param name="buf">外部缓存</param>
        /// <param name="bufLength">缓存长度</param>
        /// <returns>读取长度</returns>
        int ReadData(unsigned char* buf, int bufLength);
        /// <summary>
        /// 设置读取位置
        /// </summary>
        /// <param name="position"> 读取位置</param>
        void SetPosition(int position);
        /// <summary>
        /// 获取读取位置
        /// </summary>
        /// <returns>读取位置</returns>
        int GetPosition();
        /// <summary>
        /// 获取文件长度
        /// </summary>
        /// <returns>文件长度</returns>
        int GetFileLength();
        /// <summary>
        /// 获取音频数据长度
        /// </summary>
        /// <returns>音频数据长度</returns>
        int GetDataLength();
        /// <summary>
        /// 获取声道数
        /// </summary>
        /// <returns>声道数</returns>
        int GetChannels();
        /// <summary>
        /// 获取采样率
        /// </summary>
        /// <returns>采样率,单位:hz</returns>
        int GetSampleRate();
        /// <summary>
        /// 获取位深
        /// </summary>
        /// <returns>位深,单位:bits</returns>
        int GetBitsPerSample();
    private:
        void* _file = nullptr;
        uint32_t _fileLength = 0;
        uint32_t _dataLength = 0;
        int _channels = 0;
        int  _sampleRate = 0;
        int  _bitsPerSample = 0;
        int _dataOffset = 0;
    };
}

3.WavFileReader.cpp

#include"WavFileReader.h"
namespace AC {
    WavFileReader::WavFileReader()
    {
    }
    WavFileReader::~WavFileReader()
    {
        CloseFlie();
    }
    bool WavFileReader::OpenWavFile(const std::string& fileName)
    {
        if (_file)
        {
            printf("已经打开了文件!\n");
            return false;
        }
        WaveRIFF riff;
        WaveFormat format;
        WaveData data;
        int userDataSize;
        _file = fopen(fileName.c_str(), "rb+");
        if (!_file)
        {
            printf("打开文件失败!\n");
            return false;
        }
        //读取头部信息
        if (fread(&riff, 1, sizeof(riff), static_cast<FILE*>(_file)) != sizeof(riff))
        {
            printf("文件读取错误,读取riff失败!\n");
            goto error;
        }
        if (std::string(riff.id, 4) != "RIFF" || std::string(riff.waveFlag, 4) != "WAVE")
        {
            printf("头部信息不正确,不是wav文件!\n");
            goto error;
        }
        if (fread(&format, 1, sizeof(format), static_cast<FILE*>(_file)) != sizeof(format))
        {
            printf("文件读取错误,读取format失败!\n");
            goto error;
        }
        if (std::string(format.id, 4) != "fmt ")
        {
            printf("头部信息不正确,缺少fmt!\n");
            goto error;
        }
        if (format.formatTag != 1)
        {
            printf("程序不支持,数据格式非pcm,只支持pcm格式的数据!\n");
            goto error;
        }
        userDataSize = format.blockSize - sizeof(format) + 8;
        if (userDataSize < 0)
        {
            printf("头部信息不正确,blockSize大小异常!\n");
            goto error;
        }
        else if (userDataSize > 0)
        {
            if (fseek(static_cast<FILE*>(_file), userDataSize, SEEK_CUR) != 0)
            {
                printf("文件读取错误!\n");
                goto error;
            }
        }
        while (1)
        {
            if (fread(&data, 1, sizeof(data), static_cast<FILE*>(_file)) != sizeof(data))
            {
                printf("文件读取错误!\n");
                goto error;
            };
            if (std::string(data.id, 4) != "data")
            {
                if (fseek(static_cast<FILE*>(_file), data.dataLength, SEEK_CUR) != 0)
                {
                    printf("文件读取错误!\n");
                    goto error;
                }
                continue;
            }
            break;
        }
        _dataOffset = ftell(static_cast<FILE*>(_file));
        _fileLength = riff.fileLength+8;
        _dataLength = data.dataLength;
        _channels = format.channels;
        _sampleRate = format.samplesPerSec;
        _bitsPerSample = format.bitsPerSample;
        return true;
    error:
        if (fclose(static_cast<FILE*>(_file)) == EOF)
        {
            printf("文件关闭失败!\n");
        }
        _file = nullptr;
        return false;
    }
    void WavFileReader::CloseFlie()
    {
        if (_file)
        {
            if (fclose(static_cast<FILE*>(_file)) == EOF)
            {
                printf("文件关闭失败!\n");
            }
            _file = nullptr;
        }
    }
    int WavFileReader::ReadData(unsigned char* buf, int bufLength)
    {
        if (ftell(static_cast<FILE*>(_file)) >= _dataOffset + _dataLength)
            return 0;
        return fread(buf, 1, bufLength, static_cast<FILE*>(_file));
    }

    void WavFileReader::SetPosition(int postion)
    {
        if (fseek(static_cast<FILE*>(_file), _dataOffset + postion, SEEK_SET) != 0)
        {
            printf("定位失败!\n");
        }
    }
    int WavFileReader::GetPosition()
    {
        return ftell(static_cast<FILE*>(_file)) - _dataOffset;
    }

    int WavFileReader::GetFileLength()
    {
        return _fileLength;
    }

    int WavFileReader::GetDataLength()
    {
        return _dataLength;
    }

    int WavFileReader::GetChannels()
    {
        return _channels;
    }

    int WavFileReader::GetSampleRate()
    {
        return _sampleRate;
    }

    int WavFileReader::GetBitsPerSample()
    {
        return _bitsPerSample;
    }
}

三、使用示例

1、播放

#include "WavFileReader.h"
int main(int argc, char** argv) {
    AC::WavFileReader read;
    unsigned char buf[1024];
    if (read.OpenWavFile("test_music.wav"))
    {
        int channels, sampleRate, bitsPerSample;
        //获取声音格式
        channels = read.GetChannels();
        sampleRate = read.GetSampleRate();
        bitsPerSample = read.GetBitsPerSample();
        //打开声音设备(channels,sampleRate,bitsPerSample)
        int size;
        do 
        {
            //读取音频数据
            size = read.ReadData(buf,1024);
            if (size > 0)
            {
                //播放(buf,1024)
            }
            
        } while (size);
        read.CloseFlie();
    }
    return 0;
}

2、循环播放

#include "WavFileReader.h"
int main(int argc, char** argv) {
    AC::WavFileReader read;
    unsigned char buf[1024];
    bool exitFlag = false;
    if (read.OpenWavFile("test_music.wav"))
    {
        int channels, sampleRate, bitsPerSample;
        //获取声音格式
        channels = read.GetChannels();
        sampleRate = read.GetSampleRate();
        bitsPerSample = read.GetBitsPerSample();
        //打开声音设备(channels,sampleRate,bitsPerSample)
        int size;
        while (!exitFlag)
        {
            //读取音频数据
            size = read.ReadData(buf, 1024);
            if (size > 0)
            {
                //播放(buf,1024)
            }
            else
            {   
                //回到数据起始位置
                read.SetPosition(0);        
            }
        } 
        read.CloseFlie();
    }
    return 0;
}

总结

以上就是今天要讲的内容,wav文件中读取PCM还是相对较简单的,只要了解wav头结构,然后自定义其头结构,读取头部信息,校验头部信息,然后再读取数据所在的chunk,就可以实现这样一个功能。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

时间: 2022-01-12

C++读取WAV音频文件的头部数据的实现方法

C++读取WAV音频文件的头部数据的实现方法 前言: 在这里分享一下自己的心得,希望和大家一起分享技术,如果有什么不足,还请大家指正.写出这篇目的,就是希望大家一起成长,我也相信技术之间没有高低,只有互补,只有分享,才能使彼此更加成长. 实现代码: #include <iostream> #include <string> #include <fstream> using namespace std; using std::string; using std::fstr

Python 读取WAV音频文件 画频谱的实例

Python 读取WAV文件 import wave import struct from scipy import * from pylab import * #读取wav文件,我这儿读了个自己用python写的音阶的wav filename = '1.wav' wavefile = wave.open(filename, 'r') # open for writing #读取wav文件的四种信息的函数.期中numframes表示一共读取了几个frames,在后面要用到滴. nchannels

java实现切割wav音频文件的方法详解【附外部jar包下载】

本文实例讲述了java实现切割wav音频文件的方法.分享给大家供大家参考,具体如下: import it.sauronsoftware.jave.Encoder; import it.sauronsoftware.jave.MultimediaInfo; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import j

Python3.7 读取 mp3 音频文件生成波形图效果

测试环境为Windows 10 系统,Python3.7,转换需要提前安装pydub.ffmpeg,安装和加入环境变量配置方法自行解决,至于缺少的包直接 pip install xx 搞定. 主要是 mp3 转成 wav 格式的文件,因为 mp3 格式为了减小体积牺牲了音质,转成无损的 wav 格式之后,可以读取到更详细的信息.然后读取 wav 的信息,利用 matlotlib 绘图即可. mp3towavaform.py 代码: #coding=utf8 from pydub import A

PowerShell中实现播放WAV音频文件

适用于所有PowerShell版本 其实在PowerShell中播放WAV文件非常简单: 复制代码 代码如下: # 在Windows 目录找到一个可用的WAV音频文件 $WAVPath = Get-ChildItem -Path $env:windir -Filter *.wav -Recurse -ErrorAction SilentlyContinue |  Select-Object -First 1 -ExpandProperty FullName    # 加载并播放 "Playing

python3 写一个WAV音频文件播放器的代码

环境:ubuntu 16.04 python3.5 pycharm 包 : wave pyaudio sys 上代码:AudioPlayer.py # coding:utf-8 # author:king # brief : 播放wav音频文件 import wave from pyaudio import PyAudio import sys def player(filename): chunk = 1024 wf = wave.open(filename, 'rb') p = PyAudi

解析WPF实现音频文件循环顺序播放的解决方法

要做基于WPF的音频文件循环顺序播放首先要了解WPF下有哪些类是用于控制音频的. WPF下主要有两个音频控制的类,这里做下比较: 1.SoundPlayer 2.MediaPlayer 派生MediaElement 一.SoundPlayer类   1.基于.NET FRAMEWORK 2.0: 2.可播放WAV音频文件: 3.只能播放一个文件,同时播放多个文件会后一个文件的播放操作会终止前一个播放的文件: 4.不能对音量进行控制:二.MediaPlayer类 1.基于WPF: 2.支持多种音频

从C语言中读取Python 类文件对象

问题 你要写C扩展来读取来自任何Python类文件对象中的数据(比如普通文件.StringIO对象等). 解决方案 要读取一个类文件对象的数据,你需要重复调用 read() 方法,然后正确的解码获得的数据. 下面是一个C扩展函数例子,仅仅只是读取一个类文件对象中的所有数据并将其输出到标准输出: #define CHUNK_SIZE 8192 /* Consume a "file-like" object and write bytes to stdout */ static PyObj

Python fileinput模块如何逐行读取多个文件

Python 提供了 fileinput 模块,通过该模块中的 input() 函数,我们能同时打开指定的多个文件,还可以逐个读取这些文件中的内容. fileinput 模块中 input() 该函数的语法格式如下: fileinput.input(files="filename1, filename2, ...", inplace=False, backup='', bufsize=0, mode='r', openhook=None) 此函数会返回一个 FileInput 对象,它

java读取wav文件(波形文件)并绘制波形图的方法

本文实例讲述了java读取wav文件(波形文件)并绘制波形图的方法.分享给大家供大家参考.具体如下: 因为最近有不少网友询问我波形文件读写方面的问题,出于让大家更方便以及让代码能够得到更好的改进,我将这部分(波形文件的读写)代码开源在GitHub上面. 地址为https://github.com/sintrb/WaveAccess/,最新的代码.例子.文档都在那上面,我会在我时间精力允许的前提下对该项目进行维护,同时也希望对这方面有兴趣的网友能够加入到该开源项目上. 以下内容基本都过期了,你可以