目录
wav是微软开发的一种音频文件格式,注意,wav文件格式是无损音频文件格式,相对于其他音频格式文件数据是没有经过压缩的,通常文件也相对比较大些。、
支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几! WAV打开工具是WINDOWS的媒体播放器。
通常使用三个参数来表示声音,量化位数,取样频率和采样点振幅。量化位数分为8位,16位,24位三种,声道有单声道和立体声之分,单声道振幅数据为n*1矩阵点,立体声为n*2矩阵点,取样频率一般有11025Hz(11kHz) ,22050Hz(22kHz)和44100Hz(44kHz) 三种,不过尽管音质出色,但在压缩后的文件体积过大!相对其他音频格式而言是一个缺点,其 文件大小的计算方式为:WAV格式文件所占容量(B) = (取样频率 X量化位数X 声道) X 时间 / 8 (字节= 8bit) 每一分钟WAV格式的音频文件的大小为10MB,其大小不随音量大小及清晰度的变化而变化。
注:专业名词(取样频率、量化位数、声道)解释:https://blog.csdn.net/eric88/article/details/17098603
采样位数:也叫量化位数(单位:比特),是存储每个采样值所用的二进制位数。采样值反应了声音的波动状态。采样位数决定了量化精度。采样位数越长,量化的精度就越高,还原的波形曲线越真实,产生的量化噪声越小,回放的效果就越逼真。常用的量化位数有4、8、12、16、24。量化位数与声卡的位数和编码有关。
采样频率:采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。越高所能描述的声波频率就越高。采样率决定声音频率的范围(相当于音调),可以用数字波形表示。以波形表示的频率范围通常被称为带宽。要正确理解音频采样可以分为采样的位数和采样的频率。
WAV格式大小:采样率一般是44.1K,16bit采样精度,存储成WAV格式大小 = 44.1KHz(采样率) X 16bit(采样位数) X 2(双声道) X 播放时间
WAV格式是没有压缩无损的,MP3格式是按1:12压缩保存的,所以MP3格式大小等于上式的1/12。
为什么还要用wav来做示例呢?这是因为WAV本质上是无压缩的原始音频文件,而且他的文件结构不算非常复杂,因此可以作为我们初学者的学习示例格式。
WAV文件格式分析:https://blog.csdn.net/zhihu008/article/details/7854529
大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为"资源互换文件格式"(Resources lnterchange File Format),简称RIFF。例如声音的WAV文件
RIFF:可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由 "辨别码"、"数据大小"及"数据" 所组成。
图三、WAVE文件结构
typedef struct WAV_RIFF { /* chunk "riff" */ char ChunkID[4]; /* "RIFF" */ /* sub-chunk-size */ uint32_t ChunkSize; /* 36 + Subchunk2Size */ /* sub-chunk-data */ char Format[4]; /* "WAVE" */ } RIFF_t; typedef struct WAV_FMT { /* sub-chunk "fmt" */ char Subchunk1ID[4]; /* "fmt " */ /* sub-chunk-size */ uint32_t Subchunk1Size; /* 16 for PCM */ /* sub-chunk-data */ uint16_t AudioFormat; /* PCM = 1*/ uint16_t NumChannels; /* Mono = 1, Stereo = 2, etc. */ uint32_t SampleRate; /* 8000, 44100, etc. */ uint32_t ByteRate; /* = SampleRate * NumChannels * BitsPerSample/8 */ uint16_t BlockAlign; /* = NumChannels * BitsPerSample/8 */ uint16_t BitsPerSample; /* 8bits, 16bits, etc. */ } FMT_t; typedef struct WAV_data { /* sub-chunk "data" */ char Subchunk2ID[4]; /* "data" */ /* sub-chunk-size */ uint32_t Subchunk2Size; /* data size */ /* sub-chunk-data */ // Data_block_t block; } Data_t; //typedef struct WAV_data_block { //} Data_block_t; typedef struct WAV_fotmat { RIFF_t riff; FMT_t fmt; Data_t data; } Wav;
图四、WAVE文件数据采样格式
wave.h
// // Created by douzi on 19-3-26. // #ifndef RESOLVE_WAV_WAVE_H #define RESOLVE_WAV_WAVE_H #include <cstdint> typedef struct WAV_RIFF { /* chunk "riff" */ char ChunkID[4]; /* "RIFF" */ /* sub-chunk-size */ uint32_t ChunkSize; /* 36 + Subchunk2Size */ /* sub-chunk-data */ char Format[4]; /* "WAVE" */ } RIFF_t; typedef struct WAV_FMT { /* sub-chunk "fmt" */ char Subchunk1ID[4]; /* "fmt " */ /* sub-chunk-size */ uint32_t Subchunk1Size; /* 16 for PCM */ /* sub-chunk-data */ uint16_t AudioFormat; /* PCM = 1*/ uint16_t NumChannels; /* Mono = 1, Stereo = 2, etc. */ uint32_t SampleRate; /* 8000, 44100, etc. */ uint32_t ByteRate; /* = SampleRate * NumChannels * BitsPerSample/8 */ uint16_t BlockAlign; /* = NumChannels * BitsPerSample/8 */ uint16_t BitsPerSample; /* 8bits, 16bits, etc. */ } FMT_t; typedef struct WAV_data { /* sub-chunk "data" */ char Subchunk2ID[4]; /* "data" */ /* sub-chunk-size */ uint32_t Subchunk2Size; /* data size */ /* sub-chunk-data */ // Data_block_t block; } Data_t; //typedef struct WAV_data_block { //} Data_block_t; typedef struct WAV_fotmat { RIFF_t riff; FMT_t fmt; Data_t data; } Wav; #endif //RESOLVE_WAV_WAVE_H
uint8_t: unsigned char
uint16_t:unsigned short int
uint32_t:unsigned int
uint64_t: unsigned long int
wave.cpp
#include <stdio.h> #include <stdint.h> #include <stdlib.h> #include "wave.h" int main() { FILE *fp = NULL; Wav wav; RIFF_t riff; FMT_t fmt; Data_t data; fp = fopen("/home/douzi/Douzi_qdreamer/resolve_wav/mbfio_mic3.wav", "rb"); if (!fp) { printf("can't open audio file\n"); exit(1); } fread(&wav, 1, sizeof(wav), fp); riff = wav.riff; fmt = wav.fmt; data = wav.data; /** * RIFF */ printf("ChunkID \t\t%c%c%c%c\n", riff.ChunkID[0], riff.ChunkID[1], riff.ChunkID[2], riff.ChunkID[3]); printf("ChunkSize \t\t%d\n", riff.ChunkSize); printf("Format \t\t\t%c%c%c%c\n", riff.Format[0], riff.Format[1], riff.Format[2], riff.Format[3]); printf("\n"); /** * fmt */ printf("Subchunk1ID \t%c%c%c%c\n", fmt.Subchunk1ID[0], fmt.Subchunk1ID[1], fmt.Subchunk1ID[2], fmt.Subchunk1ID[3]); printf("Subchunk1Size \t%d\n", fmt.Subchunk1Size); printf("AudioFormat \t%d\n", fmt.AudioFormat); printf("NumChannels \t%d\n", fmt.NumChannels); printf("SampleRate \t\t%d\n", fmt.SampleRate); printf("ByteRate \t\t%d\n", fmt.ByteRate); printf("BlockAlign \t\t%d\n", fmt.BlockAlign); printf("BitsPerSample \t%d\n", fmt.BitsPerSample); printf("\n"); /** * data */ printf("blockID \t\t%c%c%c%c\n", data.Subchunk2ID[0], data.Subchunk2ID[1], data.Subchunk2ID[2], data.Subchunk2ID[3]); printf("blockSize \t\t%d\n", data.Subchunk2Size); printf("\n"); // duration = Subchunk2Size / ByteRate printf("duration \t\t%d\n", data.Subchunk2Size / fmt.ByteRate); }
参考:https://www.cnblogs.com/ranson7zop/p/7657874.html
WAV文件的声音数据保存在数据块中。块标识符为“data”, 块长度值为声音数据的长度。
从数据块的第9个字符开始是声音波形采样数据。每个样本按采样的时间先后顺序写入。样本的字节数取决于采样位数。对于多字节样本, 低位字节数据 放在低地址单元,相邻的高位字节数据放在高地址单元。多声道样本数据采用交替方式存储。例如: 立体声(双声道)采样值的存储顺序为:
(1)“52 49 46 46”这个是Ascii字符“RIFF”,这部分是固定格式,表明这是一个WAVE文件头。
(2)“22 60 28 00”,这个是我这个WAV文件的数据大小,这个大小包括除了前面4个字节的所有字节,也就等于文件总字节数减去8。16进制的“22 60 28 00”对应是十进制的“2646050”。
(3)“57 41 56 45 66 6D 74 20”,也是Ascii字符“WAVEfmt”,这部分是固定格式。
以后是PCMWAVEFORMAT部分
(4)“12 00 00 00”,这是一个DWORD,对应数字18,这个对应定义中的PCMWAVEFORMAT部分的大小,可以看到后面的这个段内容正好是18个字节。一般情况下大小为16,此时最后附加信息没有,上面这个文件多了两个字节的附加信息。
(5)“01 00”,这是一个WORD,对应定义为编码格式(WAVE_FORMAT_PCM格式一般用的是这个)。
(6)“01 00”,这是一个WORD,对应数字1,表示声道数为1,是个单声道Wav。
(7)“22 56 00 00”对应数字22050,代表的是采样频率22050,采样率(每秒样本数),表示每个通道的播放速度
(8)“44 AC 00 00”对应数字44100,代表的是每秒的数据量,波形音频数据传送速率,其值为:通道数×每秒样本数×每样本的数据位数/8(1*22050*16/8)。播放软件利用此值可以估计缓冲区的大小。
(9)“02 00”对应数字是2,表示块对齐的内容。数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。
(10)“10 00”数值为16,采样大小为16Bits,每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。
(11)“00 00”此处为附加信息(可选),和(4)中的size对应。
(12)“66 61 73 74” Fact是可选字段,一般当wav文件由某些软件转化而成,则包含该项,“04 00 00 00”Fact字段的大小为4字节,“F8 2F 14 00”是fact数据。
(13)“64 61 74 61”,这个是Ascii字符“data”,标示头结束,开始数据区域。
(14)“F0 5F 28 00”十六进制数是“0x285ff0”,对应十进制2646000,是数据区的开头,以后数据总数,看一下前面正好可以看到,文件大小是2646050,从(2)到(13)包括(13)正好是2646050-2646000=50字节。
对WAV格式影响最大的参数是编码格式。采用不同的编码的WAV格式是不同的,PCM是最常见的编码格式,其它的为压缩编码格式,一般很少使用,有的已经废弃。随着人们认识的进步可能还会有新的编码格式出现。今后对WAV文件格式的更多的研究是压缩编码格式。
文章浏览阅读1.3k次。一 界面效果二源代码1 mainw.h中代码如下#ifndef MAINWINDOW_H#define MAINWINDOW_H#include #include #include #include #include #include #include #include #include #include #include #include #in_qt画图板制作
文章浏览阅读1.4k次,点赞4次,收藏17次。Typora+PicGo+GitHub图床的搭建和常见问题的个人解决方法_picgo图床github图床搭建上传失败
文章浏览阅读2.5k次。作为四个内部类型转换操作符之一的dynamic_cast和传统的C风格的强制类型转换有着巨大的差别。除了dynamic_cast以外的转换,其行为的都是在编译期就得以确定的,转换是否成功,并不依赖被转换的对象。而dynamic_cast则不然。在这里,不再讨论其他三种转换和C风格的转换。首先,dynamic_cast依赖于RTTI信息,其次,在转换时,dynamic_cast会检查转换的source对象是否真的可以转换成target类型,这种检查不是语法上的,而是真实情况的检查。
文章浏览阅读356次,点赞9次,收藏12次。本题来自AcWing第727题《菱形》
文章浏览阅读251次。 DaggerDome下载001. 既然打开了这篇文章,那么关于为什么使用Dagger2或者Dagger2的作用就不再多说,我们直接来动手配置Dagger2。 我们只介绍AndroidStudio的配置方法,至于依旧使用Eclipse的同学,请绕道。 我们打开模块的(不是全工程的)build.gradle文件,其内容大致是这个样子:[javascript] view..._dagger2在android studio3.0
文章浏览阅读1.2w次,点赞5次,收藏79次。设计一个学生信息类一、任务描述本关任务:声明并定义一个学生信息类。二、相关知识为了完成本关任务,你需要掌握类的声明和定义。类在现实世界中,经常有属于同一类的对象。例如,你的自行车只是世界上很多自行车中的一辆。在面向对象软件中,也有很多共享相同特征的不同的对象,可以利用这些对象的相同特征为它们建立一个集合,而这个集合就称为类。C++ 中类是把各种不同类型的数据(称为数据成员)和对数据的操作(成员函数)组织在一起而形成的用户自定义的数据类型。它提供了可重用性的好处。类定义包括声明和实现两大部分。_在右侧编辑器中的begin-end之间补充代码,声明并定义一个学生信息类 stinfo,该类有
文章浏览阅读1.8k次。前述K3工业版插件编程很多K3接口开发人员都有经验,这里提供另外一个思路,采用直接HOOK的形式来进行编程,一样可以实现我们想要的结果 需求1销售出库单中,表头输入客户,当用户在表体输入商品离焦后,检查该商品是否在用户自定义的客户商品对应表中,如无,则给予信息提示2 销售出库单中,加一菜单,有权限的用户点击该按钮可从价格管理库中获取最新单价,并写入到表体单价栏中 分析
文章浏览阅读199次。首先,纯文本链接因为没有超链接,用户不能通过点击直接达到指向的页面,在用户体验上显而易见的不如超链接和链接锚文本。 但是也不能排除用户会通过复制、粘贴进入这个页面。虽然这样的链接被收录后对seo是否有用? 作用又有多大? 蜘蛛是否会顺着爬行? 我们不得而知,但谁也不能完全否认该形式链接存在的作用。再者说,纯文本链接在互联网上遍布着纯在,搜索引擎真的会忽略如此大量的链接存..._文本优化网站
文章浏览阅读628次。RabbitMQ
文章浏览阅读871次,点赞2次,收藏2次。本文旨在说明,如何解决安装软件时遇到,“不具备管理员权限”的问题。这个问题的主要原因是,虽然本地账户已经被升级为Administrator账户类型,但未获取所有管理员权限,需要用Windows自带的管理员账户,一般这个账户名字就是Administrator。接下来的操作步骤就是,将账户切换到Administrator账户,然后右键以管理员身份运行安装程序。在这个操作中可能需要我们自己激活Administrator账户。_安装vericut 你不具有管理员权限
文章浏览阅读1.8k次。靶机发布日期:2019年9月27日,难度:中等++。用到了apk逆向和ELF中的ROP技术,web狗(小白)表示伤不起,一路硬刚下来的,求鼓励~_serial2
文章浏览阅读140次。从这里开始预备知识两个数组Tarjan 算法的应用求割点和割边求点-双连通分量求边-双连通分量求强连通分量预备知识 设无向图$G_{0} = (V_{0}, E_{0})$,其中$V_{0}$为定点集合,$E_{0}$为边集,设有向图$G_{1} = (V_{1}, E_{1})$,其中$V_{1}$为定点集合,$E_...__tarjan72