欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  移动技术

iOS音频技术的研究-音频格式

程序员文章站 2022-04-12 20:23:09
**什么是音频格式** 这个问题我也是查了很久才弄明白的。音频格式其实是指容器的类型,在通俗一点就是声音文件的类型,比如说“我爱你中国.mp3”,这个...
**什么是音频格式**

这个问题我也是查了很久才弄明白的。音频格式其实是指容器的类型,在通俗一点就是声音文件的类型,比如说“我爱你中国.mp3”,这个声音文件的音频格式就是MP3。
这里稍微引入一些音频编码的东西。很多第一次涉及这个领域的(比如说我哈),很容易弄不清音频格式和音频编码的区别和联系,比如音频格式中有MP3格式,音频编码中有MP3编码,这时候多数人就不明白了。
音频编码本质是一种算法,我们拿到声音的原始数据之后,总不能直接就放到文件中用,我们需要根据不同的用途对于这些数据进行处理,比如压缩使其体积变小,这时候就要用到音频编码了。音频编码就是人们为了各种需要设计的算法。
数据准备好了,需要把数据保存至文件中才能长久保存。在保存声音数据的同时,可能出于某些需要,还会同时储存一些其他的数据,甚至是脚本。于是,音乐文件成为了一种混合体。为了能让播放器知道这个声音文件都混合了什么,于是需要赋予它特定的音频格式。
所以说音频格式和音频编码不同。

**特点**

要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成,人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频文件格式的最大带宽是20KHZ,故而采样速率需要介于40~50KHZ之间,而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本16位-96dB的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中,正是采用这一标准。

**分类**

音频格式一般可以分为两大类:

一、原声(非压缩)

目前存在多种非压缩数据格式,最流行的是WAV格式。WAV文件的格式灵活,可以储存多种类型的音频数据。对于保存原始的录音数据是一个好的选择。WAV格式是基于RIFF文件格式,RIFF格式与AIFF和IFF格式类似。
BWF(广播声波格式)作为WAV的后继者,是由欧洲广播联盟创建的一种标准音频格式。BWF文件中可以存放元数据。BWF文件也是也是基于RIFF文件格式的,扩展名是WAV。(仅在wiki上有提到,但是已经无从查找)

二、压缩

压缩类又可以分为两小类:
1、无损,例如APE ,FLAC,TAK,TTA ,WV,LPAC ,AU,ALAC
2、有损,例如MP3,RealAudio,OGG,VQF,WMA,ATRAC ,Musepack ,AAC,AMR
有损文件格式是基于声学心理学的模型,除去人类很难或根本听不到的声音,例如:一个音量很高的声音后面紧跟着一个音量很低的声音。

**常见格式**

原声——————————————————————————————
CD
CD格式的音质是比较高的音频格式。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。
WAVE
WAVE(.WAV)是微软和IBM开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。
AIFF
AIFF(Audio Interchange File Format)格式和AU格式,它们都和WAV非常相像,在大多数的音频编辑软件中也都支持它们这几种常见的音乐格式。AIFF是音频交换文件格式的英文缩写。是APPLE公司开发的一种音频文件格式,被Mac平台及其应用程序所支持,NETSCAPE浏览器中LiveAudio也支持AIFF格式。所以大家都不常见。AIFF是Apple苹果电脑上面的标准音频格式,属于QuickTime技术的一部分。这一格式的特点就是格式本身与数据的意义无关,因此受到了Microsoft的青睐,并据此搞出来WAV格式。AIFF虽然是一种很优秀的文件格式,但由于它是苹果电脑上的格式,因此在PC平台上并没有得到很大的流行。不过由于Apple电脑多用于多媒*作出版行业,因此几乎所有的音频编辑软件和播放软件都或多或少地支持AIFF格式。只要苹果电脑还在,AIFF就始终还占有一席之地。由于AIFF的包容特性,所以它支持许多压缩技术。
无损压缩————————————————————————————–
APE
APE(Monkey’s Audio),是一种常见的无损音频压缩编码格式,扩展名为.ape,有时也采用.MAC的扩展名。在压缩CD音频时,一个典型的Monkey’s Audio文件往往有接近600~700K Bit/sec,而MP3最高不会超过320K Bit/sec,一般情况下用户只会指定到128~192K Bit/sec。
APE文件结构是由Monkey’s Audio定义的。Monkey’s Audio提供软件进行与其它音频文件格式的转换。Monkey’s Audio是压缩/解压缩APE文件的软件。因其主界面上有个猴子图样而得名。Monkey’s Audio是压缩APE格式的重要工具;也可以对APE文件进行解压缩。
特点:
1、压缩率:压缩比率一般在55%左右
2、编解码:编码、解码速度略慢,配置低的电脑会有卡顿
3、错误处理:没有提供错误处理的功能,若发生文件损坏,损坏位置之后的数据有可能会丢失
4、音质:在音质上,相对于WMA、MP3、AAC等有损数据压缩的格式有着绝对的优势
5、采样率:
6、分辨率:
7、开源性:Monkey’s Audio是开放源代码的免费软件,授权协议并非*软件而是准*软件(Semi-free Software)而受到排挤,许多基于GNU/Linux的Linux发行包或是其他只能基于*软件的操作系统不能将其收入
8、其他:硬件支持
FLAC
FLAC (Free Lossless Audio Codec),中文直译为*无损音频压缩编码(注:这里“Free”指的是*而并不是免费)。FLAC是一款著名的*音频压缩编码,其特点是可以对音频文件无损压缩。不同于其他有损压缩编码如MP3及WMA(9.0版本支持无损压缩),它不会破坏任何原有的音频信息,所以可以还原音乐光盘音质。
特点:
1、压缩率:压缩率稍有不及APE
2、编解码:技术更先进,占用资源更低,解码速度较APE更快
3、错误处理:只支持定点取样,并不支持浮点取样,确保没有任何约数错误以致影响音质。当数据流损坏时,数据损失会被限制在受损的数据帧之内,一般只会丢失很短的一个片段。
4、音质:同APE
5、采样率:支持任何采样率,由1Hz至655,350Hz不等,并可逐1Hz微调
6、比特率:支持任何PCM位分辨率,由4至32bit皆有
7、开源性:支持大多数的Unix-like系统(包括Linux,BSD,Solaris及Mac OS X),Windows,BeOS及OS/2
8、其他:硬件支持
TAK
TAK(Tom’s lossless Audio Kompressor)是一种无损音质的音乐编解码器。不过就目前来说,支持的软件极少,仅有像是foobar2000与Winamp等知名音乐播放软件配合使用插件才能播放。
特点:
1、压缩率:近似于APE的高压缩比
2、编解码:接近FLAC的编码、解码速度,支持多线程的编码(1.0.3以后的版本)
3、错误处理:具有错误容忍(单一bit的错误不会影响超过250ms),具有错误侦测(每个frame具有一个24-bit的CRC)
4、音质:同APE
5、采样率:支持最高192khz
6、比特率:支持最高24bit
7、开源性:尚未开放源代码(未来预定以C++开放源代码)。虽然原作者尚未公开源代码,但FFmpeg开发者已通过反向工程实现了一个开源的TAK解码器,并已入到FFmpeg中
8、其他:支持APEv2标签,支持流媒体
TTA
TTA(True Audio)是一种*又简单的实时无损音频编解码器。TTA是一种基于自适应预测过滤的无损音频压缩,与目前主要的其他格式相比,能有相同或更好的压缩效果。
特点:
1、压缩率:可将数据压缩至30%-70%
2、编解码:实时编码、解码算法,操作快捷、对系统要求低
3、错误处理:
4、音质:同APE
5、采样率:
6、比特率:8bit、16bit、24bit整型和32bitIEEE浮点型的WAV格式音频文件
7、开源性:支持多平台*软件和开放源代码
8、其他:硬件支持,支持ID3v1和ID3v2两种标签信息
WV
WV(WavPack)是由 David Bryant 开发的一个*、开放源代码的无损音频压缩格式,其文件的后缀名为.wv。
WavPack 引入了一种独特的“混合”模式,它使用一个附加的文件从而也具有了有损压缩的优点。与其它方法只生成一个文件不同,这种模式生成两个文件,其中一个是相对较小、可以单独使用的高质量有损压缩文件,另外一个是与有损文件一起使用实现无损数据恢复的“修正”文件。对于一些用户来说,这就意味着他们不必再考虑使用有损还是无损压缩这样一个问题。
特点:
1、压缩率:对于普通的流行音乐,通常介于30%-70% 之间;对于古典音乐以及其它音域较宽的音乐,通常能得到更高的比例
2、编解码:快速高效压缩与解压
3、错误处理:出错时的健壮性
4、音质:同APE
5、采样率:支持非常高的采样率
6、比特率:8bit、16bit、24bit、32bit整型以及32bit浮点表示的WAV格式音频文件
7、开源性:开放源代码,按照类似于BSD许可证的方式发布
8、其他:硬件支持,支持流媒体,支持ID3v1、APEv2标签
MPEG-4 ALS
MPEG-4 ALS(LPAC,Lossless Predictive Audio Compression),也叫作音频无损编码,是一种无损音频数据压缩方法。
它是 MPEG-4 音频标准的扩展,这个扩展的定稿时间是 2005年 12月。
MPEG4 ALS 在运算上类似于 FLAC,简单来说就是一个用 Golomb coding 或者 Bounded Gilbert Moore Coding 对余数进行编码的量化线性预测编码预测器,可能是由于缺少可用的编码器与解码器,到了 2006年,这种格式仍然没有被大众所接受。
特点:
1、压缩率:
2、编解码:
3、错误处理:
4、音质:
5、采样率:
6、比特率:
7、开源性:
8、其他:
AU
AUDIO文件是SUN公司推出的一种数字音频格式。AU文件原先是UNIX操作系统下的数字声音文件。由于早期INTERNET上的WEB服务器主要是基于UNIX的,所以,AU格式的文件在如今的Internet中也是常用的声音文件格式。
特点:
1、压缩率:
2、编解码:
3、错误处理:
4、音质:
5、采样率:
6、比特率:
7、开源性:
8、其他:
ALAC
ALAC (Apple Lossless Audio Codec)为苹果的无损音频压缩编码格式。也因为是无损压缩,听起来与原文件完全一样,不会因解压缩和压缩而改变。 ALAC与MP3的主要分别在于编码过程中,MP3会取消小部分高频及低频部分的音频数据,而ALAC则会如实记录,不会删除音频中任何细节数据。
它在2004年4月28日公布的iTunes4.5和QuickTime6.5.1的其中一部份。
特点:
1、压缩率:压缩至原先容量的40%-60%,高于MP3
2、编解码:编码、解码速度很快
3、错误处理:
4、音质:同APE
5、采样率:
6、比特率:非压缩音频格式(WAV、AIFF)
7、开源性:ALAC的编码器已于2011年10月26日以Apache License为协议公布源代码
8、其他:目前便携式数字多媒体播放器中只有iPod可播放
有损压缩————————————————————————————–
MPEG
MPEG是动态图象专家组的英文缩写。这个专家组始建于1988年,专门负责为CD建立视频和音频压缩标准。MPEG音频文件指的是MPEG标准中的声音部分即MPEG音频层。目前Internet上的音乐格式以MP3最为常见。虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。MPEG含有格式包括:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4
MP3
MP3(MPEG3)格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“.mp1”、“.mp2”、“.mp3”这3种声音文件。MPEG音频文件的压缩是一种有损压缩,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸。由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为.mp3格式的发展提供了良好的条件。
特点:
1、压缩率:压缩至原先容量的8.5%-10%
2、编解码:编码、解码速度很快
3、错误处理:
4、音质:采样率越高音质越好
5、采样率:最高48kHz
6、比特率:可变编码算法下将会是区间值
7、开源性:LAME完美地实现了VBR(可变编码率)算法,而且它是是完全免费的软件,并且由爱好者组成的开发团队一直在不断的发展完善。在VBR的基础上,LAME更加发展出ABR算法。ABR(AverageBitrate)平均比特率,是VBR的一种插值参数。
8、其他:支持ID3标签,支持流媒体,
RA
RA(RealAudio)有很多版本,RealAudio 1, RealAudio 2, RealAudio 3 最近已经到了RealAudio 11了,这些格式不同,依赖的媒体播放器也不同,同一播放器有些rm文件能播放出来,有些又不能,这个时候可以看一下是不是RealAudio编码的版本问题。
RealAudio主要适用于在网络上的在线音乐欣赏。现在大多数的用户仍然在使用或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。real的的文件格式主要有这么几种:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),还有更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。
1、压缩率:
2、编解码:
3、错误处理:
4、音质:
5、采样率:
6、比特率:
7、开源性:
8、其他:
OGG
OGG(Ogg Vorbis)是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。OggVorbis文件的扩展名是*.OGG。这种文件的设计格式是非常先进的。这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。Vorbis采用有损压缩,但通过使用更加先进的声学模型去减少损失。
目前最新的版本是2010年3月26日发布的libogg 1.2.0。[2]另一个版本libogg2也可以在Xiph.Org基金会的SVN包库中找到。。
1、压缩率:可以不断改进
2、编解码:可以不断改进
3、错误处理:
4、音质:同样位速率编码的OGG与MP3相比听起来更好一些
5、采样率:
6、比特率:
7、开源性:新BSD许可证下发布的*软件
8、其他:
VQF
雅马哈公司开发,它的核心是减少数据流量但保持音质的方法来达到更高的压缩比,VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到18:1左右甚至更高。可以说技术上也是很先进的,但是由于宣传不力,这种格式难有用武之地。.vqf可以用雅马哈的播放器播放。同时雅马哈也提供从.wav文件转换到*.vqf文件的软件。此文件缺少特点外加缺乏宣传。
经SoundVQ压缩后的音频文件在进行回放效果试听时,几乎没有人能听出它与原音频文件的差异。播放VQF对计算机的配置要求仅为奔腾75或更高,当然如果您用奔腾100或以上的机器,VQF能够运行得更加出色。实际上,播放VQF对CPU的要求仅比Mp3高5~10%左右。VQF即TwinVQ技术虽然是由NTT和YAMAHA开发的,但它们的应用软件都是免费的。
1、压缩率:5%左右,压缩比大于MP3和RA
2、编解码:
3、错误处理:
4、音质:接近CD音质(16位44.1kHz立体声)
5、采样率:
6、比特率:
7、开源性:NTT和YAMAHA并没有公布VQF的源代码
8、其他:
WMA
WMA (Windows Media Audio) 微软开发,它和日本YAMAHA公司开发的VQF格式一样,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的。一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名。
微软公司在WMA 9大幅改进了其引擎,实际上64Kbps的WMA音乐就可以达到与128Kbps的MP3音乐接近的音质,比MP3体积少1/3左右。
WMA的另一个优点是内容提供商可以通过DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷贝保护。这种内置了版权保护技术可以限制播放时间和播放次数甚至于播放的机器等等,这对被盗版搅得焦头乱额的音乐公司来说可是一个福音。
特点:
1、压缩率:5%左右(只在MP3低于192KBPS码率的情况下有效)
2、编解码:
3、错误处理:
4、音质:音质要强于MP3格式,更远胜于RA格式
5、采样率:
6、比特率:
7、开源性:
8、其他:DRM版权保护,支持流媒体,ID3标签,WMA9版本开始支持无损压缩(Windows Media Audio 9 Lossless)
ATRAC
ATRAC (Adaptive Transform Acoustic Coding),自适应听觉转换编码为Sony公司于1992年所开发的音讯有损数据压缩技术,也是相关技术名词之总称。除了Sony本身,其他MiniDisc制造商如Sharp、Panasonic等,也有各自研发自家的ATRAC编解码器。
Sony研发ATRAC初版(为避免混淆,称作ATRAC1)后,又接续开发了相关的有损压缩技术ATRAC2、ATRAC3、ATRAC3plus、以及无损的ATRAC Advanced Lossless。事实上,这五种压缩技术除了名称类似外,彼此之间并不尽相同。另外,ATRAC2、ATRAC3名称末尾的数字,经常会被误解为ATRAC的版本号,事实上该数字是编码技术名称的一部分。
ATRAC1,通常记作ATRAC。为减轻运算处理负担,ATRAC1编码时先使用两次QMF (Quadrature Mirror Filters),将输入的音讯分割为三个子频带;第一次分离出高频(11.025~22.05kHz),第二次分离剩余的中低频(0~5.5125kHz、5.5125~11.025kHz)。子频带再于MDCT(Modified Discrete Cosine Transform,变址离散余弦变换)切割分块,并依据人耳对音频的敏感度而调整资料块的分配量,也是所谓的自适应。压缩时,ATRAC根据听觉心理学,忽略人耳听觉极限之外的音讯,以及被大音量屏蔽的细小声音,以达到资料压缩的目的。ATRAC1没有明定如何流量分配等细节,便于日后微调改善音质。
1、压缩率:
2、编解码:
3、错误处理:
4、音质:
5、采样率:
6、比特率:
7、开源性:
8、其他:
AAL
AAL(ATRAC Advanced Lossless)在2005年9月的A&VFesta2005中发表,是ATRAC家族中唯一的无失真压缩规格,简称AAL。该格式可同时包含无失真压缩、破坏性压缩两部份。破坏压缩部份可使用ATRAC3、ATRAC3plus等格式,而无失真部份则是将原始音讯进行可逆性的无损压缩。除了传送整个AAL档案至随身听外,也可以只取出较小的ATRAC3/ATRAC3plus部分。 AAL压缩率约为30~80%,由于AAL同时内含有破坏性压缩的音讯,因此破坏压缩所使用的格式也会影响AAL的压缩量。 AAL首度于2005年11月1日发表的SonicStage 3.3版所支援。可以传送完整AAL资料给完全支援AAL的音乐播放器,也可以只传送ATRAC3/ATRAC3plus的部份。硬件方面,SONY至2006年10月发表之NW-S700F、NW-S600才完全支援AAL。
1、压缩率:
2、编解码:
3、错误处理:
4、音质:
5、采样率:
6、比特率:
7、开源性:
8、其他:
Musepack
Musepack(早前称作MPEGplus、MPEG+或MP+)是一种基于MP2算法的有损压缩音频格式。它的编码方式着重听觉上的穿透感,在160kbit/s或以上的表现尤为出色。 Musepack最初由Andree Buschmann提出和开发,其后经Frank Klemm接手,如今在Frank Klemm的帮助下由Musepack开发团队(Musepack Development Team,MDT)维护。
特点:
1、压缩率:
2、编解码:比起MP3、AAC更为高效的哈夫曼编码
3、错误处理:
4、音质:
5、采样率:
6、比特率:3kbit/s到1300kbit/s的纯变码率编码
7、开源性:在微软视窗、Linux和Mac OS X等平台上,在Musepack的官方网站上,除了有Musepack的编码器和解码器,还有为数款媒体播放器专用的第三方插件,均以LGPL或BSD许可证发布
8、其他:噪音替换技术,APEv2标签
AAC
AAC(Advanced Audio Coding),出现于1997年,基于MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代MP3格式。2000年,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的MPEG-2 AAC又称为MPEG-4 AAC。
不过直到2006年,使用这一格式存储音乐的并不多,可以播放该格式的mp3播放器更是少之又少。此外计算机上很多音乐播放软件都支持AAC(前提是安装过AAC解码器),如苹果iTunes。但在移动电话领域,AAC的支持度已很普遍,Nokia、Sony Ericsson、Motorola等品牌均在其中高端产品中支持AAC(一开始主要是LC-AAC,随着移动电话性能的发展,HE-AAC的支持也已广泛)。
特点:
1、压缩率:5%左右
2、编解码:
3、错误处理:
4、音质:比几乎所有的传统编码方式在同规格的情况下更胜一筹
5、采样率:最高96kHz
6、比特率:8bit、16bit、24bit、32bit
7、开源性:
8、其他:
AMR
AMR全称Adaptive Multi-Rate,自适应多速率编码,主要用于移动设备的音频(手机打电话),压缩比比较大,但相对其他的压缩格式质量比较差,由于多用于人声,通话,效果还是很不错的。
分类1. AMR: 又称为AMR-NB,相对于下面的WB而言,语音带宽范围:300-3400Hz,8KHz抽样
分类2. AMR-WB:AMR WideBand,语音带宽范围: 50-7000Hz 16KHz抽样
AMR-WB采样频率为16kHz,是一种同时被国际标准化组织ITU-T和3GPP采用的宽带语音编码标准,也称为G722.2标准。AMR-WB提供语音带宽范围达到50~7000Hz,用户可主观感受到话音比以前更加自然、舒适和易于分辨。与之作比较,现在GSM用的EFR(Enhenced Full Rate,增强型全速率编码)采样频率为8kHz,语音带宽为200~3400Hz。AMR-WB应用于窄带GSM(全速信道16k,GMSK)的优势在于其可采用从6.6kb/s, 8.85kb/s和12.65kb/s三种编码,当网络繁忙时C/I恶化,编码器可以自动调整编码模式,从而增强QoS。在这种应用中,AMR-WB抗扰度优于AMR-NB。AMR-WB应用于EDGE、3G可充分体现其优势。足够的传输带宽保证AMR-WB可采用从 6.6kb/s到23.85kb/s共九种编码,语音质量超越PSTN固定电话。

AMR是专利产品

到这里基本的音频格式就已经介绍完了。我一直认为MIDI不能作为一种音频格式来分类,因此我单独给他一个分类
MIDI
MIDI(Musical Instrument Digital Interface)格式被经常玩音乐的人使用,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。.mid文件重放的效果完全依赖声卡的档次。.mid格式的最大用处是在电脑作曲领域。.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成.mid文件。