1.3.2媒体的数字化
多媒体信息可以从计算机输出界面向人们展示丰富多彩的文、图、声信息,而在计算机内部 都是以转换成0和1的数字化信息后进行处理的,然后以不同文件类型进行存储。
1.声音
声音是一种重要的媒体,其种类繁多,如人的语音、动物的声音、乐器声、机器声等。
1)声音的数字化
声音的主要物理特征包括频率和振幅。声音用电表示时,声音信号是在时间上和幅度上都
连续的模拟信号。而计算机只能存储和处理离散的数字信号。将连续的模拟信号变成离散的数字信号就是数字化,数字化的基本技术是脉冲编码调制(Pulse Code Modulation,PCM),主要包括采样、量化、编码3个基本过程。
为了记录声音信号,需要每隔一定的时间间隔获取声音信号的幅度值,并记录下来——这个过程称为采样。采样即是以固定的时间间隔对模拟波形的幅度值进行抽取,把时间上连续的信号变成时间上离散的信号。该时间间隔称为采样周期,其倒数称为采样频率。显而易见,获取幅度值的时间间隔越短,记录的信息就越精确,由此带来的问题是:需要更多的存储空间。因此,需要确定一个合适的时间间隔,既能记录足够复现原始声音信号的信息,又不浪费过多的存储空间。
根据奈奎斯特采样定理,当采样频率大于或等于声音信号最高频率的两倍时,就可以将采集 到的样本还原成原声音信号。例如:人的语音频率一般在80一3 400 Hz之间,则采样频率选为8 kHz就能基本上还原人的语音信号。
获取到的样本幅度值用数字量来表示——这个过程称为量化。量化就是将一定范围内的模拟量变成某一最小数量单位的整数倍。表示采样点幅值的二进制位数称为量化位数,它是决定数字音频质量的另一重要参数,一般为8位、16位。量化位数越大,采集到的样本精度就越高,声音的质量就越高。但量化位数越多,需要的存储空间也就越多。
记录声音时,每次只产生一组声波数据,称单声道;每次产生两组声波数据,称双声道。双声 道具有空间立体效果,但所占空间比单声道多一倍。
经过采样、量化后,还需要进行编码,即将量化后的数值转换成二进制码组。编码是将量化 的结果用二进制数的形式表示。有时也将量化和编码过程统称为量化。
最终产生的音频数据量按照下面公式计算:
音频数据量(B)=采样时间(S)×采样频率(Hz)×量化位数(b)×声道数/8
例如,计算3 min双声道,l6位量化位数,44.1 kHz采样频率声音的不压缩的数据量为: 音频数据量=180x44 100x16x2/8=31 752 000 8一30.28 MB
2)声音文件格式
乐器数字接口(Musical Instrument Digital Interface,MIDI)文件规定了乐器、计算机、音乐合成 器以及其他电子设备之间交换音乐信息的一组标准规定。MIDI文件中的数据记录的是一些关于乐曲演奏的内容,而不是实际的声音。因此MIDI文件要比WAV文件小很多,而且易于编辑、 处理。MIDI文件的缺点是播放声音的效果依赖于播放MIDl的硬件质量,但整体效果都不如 WAV文件。产生MIDl乐音的方法有很多种,常用的有FM合成法和波表合成法。MIDI文件的 扩展名有“.mid”、“.rmi”等。
VOC文件是声霸卡使用的音频文件格式,它以“.VOC”作为文件的扩展名。其他的音频文件格式还有很多,例如,Au文件主要用在Unix工作站上,它以“.au”作为文件的扩展名;AIF文件是苹果机的音频文件格式,它以“.aif’,作为文件的扩展名,等等。