残夜花香月满楼书包网:数字音频技术(雪碧sprite)
来源:百度文库 编辑:中财网 时间:2024/04/29 05:50:48
数字音频技术
第一章 绪论
1、彩色电视三种制式:NTSC(美国)、PAL(德国)、SECAM(法国和前苏联)
2、数字音频三种制式:AHD(日本胜利公司)、MD(德国德律风根和Teldec公司)、CD(荷兰飞利浦和日本索尼)
3、数字音频技术应用的五个领域:(1)音响产品(CD\DAT\DCC\MP3\MD)、(2)声音制作系统(电视台、 广播电台在声音节目制作系统中使用数字调音台、硬盘工作站、数字音频制作工作站)、(3)多媒体应用 (VCD、DVD音视频媒体、计算机以及Internet网)、(4)广播电视数字化(数字卫星电视广播、数字有线电视广播、数字地面电视广播、数字声音广播)、(5)通讯(移动通信网、市内电话网、光纤传输网三网融合组成的通信网用低速率语音压缩降低比特率)
4、数字音频发展方向:一、提高数字声质量;二、降低传输信息比特率;三、利用计算机对音视频压缩算法进行仿真研究,有助于用DSP实现算法所需的运算量和对存储量作出估算
电视机 音箱 功放 音源 话筒
第二章 数字音频基础
1、 数字化:将事件与幅度上连续变化的声音变换为脉冲数据的过程
2、 模/数变换:采样、量化、编码(编码形成的数码率与采样频率f、量化比特数N及传输信号路数M关系式:数码速率=f(Hz)*N*M,如CD:44.1k*16*2=1.41Mbit/s)
第三章 音频压缩编码
1、声音编码方式:时域编码、频域编码和统计编码(依据声音信号的冗余度以及人耳听觉的声掩蔽,将人耳听觉听不到的分量去掉,降低编码后的数据比特率)
2、声音物理特性:声音信号的频率范围为20HZ~20kHz,其电平及频谱分布虽有差异,但有着相同的规律。即频谱分布在高频段是大幅下降;电平的不平衡体现在高幅值的,但出现的几率小。说明声音信号电平有冗余,给银屏数据压缩提供了基础。
3、人耳听觉特性:人耳听觉频率范围为20HZ~20kHz,外耳有一定长度的耳道,会对声音产生共鸣,致使灵敏度提高,频率段为3kHZ~5kHz,因此人耳听到声音的响度与声音的频率有关;人耳听到声音的响度还与声音的持续时间有关,持续时间缩短时,人耳感到响度有所下降;并且还存在掩蔽效应——频域掩蔽(强音压低音,低频率声音压高频率声音)和时域掩蔽。
4、层(Layer):层是表征操作模式,其复杂度、性能、码率压缩比依层号的加大而递增,如MPEG-1音频包含3层。
5、桢(Frame):桢一词来自图像,其意是将一个连续活动图像化为一幅幅画面。数字音频中,其意是模拟信号变为数码,将其数码分成许多的小部分,称这小部分为桢。CD中将6次采样值归为1桢。
6、数字音频编码标准:MPEG和ATSC的Dolby AC-3
7、声音编码方式:无损压缩和有损压缩
8、时域编码:利用声音信号在时间域内幅度变化经PCM后形成的样本值,对不同的样本值实现二进制码替代,从而形成数码流。
方法:(1)瞬时压缩/扩张(随着时间幅度的变化而将其量化阶梯改变,从而降低比特率的编码方法)(压缩途径:一是Vp-p为10V的模拟信号进入A/D变换器之前经压缩器处理,二是Vp-p模拟信号直接进入A/D变换器但进行非线性量化,三是Vp-p模拟信号直接进入A/D变换器进行16比特线性量化,然后进行处理)
(缺点:第一,量化噪声将增大;第二,由于量化阶梯随着电平高低而变化,声音将产生“喘气”感觉)
[16/12比特瞬时压缩/扩张:(16比特线性量化、32kHz、双声道立体声,就信源编码而言比特率为:2*32*1000*16=1.024Mbps)(采用12比特非线性量化、32kHz、双声道立体声比特率为:2*32*1000*12=0.768Mbps) 压缩比为:1.024/0.768=1.33]
(2)准瞬时压缩/扩张(在编码器中采用量化阶梯大小浮动并将其大小浮动的比例因子或量程因子发送给解码器的方法)
(3)以及预测编码、增量编码等。
9、频域编码:由于信号的时域和频域之间存在内在联系,可以将时域中声音信号进行频率变换,结合声音的相关性及人的感知,选取量化比特数进行编码,应用这种原则警醒的编码方式称频域编码。
包括子带编码、离散余弦变换编码等
频域编码是利用:(1)、采用滤波和变换(FFT),可在频域内将其能量较小的分量忽略,从而实现降低比特率。(2)、利用人耳听觉得声掩蔽,在满足一定的量化噪声下来压缩数码率。
第四章 音频文件与接口
1、音频文件包括声音文件和MIDI文件。声音文件为声音记录在载体的原始声音资料(Wave文件、AIFF文件、Audio文件、Sound文件、Voice文件、MPEG音频文件);而MIDI文件则为乐器的演奏指令序列,供声源(合成器等)与计算机连接的键盘、吹管、数字鼓及其它带有MIDI接口的乐器进行演奏。
WAVE为存储声音数据信息、非压缩格式(节目制作母版,存储空间大与采样频率与量化精度有关);REAL及MP3为压缩格式(MP3的压缩利用了人体听觉的系统掩蔽效应中的频域掩蔽效应);MIDI不存储数据而存储指令为非波形声音文件(容易进行数据交换,文件不记录声音采样数据,不会产生数据损耗,声音质量完全取决于声音的输出设备,需要的存储空间小)。
2、接口是指一种规格标准,两个系统之间相互沟通的通信协议,以及不同设备为实现与其他系统或设备的通信而具有的对接部分。
3、数字音频接口卡(音频适配卡):完成A/D及D/A变换。
4、I/O接口(硬盘驱动器接口:SCSI接口是小型计算机系统接口的缩写,并行接口,最多连接8个外部单元,20Mbit/s;ATA接口又称IDE,并行接口;USB连接外围设备的I/O接口,可连接多达127个外设,距离可达5米;IEEE1394由美国苹果开发称为“火线”的串行总线接口的产物,同USB支持热拔插,节点可串接63个外设,双绞线以数据包传输,通过减弱传输线中的噪声来实现高速的数据传输输率,支持同步和异步数据传输)
第五章 数字音频设备
1、数字音频设备包括音响工程、声音录制及声音后期制作使用的设备和器件,以功能分为:电声转换器(传声器和扬声器)、声源、混缩设备、声音记录设备、声音编辑及声音处理的周边设备。除扬声器都已实现数字化。
2、话筒:动圈话筒、电容话筒(+48V,音域宽)、电子管话筒。
3、数字信号处理系统的结构是由A/D变换、数字信号处理(DSP)及变换构成。
4、数字域频率均衡:(均衡器EQ)频率均衡实质是通过某个手段调整符合信号中所含有的频率分量幅度,致使某些频率分量的幅度增大或降低。完成频域均衡的四种类型:斜坡型、峰谷型、图式型、参量型。
第六章 数字音频工作站
1、声音节目制作依照制作方式可以分为:同期声(同期声录制所使用的设备有传声器、调音台和双轨录音机,工序较为简单)和后期合成(按工序分为前期声音采集和后期缩混合成,工序多而且要对采集来的声音素材进行处理加工)两种。
2、数字音频工作站是一种基于计算机具有强大的数据处理能力,以计算机硬磁盘为主要记录载体完成声音节目的录制;借用声卡或CPU,在软件的支持具有声音录放、加工处理、非线性编辑及管理等节目制作功能。
分类:(1)依据工作性质: 数字音频制作工作站(对声音节目进行制作的设备)和数字音频播出工作站(用于广播节目播出的设备),制作工作站要求声卡功能强大也可以代替播出工作站。
(2)依据结构类型: 专业型(特别为节目后期制作设计的数字音频制作工作站)、主控型(由苹果机主机控制的数字音频工作站)及主机型(以PC机为核心的工作站)
第七章 音频数据传输
1、声音模拟信号经数字化后的数据流的传输方式:基带传输(广电系统中,用在节目制作部门与播控室之间数据传输)和载波传输(用在卫星、有线电视网及地面数字电视中的伴音及数字声广播)。