数字混音的命门与解决之道(3) | WebRTC编风网
0

数字混音的命门与解决之道(3)

已有 183 人阅读此文 - - 铸声场(微信ID:sonicworks) - 吴健

可能很多搞音频的朋友认为这只是个穴头,48Bit到24Bit谁能听得出来,都一样的声音。这里我们首先用一个小的视频片断来夸大这个效果,但在这里我们可以得到一个似曾相识的结果,当我们拉下推子时,谐波失真使听到的声音解析力非常差,但当我们给信号加入一些随机噪音时,效果马上改观了。

这里有一个图例:可以来解释一下

22

一个8Bit的图像,不同的深度颜色的过渡为8Bit. 要转为1Bit时,0表示黑色,1表示白色,这样我们损失了一半的信息表达。

但是,主角上场后:

23

首先加入噪点,然后再截断到1Bit(只有黑白01两种颜色),这样我们基本保持了原画的品质。提高了辩识度。

e7d0-tmp

在这个实例中,是否加入Dither结果完全不同,从48Bit到24Bit也是一样,只不过谐波失真更小,但是有经验的音响师能够听到或者是感知到这样的失真。这种失真我们可以在音频工作站中用Lofi类数字失真效果器实现。Bit位数的截断是HiFi与LoFi的区别。

Dither在最后输出到24Bit的传输总线中(这个传输总线可能是DSP系统里的传输,也可能是最后输出到DA转换器),在主输出端有一个最后的抖动处理。抖动就是添加原信号里的随机噪声,噪声基底与原始信号没有相关性,当数位长度减小时,所得到的波形不包含任何谐波失真。

我们的调音台在经过多重处理,并轨混音后,会产生出48Bit高动态的音频流,然后抖动噪声被添加到48位信号,然后再截断到24位以放回TDM总线并发送给DAC。抖动并不是在逐个轨道上添加的,那样将会产生象模拟调音台一样的累积噪声。抖动仅在混音总线的主衰减器输出处添加一次,因此总系统抖动噪声在-144 dB上3dB。

这个真正的系统拓扑结构中,硬件输出信号必须是24位,在多DSP系统中,如ProTools和UAD中,从DSP传递到DSP通过TDM总线,这些总线也是24Bit的,但是新型的FPGA的AMBA总线、AXI总线可以是64Bit,甚至是128Bit的,所以FPGA+ARM的总线结构间传输音频数据流是不需要Dither的,FPGA架构音频处理器只需要再最后输出的时候作Dither。但重要的是要了解添加到信号的抖动电平约为-144 dB,这低于DA转换器的本底噪声。考虑人耳的动态范围大约为120 dB(从可听到的阈值到痛阈值)。“-144 dB”对于我们的模拟监听系统来说是根本达不到的水平,因此我们显示器系统启动到非常高的水平,所以-144 dB以下我们可以安全的加入Dither而不被听见。

因此,我们现在可以得出结论:

1、音频处理需要更高的内部精度,32bit(普通DSP), 48Bit(如AVID ProTools系统),64bit(FPGA双精度系统)。

2、从大于24Bit的内部精度输出到24Bit精度DA时,如果截断位数输出。将会产生谐波失真,影响声音的品质。

3、Dither在人耳不可能听到的低电平值上-144dB加入噪声来消除谐波失真。

我们还可以根据这些结论改进音频系统:

1,建立一个更为实时高精度的FPGA浮点处理系统。

2,  总输出使用更高位的32Bit 模数DA。

本文到这里结束了。我不知道我有没有说清楚关于数字混音引擎这个让人觉得特高大上的技术名词。太久没有搞教学了,这方面有些生。

 

0
相关文章!