买不起专业 De-Esser 消齿音插件?DAW 自带与免费插件照样做得到(二)
买不起专业 De-Esser 消齿音插件?DAW 自带与免费插件照样做得到(二)
在录制人声的过程中,录音师或多或少会遇到“齿音(sibilance)”问题,也就是人声中因发声方式而带来的高频声音元素——例如普通话中的“s”“z”“c”等声母、英语的“ts”“s”“sh”等辅音带来的尖锐摩擦音。当它们被麦克风录制下来,我们再回听录音时,那些高频元素可能会听起来非常刺耳,令人不快。
虽说齿音可以在录制阶段通过有效的技巧避免,例如增设防喷罩、保持正确的站位,但不是所有的音乐人有足够的条件,也不是所有的混音师都能接收到不存在齿音问题的录音文件,因此去齿音(De-Ess)成为了必不可少的操作。目前市面上已经有以bFilter Pro-DS、oeksound soothe2为代表的De-Esser插件,然而不菲。
那么,对于预算有限的音乐人,是否还有更加经济实惠且行之有效的办?完全没问题!笔者的目标就是为低预算、需要免费解决方案的音乐人,旨在利用DAW自带的插件,以及免费的专业插件来实现De-Ess的目标,让“穷人”照样能做好专业的De-Ess工作。
本文是免费/低成本去齿音教程的第二篇。在上一篇教程中,我介绍了两种最为基础、最为轻量的去齿音方案,完全使用DAW自带插件,以及免费的动态均衡插件(以TDR Nova为例)实现:
- 压缩器 + 动态EQ:最轻量的方案,适用于录制环境理想、齿音不算特别尖锐的情况。以压缩器驯服齿音动态,辅以动态EQ“查缺补漏”。
- 单独使用动态EQ:通用方案,适合于温和场景下录制的音频——播客、流行演唱、旁白等。
介绍了基础之后,下一步当然就要向深层次迈进了了。在这一篇教程中,我将更进一步,为大家介绍另一种常用的去齿音方案——多段压缩。这一方案,可以适应更为复杂的齿音音频(例如力量型人声)、对音频精雕细琢,与动态EQ一道为你提供更多可对照参考的选择,助力你打造理想的人声音频。
本文的电脑环境与上一篇教程保持一致,基于REAPER 7.39展开讲解。理论上,我讲解的方具有普适性,可以适用于多款DAW与多个系统环境,你可以把我的思路套用在你的DAW自带的插件里。若你手上有专业的付费插件,你当然也可以实践这篇教程。
上一篇教程回顾:买不起专业De-Esser消齿音插件?DAW自带与免费插件照样做得到(一)
在音频处理中,除了动态EQ,多段压缩也是去齿音的常规工具,后者在原理上更接近专用的去齿音插件。如果你想要更充分还原Pro-DS等专用插件的效果,可以首选多段压缩。另一方面,对于复杂的音频,例如齿音分布比较分散、忽强忽弱的人声,多段压缩器更能作出针对性处理。
原理
多段压缩,本质是“将音频分割成多个频段,对单个频段做压缩处理”:先划分齿音所在频段(如 8k-10k),当该频段信号超过阈值时,插件会按设定的比率(如 2:1)压缩该频段的动态范围(强信号被按比例削弱,弱信号不受影响)。压缩的核心是“该频段的峰值能量”,手均匀,而非直接衰减整个频段。
简单说,多段压缩是“齿音越强,压缩力度越大”,衰减量随信号强度动态变化,更接近“对齿音的动态范围进行约束”。例如:
- 超强的齿音,直奔麦克风而来:可能被削减6 dB;
- 中等的齿音,相对比较温和:可能被削减3 dB。
这使得多段压缩特别适合齿音忽强忽弱、动态范围大的素材(如说唱,或歌手发音不稳定的情况),或者力量型人声(如男声、摇滚唱)齿音冲击力强的场景。在这些场景下,多段压缩可以确保齿音“驯服”得有力且均匀,不损失音频质感。
与动态EQ的区别
动态均衡器与多段压缩的原理有根本不同。
多段压缩则是按特定比率压缩动态范围,而非整体降低音量。而动态EQ是在特定频率的电平达到阈值时触发,削减该频率的音量,从而达到去齿音的目的。简单来说,动态EQ只有在只有齿音出现时,才临时给这个频段加一个EQ衰减,衰减量固定,或者是根据比例来微调,这更接近“局部性的音量降低”。
也因此,两种去齿音方案的适用范围也有所不同。动态EQ更适合细腻型人声(如女声、气声较多的演唱,需要保留高频泛音)、舒缓的人声(如播客、流行演唱),同时齿音分布范围比较集中。而多段压缩则更擅长处理“更复杂”的情况,如前文所述。
实操:以REAPER + ReaXcomp为例
这里,我演唱了老牌歌手蔡琴《被遗忘的时光》第一句「是谁在敲打我窗,是谁在撩动琴弦」,短短一句就有10处容易引起注意的齿音点,非常适合演示多段压缩De-Ess。
第一道工序:加载多段压缩器
在人声轨道插入 DAW 自带的多段压缩器,例如FL的Fruity Multiband Compressor、Ableton的Multiband Dynamics。这里选用REAPER的ReaXcomp,其自带了频谱图,采用“划分频谱图”的方式帮助用户设置压缩频段,非常直观、便捷。
第二道工序:齿音核心频率
在继续De-Ess之前,我们要找到齿音所在的核心频率,也就是齿音最强的频率。可以在上一篇教程(请编辑放上链接)的“最轻量:宽带压缩器 + 动态均衡器(两步) ”或“常规方:只用动态均衡器,单插件就能搞定”这两章找到通过扫频频率的方。
还有另一种方,无须借助其他插件即可。有些多段压缩器提供了“Solo current band(只播放当前频段)”的能,结合插件的频谱视图,眼、耳并用,可以帮助你快捷地并验证齿音核心频率的所在之处。下面以ReaXcomp为例来演示。
- 第一步:移步到你刚刚创建的新ReaXcomp实例。
- 第二步:反复播放人声音频,观察频谱图,留意齿音出现时频谱图是否有明显高出其余部分的尖锋,将它们所在的位置全部记录下来。在本例中,尖锋大约出现在11 k处。
- 第三步:选择一个频段(本例中为第3个频段),拖动频谱图中该频段的左右边界,使其包围尖锋所在的范围(以尖锋最高点为中心,频段宽度200 为宜)。例如,若尖锋位于9 k,则频段可设为 8 k~10 k。
- 第四步:然后,勾选界面底部的“Solo current band”复选框,播放音频,看看你是否听到明显尖锐的齿音:
- 如果是,则这就是我们要找的齿音核心频率,准备进入下一步操作。
- 如果不是,则测试其他几个尖锋,直到找到最合适的频率。
◆提示:ReaXcomp无须设置Q值。若你的多段压缩器需要设置Q值(带宽),则可以设置为1.0~2.0。带宽不要太窄,避免频段太尖锐;也不要太宽,防止影响其他高频。
第三道工序:调整压缩参数
找到齿音频段后,我们就可以着手调整齿音频段的压缩参数。按照以下思路逐一调整:
- 关闭自动补偿(Auto make-up):一些多段压缩器会有自动补偿能,原本的目的是修正因压缩导致的响度损失,但在De-Ess的工作流程中可能影响音质(尤其是齿音位于3~5 k的中高频部分,自动补偿会造成音质下降的错觉)。因此需要关闭。
- 在ReaXcomp的频谱图中,点击我们在上一步中的齿音频段(本例中为第3个频段),然后取消勾选下方的“Auto make-up gain”复选框。
- 阈值(Threshold):设置为仅当齿音出现时才触发压缩,建议从“-20 dB”开始尝试,逐步降低直到齿音被控制。需要注意的是,阈值过高会导致压缩频繁触发,声音发闷;过低则无效。
- 比率(Ratio):建议用 2:1~4:1这个比率,非极端压制,可以保持音频的自然感。避免用过高比率(如10:1)导致高频丢失。
- Attack(启动时间):设为1~10 ms。齿音是稍纵即逝的,启动时间必须足够短,以快速响应齿音的突发能量,否则压缩器将不起作用。
- Release(释放时间):设为50~100 ms。具体要根据齿音长度调整,太短会导致声音破碎,太长会影响后续音节。务必反复试听齿音所在乐句,以找准最合适的值。
第四道工序:对其他频段作处理
摇滚等力量型人声,其造成明显尖锐感的齿音峰值可能不止一处;在本例中,我就找到了2处听感比较尖锐的尖峰。对此,你需要:
- 重复第二道工序,找到所有的齿音核心频率,分别创建新的频段来包围齿音峰值。
- 对每个齿音频段重复第三道工序,确保所有的齿音都被多段压缩器驯服。
需要注意的是,ReaXcomp的频段划分是首尾相接的,就像是Microsoft Word的表格那样。如果两个齿音频段不相邻,那么你需要在两个齿音频段之间新建一个频段隔开,这样才能正确划出两个足够窄的频段,如下图所示:

图 2 假设要划分两个不连续的齿音频段(图中的频段3和5),由于ReaXcomp的频段是首尾相接的,因此我们需要创建一个新频段(图中的频段4),这样才能正确划分得到我们想要的频段。
◆注意:为了分隔而创建的新频段务必保持默认值,或直接禁用(取消勾选下方的“Active”),否则会干扰De-Ess。
第五道工序:与微调
按照上述四道工序配置压缩频段的参数后,反复播放反复聆听,观察压缩器的增益衰减表(Gain Reduction),齿音出现时衰减3~5 dB即可,避免持续衰减超过6 dB(否则声音会发暗)。若衰减过多导致声音发暗,可以适当抬高阈值或调低比率。
由于多段压缩器设计各异,它们并不像宽带压缩器那样有“万变不离其宗”的增益衰减表设计。在ReaXcomp中,增益衰减表出现在频谱图的频段中,呈现为垂直向下的柱形图,带有的数值标记者衰减量。

图 3 ReaXcomp工作室的频谱图(示意)。频段3中,标有数字的那一段柱形图就是增益衰减表,蓝色则为自动补偿的增益表。
效果展示
经过De-Ess后的音频如下所示。对比一下,看看齿音是不是柔和了不少?
试听音频素材:1.2_《被遗忘的时光》ReaXcomp De-Ess.flac
最后展示一下本例中笔者使用的ReaXcomp参数:

图 4 第1个齿音频段(图中的频段5,中心频率约11 k)。

图 5 第2个齿音频段(图中的频段3,中心频率约5.7 k)
不同演唱者的人声有不同的特质,有的人声在进行De-Ess处理后反而会导致空气感(轻量感)下降。另一方面,如果音乐中充满各类强烈的高频乐器(如摇滚的失真吉他),就可能导致这样一种现象:单听De-Ess的人声还很和谐,但与伴奏乐器放在一起听,则原有的人声空气感被掩盖。
这时,我们就可以采用“分频段并行压缩”的策略:把人声切成“低频主体”+“高频齿音”两条并行轨道,只对高频做压缩。适用于齿音尖锐,但不想牺牲高频空气感的场景。
原理
更深入一层来说,“分频段并行压缩”把整条人声切成两条通路:低频主体保持原状,高频齿音单独经由压缩器处理;再把两条信号按可控比例混合,从而只降低齿音峰值,不碰其它频率与瞬态。
在单独处理齿音时,多段压缩器会将齿音的尖锋压下。随后,通过并行播放原始音频,将去齿音时损失的高频信号补回来,还原原本的清亮感,不影响齿音处理。得益于并行处理,整个De-Ess过程仅3~8 k被瞬时削平,低频与高频空气段毫发无损,比静态EQ挖一个“永久凹槽”要自然得多。
并行结构还带来0~6 dB的可调范围,想再亮一点就拉回推子,想再暗就继续下压——混音阶段仍能“无损”反悔。
实操
接下来还是以我演唱的《被遗忘的时光》作为演示音频:
第一道工序:人声轨道
在DAW中,创建两条轨道:Body(主体)、Sibilance(齿音)。将原始的人声素材放到“Body”轨中,然后将素材一份放到“Sibilance”轨中。
第二道工序:对“Sibilance”音轨的高频作压缩
独奏(solo)“Sibilance”音轨,并在该音轨插入多段压缩器,例如ReaXcomp。然后,依次进行如下操作:
- 第一步:划分“工作频段”。选择一个压缩频段,将范围设定为4~8 k,该频段覆盖了齿音集中出现的范围。当然,你仍然需要根据音频的实际情况来调整频段范围。
- 第二步:只保留工作频段的音频,也就是将其余频段统统设为静音状态。对于支持“只播放特定频段”的多段压缩器,只需为工作频段开启该能即可(例如,勾选ReaXcomp的“Solo current band”复选框)。
- 第三步:关闭“自动补偿(auto make-up)”能,避免不必要的增益导致工作频段过于突出。
- 第四步:将工作频段的压缩比率(Ratio)设为4:1~6:1。这里的比率,比“多段压缩:去齿音的标准做 ”的更大一些,更大幅度压制该频段,方有助于后续使用音量推子调出合适的去齿音水平。
- 第五步:一边试听,一边调节阈值(Threshold),使得齿音一出现就刚好触发压缩器。
- 第六步:启动时间(Attack)设为0 ms,确保立即抓住齿音;释放时间(Release)设为20~40 ms,根据齿音长度调整到合适的时间点。
- 第七步:边试听边微调阈值、压缩比率等参数,使得齿音尖锋被压缩4~6 dB。
以下是本例中我为“Sibilance”音轨设置的ReaXcomp参数:

图 6 本例中“Sibilance”音轨的压缩参数。留意此处为频段3打开了“Solo current band”能。
第三道工序:平衡“Body”与“Sibilance”音轨
光是操作“Sibilance”还远远不够:由于压缩比率大,单独聆听“Sibilance”音轨时,你会觉得De-Ess“用力过猛”了。不用担心,我们还要完成本方案的重头戏——并行压缩:只有把“Body”与“Sibilance”两个音轨的信号组合起来,才能达到最终的效果。
具体遵循以下方针:
- 调节“Body”的音量,以该音轨的音量来确定主体响度;
- 随后,“Sibilance”的音量从-∞慢慢向上推,直到齿音刚好不刺耳;
- 最后,给两条推子做“最后1 dB”的微调。
那么,我们正式开始实战:
- 第一步:确定“Body”轨的音量。
- 把“Sibilance”轨静音,单独“Body”轨,确认整句人声主体音量已经OK(和平时混音一样响即可)。
- 然后,记下这条“Body”音量推子的位置(比如 -15 dB),不动它了。
- 第二步:调节“Sibilance”轨的音量。
- 这次,把“Body”轨静音,单独“Sibilance”轨。
- 把“Sibilance”轨的音量推子拉到最底(-∞),慢慢往上推,每推 2 dB 停一次,播放同一句齿音最多的词。当第一次听到「嘶」声开始变薄、变闷,就停手。此时推子位置一般落在 -10 dB 到 -6 dB 之间。
- 第三步:两条轨道一起放,做“最后1 dB”微调。
- 首先,把两条轨道都取消静音。
- 然后,“Sibilance”的推子再往回(下拉)1 dB 左右,直到“齿音刚好听不见刺耳,但“S”声仍完整——也就是说,齿音被压到不再刺耳,但辅音/s/、/ʃ/、/tʃ/ 等的“廓”和“时长”没有变得含糊。
- 如果还是刺耳,“Sibilance”的推子再下拉0.5 dB;如果出现口齿含糊,就再上浮0.5 dB,直到效果理想。
整个第三道工序里,只动“Sibilance”推子,“Body”推子保持这一步刚开始的位置不变。经过这道工序后,齿音将得到有效抑制,声音听起来平顺不少。

图 7 本例中,“Body”音量推子设为-14.6 dB,“Sibilance”在经过仔细调试后设为-13.6 dB,使我这段录音达到良好的去齿音效果。
第四道工序:写自动化(可选)
在时,若你发现个别字仍然“冒刺儿”,怎么办?往往整体把“Sibilance”音轨拉高可以驯服那些字词,但却容易顾此失彼,造成其他的字词听着暗淡。
这时,你可以在DAW中,为“Sibilance”音轨编写自动化:齿音大的字再下拉1 dB,说完立即回到原位置。
相反,若你发现个别字由于De-Ess过度而导致浑浊不清,则同样写自动化,把“Sibilance”推子在该字上抬0.5~1 dB,说完立刻复位。
在DAW中编写自动化时,务必选择与音轨音量有关的参数,例如REAPER音轨自动化选项中的“Track Envelope” ==> “Volume”。

图 8 在REAPER中,使用本章节的方对齿音进行自动化处理时,请使用图中红框框出来的这个参数。
◆注意:包括REAPER在内的部分DAW,在设置自动化包络时,音量包络的值会覆盖掉你之前设置的推子值。因此你可能要通过绘制包络线来重新控制“Sibilance”轨的音量。
验证效果
在完成处理后,为了确保我们的处理效果达到预期,不妨进行一次“快速A/B验证”——把“Sibilance”轨整体静音/取消静音,对比前后差异:
- 若静音时齿音发刺,就证明“Sibilance”轨确实在干活;
- 若取消静音时齿音消失,但人声亮度几乎不变,推子位置就正确了。
效果展示
最后为大家展示一下经过处理后的音频,看看是不是齿音削弱了,同时高频部分依然清亮如初?
试听音频素材:1.3_《被遗忘的时光》并行多段压缩De-Ess.flac
进阶提示
可配合侧链噪声门使用
如果想更自然,可以给“Sibilance”轨再插一个带侧链的噪声门插件(Gate),用“Body”轨做Key(键控输入),这样只在有字的时候多段压缩才工作。
人声太小怎么办?
在本方案中,人声音轨的音量水平始终取决于“Body”轨的音量。如果你感觉人声音量太小,你应当重新确定“Body”轨的音量水平,然后重新进行第三道工序来平衡两个音轨的音量。
小音量,更易听出齿音残留
无论使用还是音箱混音,都不宜把音量开的太大,不仅是为了保护听力,还因为大音量容易造成听觉疲劳,使得音频中的一些细节被“掩蔽”。
去齿音时也是如此,并不是音量越大越能听出齿音。根据Fletcher-Munson 等响曲线,小音量时,耳朵对1 k以下的敏感度会明显衰减,对4 k附近相对“衰减得少”,所以齿音听起来“突出”了。因此,在调节音量时“反其道而行之”,把音量开得很小,反而更容易听出齿音残留。既保护听力,又能为De-Ess查漏补缺,一举两得。
当然,要想发挥“小音量查漏”的优势,水平需要保持在60~70 dB SPL(声压级)左右,这是人耳判断高频细节的“甜点”。另一方面,即使在卧室做混音,也务必确保周遭环境足够安静,否则弱信号会被噪声掩蔽。
双
若你同时拥有和音箱,在De-Ess时可以给它们分别派任务:用找齿音,用音箱确认高频空气感。使用两种设备进行A/B比对。
优势是隔绝房间反射、左右耳无串扰,所以微小细节(短峰、低电平齿音)不会被混响掩蔽,利于捕捉细节。而用音箱确认空气感,主要是检验房间的效果。
“双”分两步:先用捕捉短促齿音(无房间反射,细节最暴露);再换音箱检验是否削得过多——房间吸声和离轴响应会让高频自然衰减,若音箱听起来明显发闷,就把De-Ess量往回退1 dB,再回确认齿音未反弹。如此往返,直到不刺耳、音箱不黯淡,即为平衡点。
具体如何“回退”,取决于你使用的方案。你需要观察增益衰减表,并综合调节压缩比率、阈值、动态EQ增益等参数。
注意效果器顺序
在进行De-Ess前后,你仍然可以使用其他效果器,但一定要注意顺序。例如,如果你的人声音轨使用了均衡器、压缩器、饱和/激励效果器,那么务必遵循以下顺序:
EQ → De-Ess → Compressor → 饱和/激励
不要弄反,否则压缩器又会把齿音顶出来。
混响,以及风格化效果器(如镶边器〔flanger〕、失真效果)也是如此,应当放在最后,否则容易干扰去齿音效果。
在不使用专门De-Ess插件的去齿音工作中,多段压缩是除动态EQ外常备的工具,对于驯服齿音分布比较分散、忽强忽弱的人声,以及处理力量型人声等比较复杂的场景,可以更好地胜任,在驯服齿音动态的同时还能保留音频空气感。
在教程里,笔者着重介绍了多段压缩去齿音的两种工作模式:
- 单独使用多段压缩:“靶向性”强,快速处理指定的齿音尖峰频率,快速易上手。
- 分频段并行压缩:多段压缩的更高阶用。使用两条播放相同内容的人声音轨——“Body”与“Sibilance”,后者使用较宽频段的多段压缩(如4~8 k)。随后,调整两个音轨的音量平衡,实现更精细、灵活的去齿音,保留人声空气感。
同时,笔者还强调了三点实用技巧:小音量、音箱与双,以及注意效果器的顺序。这三个技巧有助于你更精准把握齿音所在,保证De-Ess的质量符合预期水准。
基本上,本系列教程前两篇里介绍的技巧,已经能覆盖大部分De-Ess的场景。实际上,去齿音还有更为高阶、更具“技术流”的玩,例如使用FFT均衡器(如ReaFIR)、频谱编辑,笔者将在下一篇教程中继续为大家讲解。敬请期待。
可下载 Midin for iOS 应用在或平板上阅读(直接在App Store里搜索Midin即可找到,或扫描下面的二维码直接下载),在 iPad 或 iPhone 上下载并阅读。



