买不起专业 De-Esser 消齿音插件？DAW 自带与免费插件照样做得到（二）

2025-12-7

买不起专业 De-Esser 消齿音插件？DAW 自带与免费插件照样做得到（二）

在录制人声的过程中，录音师或多或少会遇到“齿音（sibilance）”问题，也就是人声中因发声方式而带来的高频声音元素——例如普通话中的“s”“z”“c”等声母、英语的“ts”“s”“sh”等辅音带来的尖锐摩擦音。当它们被麦克风录制下来，我们再回听录音时，那些高频元素可能会听起来非常刺耳，令人不快。

虽说齿音可以在录制阶段通过有效的技巧避免，例如增设防喷罩、保持正确的站位，但不是所有的音乐人有足够的条件，也不是所有的混音师都能接收到不存在齿音问题的录音文件，因此去齿音（De-Ess）成为了必不可少的操作。目前市面上已经有以bFilter Pro-DS、oeksound soothe2为代表的De-Esser插件，然而不菲。

那么，对于预算有限的音乐人，是否还有更加经济实惠且行之有效的办？完全没问题！笔者的目标就是为低预算、需要免费解决方案的音乐人，旨在利用DAW自带的插件，以及免费的专业插件来实现De-Ess的目标，让“穷人”照样能做好专业的De-Ess工作。

本文是免费／低成本去齿音教程的第二篇。在上一篇教程中，我介绍了两种最为基础、最为轻量的去齿音方案，完全使用DAW自带插件，以及免费的动态均衡插件（以TDR Nova为例）实现：

压缩器 + 动态EQ：最轻量的方案，适用于录制环境理想、齿音不算特别尖锐的情况。以压缩器驯服齿音动态，辅以动态EQ“查缺补漏”。
单独使用动态EQ：通用方案，适合于温和场景下录制的音频——播客、流行演唱、旁白等。

介绍了基础之后，下一步当然就要向深层次迈进了了。在这一篇教程中，我将更进一步，为大家介绍另一种常用的去齿音方案——多段压缩。这一方案，可以适应更为复杂的齿音音频（例如力量型人声）、对音频精雕细琢，与动态EQ一道为你提供更多可对照参考的选择，助力你打造理想的人声音频。

本文的电脑环境与上一篇教程保持一致，基于REAPER 7.39展开讲解。理论上，我讲解的方具有普适性，可以适用于多款DAW与多个系统环境，你可以把我的思路套用在你的DAW自带的插件里。若你手上有专业的付费插件，你当然也可以实践这篇教程。

上一篇教程回顾：买不起专业De-Esser消齿音插件？DAW自带与免费插件照样做得到（一）

在音频处理中，除了动态EQ，多段压缩也是去齿音的常规工具，后者在原理上更接近专用的去齿音插件。如果你想要更充分还原Pro-DS等专用插件的效果，可以首选多段压缩。另一方面，对于复杂的音频，例如齿音分布比较分散、忽强忽弱的人声，多段压缩器更能作出针对性处理。

原理

多段压缩，本质是“将音频分割成多个频段，对单个频段做压缩处理”：先划分齿音所在频段（如 8k-10k），当该频段信号超过阈值时，插件会按设定的比率（如 2:1）压缩该频段的动态范围（强信号被按比例削弱，弱信号不受影响）。压缩的核心是“该频段的峰值能量”，手均匀，而非直接衰减整个频段。

简单说，多段压缩是“齿音越强，压缩力度越大”，衰减量随信号强度动态变化，更接近“对齿音的动态范围进行约束”。例如：

超强的齿音，直奔麦克风而来：可能被削减6 dB；
中等的齿音，相对比较温和：可能被削减3 dB。

这使得多段压缩特别适合齿音忽强忽弱、动态范围大的素材（如说唱，或歌手发音不稳定的情况），或者力量型人声（如男声、摇滚唱）齿音冲击力强的场景。在这些场景下，多段压缩可以确保齿音“驯服”得有力且均匀，不损失音频质感。

与动态EQ的区别

动态均衡器与多段压缩的原理有根本不同。

多段压缩则是按特定比率压缩动态范围，而非整体降低音量。而动态EQ是在特定频率的电平达到阈值时触发，削减该频率的音量，从而达到去齿音的目的。简单来说，动态EQ只有在只有齿音出现时，才临时给这个频段加一个EQ衰减，衰减量固定，或者是根据比例来微调，这更接近“局部性的音量降低”。

也因此，两种去齿音方案的适用范围也有所不同。动态EQ更适合细腻型人声（如女声、气声较多的演唱，需要保留高频泛音）、舒缓的人声（如播客、流行演唱），同时齿音分布范围比较集中。而多段压缩则更擅长处理“更复杂”的情况，如前文所述。

实操：以REAPER + ReaXcomp为例

这里，我演唱了老牌歌手蔡琴《被遗忘的时光》第一句「是谁在敲打我窗，是谁在撩动琴弦」，短短一句就有10处容易引起注意的齿音点，非常适合演示多段压缩De-Ess。

试听音频素材：1.1_《被遗忘的时光》录音.flac

第一道工序：加载多段压缩器

在人声轨道插入 DAW 自带的多段压缩器，例如FL的Fruity Multiband Compressor、Ableton的Multiband Dynamics。这里选用REAPER的ReaXcomp，其自带了频谱图，采用“划分频谱图”的方式帮助用户设置压缩频段，非常直观、便捷。

图 1 ReaXcomp的初始界面。

第二道工序：齿音核心频率

在继续De-Ess之前，我们要找到齿音所在的核心频率，也就是齿音最强的频率。可以在上一篇教程（请编辑放上链接）的“最轻量：宽带压缩器 + 动态均衡器（两步） ”或“常规方：只用动态均衡器，单插件就能搞定”这两章找到通过扫频频率的方。

还有另一种方，无须借助其他插件即可。有些多段压缩器提供了“Solo current band（只播放当前频段）”的能，结合插件的频谱视图，眼、耳并用，可以帮助你快捷地并验证齿音核心频率的所在之处。下面以ReaXcomp为例来演示。

第一步：移步到你刚刚创建的新ReaXcomp实例。
第二步：反复播放人声音频，观察频谱图，留意齿音出现时频谱图是否有明显高出其余部分的尖锋，将它们所在的位置全部记录下来。在本例中，尖锋大约出现在11 k处。
第三步：选择一个频段（本例中为第3个频段），拖动频谱图中该频段的左右边界，使其包围尖锋所在的范围（以尖锋最高点为中心，频段宽度200 为宜）。例如，若尖锋位于9 k，则频段可设为 8 k～10 k。
第四步：然后，勾选界面底部的“Solo current band”复选框，播放音频，看看你是否听到明显尖锐的齿音：

如果是，则这就是我们要找的齿音核心频率，准备进入下一步操作。
如果不是，则测试其他几个尖锋，直到找到最合适的频率。

◆提示：ReaXcomp无须设置Q值。若你的多段压缩器需要设置Q值（带宽），则可以设置为1.0～2.0。带宽不要太窄，避免频段太尖锐；也不要太宽，防止影响其他高频。

第三道工序：调整压缩参数

找到齿音频段后，我们就可以着手调整齿音频段的压缩参数。按照以下思路逐一调整：

关闭自动补偿（Auto make-up）：一些多段压缩器会有自动补偿能，原本的目的是修正因压缩导致的响度损失，但在De-Ess的工作流程中可能影响音质（尤其是齿音位于3～5 k的中高频部分，自动补偿会造成音质下降的错觉）。因此需要关闭。

在ReaXcomp的频谱图中，点击我们在上一步中的齿音频段（本例中为第3个频段），然后取消勾选下方的“Auto make-up gain”复选框。

阈值（Threshold）：设置为仅当齿音出现时才触发压缩，建议从“-20 dB”开始尝试，逐步降低直到齿音被控制。需要注意的是，阈值过高会导致压缩频繁触发，声音发闷；过低则无效。
比率（Ratio）：建议用 2:1～4:1这个比率，非极端压制，可以保持音频的自然感。避免用过高比率（如10:1）导致高频丢失。
Attack（启动时间）：设为1～10 ms。齿音是稍纵即逝的，启动时间必须足够短，以快速响应齿音的突发能量，否则压缩器将不起作用。
Release（释放时间）：设为50～100 ms。具体要根据齿音长度调整，太短会导致声音破碎，太长会影响后续音节。务必反复试听齿音所在乐句，以找准最合适的值。

第四道工序：对其他频段作处理

摇滚等力量型人声，其造成明显尖锐感的齿音峰值可能不止一处；在本例中，我就找到了2处听感比较尖锐的尖峰。对此，你需要：

重复第二道工序，找到所有的齿音核心频率，分别创建新的频段来包围齿音峰值。
对每个齿音频段重复第三道工序，确保所有的齿音都被多段压缩器驯服。

需要注意的是，ReaXcomp的频段划分是首尾相接的，就像是Microsoft Word的表格那样。如果两个齿音频段不相邻，那么你需要在两个齿音频段之间新建一个频段隔开，这样才能正确划出两个足够窄的频段，如下图所示：

图 2 假设要划分两个不连续的齿音频段（图中的频段3和5），由于ReaXcomp的频段是首尾相接的，因此我们需要创建一个新频段（图中的频段4），这样才能正确划分得到我们想要的频段。

◆注意：为了分隔而创建的新频段务必保持默认值，或直接禁用（取消勾选下方的“Active”），否则会干扰De-Ess。

第五道工序：与微调

按照上述四道工序配置压缩频段的参数后，反复播放反复聆听，观察压缩器的增益衰减表（Gain Reduction），齿音出现时衰减3～5 dB即可，避免持续衰减超过6 dB（否则声音会发暗）。若衰减过多导致声音发暗，可以适当抬高阈值或调低比率。

由于多段压缩器设计各异，它们并不像宽带压缩器那样有“万变不离其宗”的增益衰减表设计。在ReaXcomp中，增益衰减表出现在频谱图的频段中，呈现为垂直向下的柱形图，带有的数值标记者衰减量。

图 3 ReaXcomp工作室的频谱图（示意）。频段3中，标有数字的那一段柱形图就是增益衰减表，蓝色则为自动补偿的增益表。

效果展示

经过De-Ess后的音频如下所示。对比一下，看看齿音是不是柔和了不少？

试听音频素材：1.2_《被遗忘的时光》ReaXcomp De-Ess.flac

最后展示一下本例中笔者使用的ReaXcomp参数：

图 4 第1个齿音频段（图中的频段5,中心频率约11 k）。

图 5 第2个齿音频段（图中的频段3，中心频率约5.7 k）

不同演唱者的人声有不同的特质，有的人声在进行De-Ess处理后反而会导致空气感（轻量感）下降。另一方面，如果音乐中充满各类强烈的高频乐器（如摇滚的失真吉他），就可能导致这样一种现象：单听De-Ess的人声还很和谐，但与伴奏乐器放在一起听，则原有的人声空气感被掩盖。

这时，我们就可以采用“分频段并行压缩”的策略：把人声切成“低频主体”+“高频齿音”两条并行轨道，只对高频做压缩。适用于齿音尖锐，但不想牺牲高频空气感的场景。

原理

更深入一层来说，“分频段并行压缩”把整条人声切成两条通路：低频主体保持原状，高频齿音单独经由压缩器处理；再把两条信号按可控比例混合，从而只降低齿音峰值，不碰其它频率与瞬态。

在单独处理齿音时，多段压缩器会将齿音的尖锋压下。随后，通过并行播放原始音频，将去齿音时损失的高频信号补回来，还原原本的清亮感，不影响齿音处理。得益于并行处理，整个De-Ess过程仅3～8 k被瞬时削平，低频与高频空气段毫发无损，比静态EQ挖一个“永久凹槽”要自然得多。

并行结构还带来0～6 dB的可调范围，想再亮一点就拉回推子，想再暗就继续下压——混音阶段仍能“无损”反悔。

实操

接下来还是以我演唱的《被遗忘的时光》作为演示音频：

试听音频素材：1.1_《被遗忘的时光》录音.flac

第一道工序：人声轨道

在DAW中，创建两条轨道：Body（主体）、Sibilance（齿音）。将原始的人声素材放到“Body”轨中，然后将素材一份放到“Sibilance”轨中。

第二道工序：对“Sibilance”音轨的高频作压缩

独奏（solo）“Sibilance”音轨，并在该音轨插入多段压缩器，例如ReaXcomp。然后，依次进行如下操作：

第一步：划分“工作频段”。选择一个压缩频段，将范围设定为4～8 k，该频段覆盖了齿音集中出现的范围。当然，你仍然需要根据音频的实际情况来调整频段范围。
第二步：只保留工作频段的音频，也就是将其余频段统统设为静音状态。对于支持“只播放特定频段”的多段压缩器，只需为工作频段开启该能即可（例如，勾选ReaXcomp的“Solo current band”复选框）。
第三步：关闭“自动补偿（auto make-up）”能，避免不必要的增益导致工作频段过于突出。
第四步：将工作频段的压缩比率（Ratio）设为4:1～6:1。这里的比率，比“多段压缩：去齿音的标准做 ”的更大一些，更大幅度压制该频段，方有助于后续使用音量推子调出合适的去齿音水平。
第五步：一边试听，一边调节阈值（Threshold），使得齿音一出现就刚好触发压缩器。
第六步：启动时间（Attack）设为0 ms，确保立即抓住齿音；释放时间（Release）设为20～40 ms，根据齿音长度调整到合适的时间点。
第七步：边试听边微调阈值、压缩比率等参数，使得齿音尖锋被压缩4～6 dB。

以下是本例中我为“Sibilance”音轨设置的ReaXcomp参数：

图 6 本例中“Sibilance”音轨的压缩参数。留意此处为频段3打开了“Solo current band”能。

第三道工序：平衡“Body”与“Sibilance”音轨

光是操作“Sibilance”还远远不够：由于压缩比率大，单独聆听“Sibilance”音轨时，你会觉得De-Ess“用力过猛”了。不用担心，我们还要完成本方案的重头戏——并行压缩：只有把“Body”与“Sibilance”两个音轨的信号组合起来，才能达到最终的效果。

具体遵循以下方针：

调节“Body”的音量，以该音轨的音量来确定主体响度；
随后，“Sibilance”的音量从-∞慢慢向上推，直到齿音刚好不刺耳；
最后，给两条推子做“最后1 dB”的微调。

那么，我们正式开始实战：

第一步：确定“Body”轨的音量。

把“Sibilance”轨静音，单独“Body”轨，确认整句人声主体音量已经OK（和平时混音一样响即可）。
然后，记下这条“Body”音量推子的位置（比如 -15 dB），不动它了。

第二步：调节“Sibilance”轨的音量。

这次，把“Body”轨静音，单独“Sibilance”轨。
把“Sibilance”轨的音量推子拉到最底（-∞），慢慢往上推，每推 2 dB 停一次，播放同一句齿音最多的词。当第一次听到「嘶」声开始变薄、变闷，就停手。此时推子位置一般落在 -10 dB 到 -6 dB 之间。

第三步：两条轨道一起放，做“最后1 dB”微调。

首先，把两条轨道都取消静音。
然后，“Sibilance”的推子再往回（下拉）1 dB 左右，直到“齿音刚好听不见刺耳，但“S”声仍完整——也就是说，齿音被压到不再刺耳，但辅音/s/、/ʃ/、/tʃ/ 等的“廓”和“时长”没有变得含糊。
如果还是刺耳，“Sibilance”的推子再下拉0.5 dB；如果出现口齿含糊，就再上浮0.5 dB，直到效果理想。

整个第三道工序里，只动“Sibilance”推子，“Body”推子保持这一步刚开始的位置不变。经过这道工序后，齿音将得到有效抑制，声音听起来平顺不少。

图 7 本例中，“Body”音量推子设为-14.6 dB，“Sibilance”在经过仔细调试后设为-13.6 dB，使我这段录音达到良好的去齿音效果。

第四道工序：写自动化（可选）

在时，若你发现个别字仍然“冒刺儿”，怎么办？往往整体把“Sibilance”音轨拉高可以驯服那些字词，但却容易顾此失彼，造成其他的字词听着暗淡。

这时，你可以在DAW中，为“Sibilance”音轨编写自动化：齿音大的字再下拉1 dB，说完立即回到原位置。

相反，若你发现个别字由于De-Ess过度而导致浑浊不清，则同样写自动化，把“Sibilance”推子在该字上抬0.5～1 dB，说完立刻复位。

在DAW中编写自动化时，务必选择与音轨音量有关的参数，例如REAPER音轨自动化选项中的“Track Envelope” ==> “Volume”。

图 8 在REAPER中，使用本章节的方对齿音进行自动化处理时，请使用图中红框框出来的这个参数。

◆注意：包括REAPER在内的部分DAW，在设置自动化包络时，音量包络的值会覆盖掉你之前设置的推子值。因此你可能要通过绘制包络线来重新控制“Sibilance”轨的音量。

验证效果

在完成处理后，为了确保我们的处理效果达到预期，不妨进行一次“快速A/B验证”——把“Sibilance”轨整体静音／取消静音，对比前后差异：

若静音时齿音发刺，就证明“Sibilance”轨确实在干活；
若取消静音时齿音消失，但人声亮度几乎不变，推子位置就正确了。

效果展示

最后为大家展示一下经过处理后的音频，看看是不是齿音削弱了，同时高频部分依然清亮如初？

试听音频素材：1.3_《被遗忘的时光》并行多段压缩De-Ess.flac

进阶提示

可配合侧链噪声门使用

如果想更自然，可以给“Sibilance”轨再插一个带侧链的噪声门插件（Gate），用“Body”轨做Key（键控输入），这样只在有字的时候多段压缩才工作。

人声太小怎么办？

在本方案中，人声音轨的音量水平始终取决于“Body”轨的音量。如果你感觉人声音量太小，你应当重新确定“Body”轨的音量水平，然后重新进行第三道工序来平衡两个音轨的音量。

小音量，更易听出齿音残留

无论使用还是音箱混音，都不宜把音量开的太大，不仅是为了保护听力，还因为大音量容易造成听觉疲劳，使得音频中的一些细节被“掩蔽”。

去齿音时也是如此，并不是音量越大越能听出齿音。根据Fletcher-Munson 等响曲线，小音量时，耳朵对1 k以下的敏感度会明显衰减，对4 k附近相对“衰减得少”，所以齿音听起来“突出”了。因此，在调节音量时“反其道而行之”，把音量开得很小，反而更容易听出齿音残留。既保护听力，又能为De-Ess查漏补缺，一举两得。

当然，要想发挥“小音量查漏”的优势，水平需要保持在60～70 dB SPL（声压级）左右，这是人耳判断高频细节的“甜点”。另一方面，即使在卧室做混音，也务必确保周遭环境足够安静，否则弱信号会被噪声掩蔽。

双

若你同时拥有和音箱，在De-Ess时可以给它们分别派任务：用找齿音，用音箱确认高频空气感。使用两种设备进行A/B比对。

优势是隔绝房间反射、左右耳无串扰，所以微小细节（短峰、低电平齿音）不会被混响掩蔽，利于捕捉细节。而用音箱确认空气感，主要是检验房间的效果。

“双”分两步：先用捕捉短促齿音（无房间反射，细节最暴露）；再换音箱检验是否削得过多——房间吸声和离轴响应会让高频自然衰减，若音箱听起来明显发闷，就把De-Ess量往回退1 dB，再回确认齿音未反弹。如此往返，直到不刺耳、音箱不黯淡，即为平衡点。

具体如何“回退”，取决于你使用的方案。你需要观察增益衰减表，并综合调节压缩比率、阈值、动态EQ增益等参数。

注意效果器顺序

在进行De-Ess前后，你仍然可以使用其他效果器，但一定要注意顺序。例如，如果你的人声音轨使用了均衡器、压缩器、饱和/激励效果器，那么务必遵循以下顺序：

EQ → De-Ess → Compressor → 饱和/激励

不要弄反，否则压缩器又会把齿音顶出来。

混响，以及风格化效果器（如镶边器〔flanger〕、失真效果）也是如此，应当放在最后，否则容易干扰去齿音效果。

在不使用专门De-Ess插件的去齿音工作中，多段压缩是除动态EQ外常备的工具，对于驯服齿音分布比较分散、忽强忽弱的人声，以及处理力量型人声等比较复杂的场景，可以更好地胜任，在驯服齿音动态的同时还能保留音频空气感。

在教程里，笔者着重介绍了多段压缩去齿音的两种工作模式：

单独使用多段压缩：“靶向性”强，快速处理指定的齿音尖峰频率，快速易上手。
分频段并行压缩：多段压缩的更高阶用。使用两条播放相同内容的人声音轨——“Body”与“Sibilance”，后者使用较宽频段的多段压缩（如4～8 k）。随后，调整两个音轨的音量平衡，实现更精细、灵活的去齿音，保留人声空气感。

同时，笔者还强调了三点实用技巧：小音量、音箱与双，以及注意效果器的顺序。这三个技巧有助于你更精准把握齿音所在，保证De-Ess的质量符合预期水准。

基本上，本系列教程前两篇里介绍的技巧，已经能覆盖大部分De-Ess的场景。实际上，去齿音还有更为高阶、更具“技术流”的玩，例如使用FFT均衡器（如ReaFIR）、频谱编辑，笔者将在下一篇教程中继续为大家讲解。敬请期待。

本文出自《midin月刊》2025年11月第236期