技术前沿:数字化声音拾取麦克风

懂智能的李星子 2024-06-23 13:30:32

技术前沿:数字化声音拾取 麦克风

麦克风基础知识

简介

麦克风,学名为传声器,由英语microphone(送话器)翻译而来,也称话筒,微音器。麦克风是将声音信号转换为电信号的能量转换器件。

工作原理

电容式麦克风有两块金属极板,其中一块表面涂有驻极体薄膜(多数为聚全氟乙丙烯)并将其接地,另一极板接在场效应晶体管的栅极上,栅极与源极之间接有一个二极管。当驻极体膜片本身带有电荷,表面电荷地电量为Q,板极间地电容量为C,则在极头上产生地电压U=Q/C,当受到振动或受到气流地摩擦时,由于振动使两极板间的距离改变,即电容C改变,而电量Q不变,就会引起电压的变化,电压变化的大小,反映了外界声压的强弱,这种电压变化频率反映了外界声音的频率,这就是驻极体传声器的工作原理。

麦克风分类

根据麦克风的音头不同,一般可以把麦克风分为电容麦克风、动圈麦克风和铝带麦克风。

1)电容麦克风

电容式麦克风本质上是一个电容器,利用充放电的原理,使超薄的金属或镀金的塑料薄膜为振动膜感应音压,收集声音信号然后将其转变为电信号。因为振动膜非常轻薄,所以具有体积小、重量轻、灵敏度高的特点。在频率响应方面,频率响应低音可以延伸到10Hz以下的超低频,高音可以轻易的达到数十KHz的超音波。

两种常用电容式麦克风的对比:驻极体电容麦克风(ECM)和微机电麦克风(MEMS Micphone)

(1)驻极体电容麦克风(Electret Condenser Micphone)原理:驻极体麦克风使用了可保有永久电荷的驻极体物质,不需要再对电容供电。(若驻极体麦克风中内置放大电路,则需要供电)优点:技术成熟、价格便宜缺点:体积大,不方便SMT、引线长,造成信号衰减、生产工序多,一致性差、灵敏度不稳定。

(2)微机电麦克风(MEMS Micphone)原理:微机电麦克风也称麦克风芯片或硅麦克风,硅麦一般都集成了前置放大器,甚至有些硅麦会集成模拟数字转换器,直接输出数字信号,成为数字麦克风。优点:体积小,可SMT、产品稳定性好缺点:价格较高备注:一般情况下,我们把集成了前置放大器或者模拟数字转换器的麦克风称为拾音器(pickup)。

2)动圈麦克风

动圈麦克风是利用电磁感应现象制成的,当声波使膜片振动时,连接在膜片上的线圈随着一起振动,音圈在磁场里振动产生感应电流(电信号),这个信号电流经扩音器放大后传给扬声器,从扬声器中就发出放大的声音。与电容麦克风相比,动圈麦克风不需要电源供给,灵敏度也较低,因此它们需要更高的声压级 (SPL)(即更大的声源)才能运行。

3)铝带麦克风

铝带麦克风的原理和动圈麦克风类似,通过一根很小的铝带作为振膜来产生信号。当铝带随着气压的变化而移动时,会干扰磁场,从而产生信号。铝带麦克风是双向的,会从麦克风的两侧拾取声音,所以我们见到的铝带麦克风都是8字形指向性的。

1.4驻极体麦克风和MEMS硅麦

1)驻极体麦克风

驻极体麦克风的工作原理

驻极体麦克风的组成结构

驻极体麦克风的电路设计

(1)驻极体麦克风单端式电路设计

(2)驻极体麦克风差分式电路设计

2)硅麦

硅麦的工作原理硅麦又称MEMS麦克风,是基于MEMS技术制造的麦克风,由MEMS声压传感器芯片,ASIC芯片,音腔和RF抑制电路组成。MEMS声压传感器是一个由硅振膜和硅背极板构成的微型电容器,能将声压变化转化为电容变化,然后由ASIC芯片将电容变化转化为电信号,实现"声--音"转换。

基于MEMS 麦克风在正常工作过程中,其所带电量Q 保持不变,整个工作过程用公式可表述如下。

由:Q=C×V (1)

可以得出: C×V=(C+△C) (V+△V) (2)

由公式(1) 、(2) 可以得出:△V=- (C/V) △C (3)

由C=εS/d 可以得出△C=- (C/d)△d (4)

由F=Kd=PS 可以得出△d=(S/K)△P (5)

由公式(3) 、(4)、(5) 可以得出:△V=( S/K)(V/d) △P (6)

其中K 为振膜的弹性系数,△P为作用在振膜上下表面的声压差,S为振膜面积,d为背板与振膜的间距,V 为背板与振膜间的偏置电压。由公式(6)可知,△V 的大小(MEMS 麦克风的灵敏度)与MEMS 芯片的振膜面积、偏置电压及作用在振膜上下表面的声压差成正比,与振膜的弹性系数及振膜与背基板的距离成反比。实际上MEMS 麦克风在设计时不仅仅考虑灵敏度的问题,还要考虑信噪比、过压比(AOP)等因素,因而上述公式将会变得更复杂一些。

硅麦的组成结构

硅麦的分类

硅麦的应用

硅麦与ECM对比

技术参数

指向性

指向性也叫话筒的极性( polar pattern),它指话筒拾取来自不同方向的声音的能力。一般分全向型、心型、超心型、8字型。

全向型(Omnidirectional)也叫无方向型,它对各个方向的声音有相同的灵敏度。心型(Cardioid)属指向型话筒,前端灵敏度最强,后端灵敏度最弱。超心型(Supercardioid)拾音区域比心型话筒更窄,但后端也会拾取声音。8字型分别从前方和后方拾取声音,但不从侧面(90度角)拾音。

灵敏度(Sensitivity)是麦克风的一个主要参数。定义的是,对于一定的声压水平(通常是94dB SPL,1Pa),1KHz情况下,麦克风的输出信号大小。对于模拟输出的麦克风,灵敏度可以表示为 mV/Pa(毫伏每帕)或者dBV;对于数字输出的麦克风,灵敏度表示为 dBFS。

信噪比(SNR)信噪比,单位是 dB 或dBA,该指标数值越大越好。定义为等效输入噪声水平与 94dB的差。例如,如果麦克风的等效输入噪声水平为 32dBA,则 SNR=94-32=62dBA。

总谐波失真(THD)谐波失真是指输出信号比输入信号多出的谐波成分。谐波失真由于系统不是完全线性造成的。所有附加谐波电平之和称为总谐波失真。一般说来,500Hz频率处的总谐波失真最小,因此不少产品均以该频率的失真作为它的指标。总谐波失真在1%以F,入耳分辨不出来,超过10%就可以明显听出失真的成分。数值越小,音色就更加纯净,表明产品品质越高。一般产品的总谐波失真都小于1%(以500Hz频率测量)。

最大声压级(Sound Pressure Level)指麦克风可以接受的最大声压水平,或者是麦克风的钳位水平,单位是 dB SPL。

选型

麦克风选型一般要符合声学算法厂家的要求,基本的考察点可以包括:

1、灵敏度(sensitivity):-38dBV~-42dBV/±3dBV;

2、信噪比(SNR):>=60dB;

3、总谐波失真(THD):<=1%(1kHz);

4、声学过载点(AOP):>=120dB SPL;

5、自由场频谱(100-10kHz 内)响应波动:<3dB;

6、是否全向或指向性麦克风;

7、MEMS或ECM麦克风都可以,根据产品成本和装配需要进行选择。

MEMS(微机电麦克风)和ECM(驻极体电容式麦克风)对比

ECM麦克风:音质卓越的传统之选

ECM麦克风,即电容式麦克风,内部含有一个金属外壳包围的高分子聚合物薄膜,广泛应用于专业录音、舞台演出等领域。它的工作原理是基于电容的充电、放电,其以隔膜作为电容器的一面,由于声音的振动会产生板与板之间的电荷变化,以此传递信号。

优势

1.音质卓越:ECM麦克风能够覆盖全声频响应 (0-20kHZ),失真度低,具有宽广的频率响应和优秀的动态范围,能够还原真实的声音细节,非常适合专业录音和舞台演出。

2.可定制化:ECM麦克风可根据不同的需求进行定制化设计,满足不同应用场景下的音质要求。

应用场景

1.专业录音:音乐制作、影视配音等专业录音场合,ECM麦克风是不可或缺的工具。

2.高灵敏度:能够捕捉到细微的声音变化,适用于需要高保真录音的场合。

3.舞台演出:歌手、乐器演奏者等需要现场表演时,ECM麦克风能够提供出色的音质保障。

4.会议系统:大型会议、演讲等场合,ECM麦克风能够确保声音清晰传达给每一位听众。

但在其技术原理限制下,ECM麦克风一般体积较大,且不能进行回流焊,容易受热影响及损坏,需要采用昂贵的手工安装方法将 ECM 安装到电路板上。

MEMS麦克风,小巧而强大的声音捕手

MEMS麦克风,是一种利用微机械技术制造的麦克风,主要由振膜、背极板、ASIC(专用集成电路)组成,采用半导体技术。它的工作原理基于声压变化引起的振膜位移,进而改变电容两极间的距离,导致电容值的变化,进而转换为电信号输出。

当声波作用在MEMS麦克风上时,声波产生的声压会使振膜发生微小的位移。这个位移会改变振膜与背极板之间的距离,进而改变两者之间的电容值。具体来说,当声压增加时,振膜向背极板移动,电容值增加;当声压减小时,振膜向反方向移动,电容值减小。

ASIC中的电荷泵装置会提供一个稳定的直流偏置电压给振膜。当电容值发生变化时,这个变化的电容值会转化为微弱的电压变化量,形成输出信号。这个微弱的电压变化量经过ASIC后级的放大电路进行放大处理,最终将模拟音频信号转换成数字信号,生成脉冲密度调制(PDM)输出。

优势

1.小巧轻便:MEMS麦克风采用集成电路工艺制造,体积小巧,非常适合应用于移动设备、智能家居等空间受限的场合。2.低功耗:由于采用先进的半导体技术,MEMS麦克风可以进行回流焊,且功耗极低,有助于延长设备的使用时间。

3.耐环境能力强:相对于传统麦克风,MEMS麦克风对环境噪声的抗干扰能力更强,适用于各种复杂环境。

应用场景

1.手机通话:手机内置的麦克风通常采用MEMS技术,确保通话清晰无碍。

2.智能家居:智能家居设备如智能音箱、智能门铃等也常采用MEMS麦克风,以便捕捉用户指令和周围环境声音。

3.无人机航拍:无人机航拍需要清晰的声音录制,而MEMS麦克风正好满足了这一需求。

MEMS麦克风可以采用回流焊接工艺,在同一体积下,MEMS麦克风具有比ECM更高的性能密度,MEMS麦克风的噪声可进行评估及消除,且在温度改变的情况下,MEMS麦克风的敏感度变化较小,更稳定。

如何选择适合自己的麦克风

1.需求定位:首先明确自己的需求,是用于移动设备、智能家居等日常应用,还是用于专业录音、舞台演出等场合。

2.音质要求:对音质有高要求的用户,建议选择ECM麦克风;而追求便携性和低功耗的用户,则可以考虑MEMS麦克风。

3.预算考虑:ECM麦克风通常价格较高;而MEMS麦克风则价格亲民,性价比高。

微机电系统或 MEMS是使用最初为集成电路 (IC) 开发的技术在硅上蚀刻和制造的。微机械喷墨喷嘴可能是第一个,但是,自 1990 年代以来,MEMS 技术创造了各种传感器和其他机电设备,包括麦克风。

MEMS麦克风是MEMS传感器和MEMS执行器里的一个分支应用。在MEMS麦克风中,硅结构中的薄镀膜随着声音振动,直连产生变化的电容,电容器的第二个极板位于硅中的固定表面上,IC 中的电荷泵为电容器产生高直流电压,IC 电路将电容变化转换为代表 MEMS 膜上音频信号的电信号。

所有麦克风的初始信号当然都是模拟音频,这些微弱的信号需要通过前置放大器进行增幅,以提升其至可用但仍较低的电平,然后通过集成的专门的电路,将变化的电信号转换为模拟或者数字信号。

MEMS麦克风模拟输出 …

MEMS Microphone Analog Output

模拟麦克风将增幅后的信号直接传送至输出端。输出类型分为单端和差分两种,其中差分系统具有两个输出,它们之间的相位差为180度。根据输出是单端还是差分,模拟麦克风通常设有三或四个引脚:电源引脚、公共接地引脚,以及一个或两个输出引脚。

值得注意的是,电源始终由单一的正电源提供。这会导致在输出端产生一个直流偏移。为了消除这一偏移,应当使用电容器进行去耦,如下所示。

模拟输出麦克风

大多数麦克风都是消费级的,具有良好的音质,但与用于专业音频的麦克风还是有不小差距。

MEMS麦克风数字输出 …

MEMS Microphone Digital Output

配备数字输出的MEMS麦克风会进行模数(A/D)转换,即将经过放大的模拟音频信号转换成数字信号。这些麦克风大多采用delta-sigma转换技术,生成的是脉冲密度调制(PDM)输出,具体过程下图所示。

脉冲密度调制。当音频信号较高时,高脉冲(蓝色)具有较高的密度

脉冲密度(即逻辑高脉冲的百分比)与电压成正比。这不是你通常认为的数字,因为没有创建数字词,只是脉冲。尽管通常使用微处理器程序或音频 CODEC(编码器/解码器),但只需将脉冲流通过低通滤波器即可对其进行解码。

大多数数字输出 MEMS 麦克风有五个引脚,如下图所示:

电源

共同点

输出

时钟输入

L/R(左/右)选择

数字输出麦克风用于立体声系统

L/R 选择机制的工作原理是,当连接设置为高电平(左)时,模数转换器(A/D)的输出会在时钟信号上升沿后发送。若设置为低电平,则数据会在时钟信号下降沿时传输。通过这种方式,左右声道的输出可以共用同一条数据线进行发送。

MEMS麦克风封装

MEMS Microphone Packaging

麦克风元件及其电路不在同一硅芯片上。他们的制造技术差异太大,无法将它们制造在一起。相反,麦克风和单独的 ASIC(专用集成电路)组合在同一个封装中,通过引线键合连接,如下图所示。

带有顶部声音端口的 MEMS 麦克风封装

MEMS 麦克风采用类似 IC 的封装,用于表面贴装组装。当然,它们需要端口让声音进入。如前面所示,顶部和底部端口可用。如果使用带有底部端口的麦克风,则必须在其下方的电路板上打一个孔,如下图所示。

带有底部声音端口的 MEMS 麦克风封装

MEMS 麦克风的 PCB 安装

PCB Mounting of MEMS Microphones

标准回流焊接技术可用于将 MEMS 麦克风连接到 PCB。但是需要小心不要让污染物进入声音端口。在清洁过程中,可能需要用胶带封住或密封端口。

MEMS 麦克风一般规格

MEMS Microphone General Specifications

大多数 MEMS 麦克风具有相似的规格。以下是一些典型值。敏感性令人困惑,所以让我们先尝试处理它。

模拟输出灵敏度(典型值):-38 dBV,94 dB SPL,1 kHz

数字输出灵敏度(典型值):-26 dB FS,94 dB SPL,1 kHz

在正常语音电平下,模拟麦克风的输出将是低毫伏,而数字麦克风将远低于满量程。在某种程度上,这是一件好事,因为它为响亮的声音留下了很大的余量。

频率响应:通常从低品的 80 或 100 Hz 到 10 或 15 kHz,适合语音,非常适合大多数音频,现在很多新品都达到 20 Hz。在高频,响应在较高频率下增加,在 30 至 40 kHz 附近具有显着的超声共振峰值。在此之上,响应下降。

工作温度:大部分为-40至+85摄氏度。

电源电压:从 1.5 或 2 V 到 3 或 3.6 V。规格各不相同。

尺寸:3 x 4 毫米或更小,高约 1 至 1.5 毫米。大多数使用相同的表面贴装焊盘图案。

MEMS 麦克风体积小、价格适中且随时可用。麦克风元件本身不到 1 毫米,通常要小得多。大多数采用表面贴装 IC 外壳,包括带模拟或数字输出的放大电路。音频信号的输入端口可以位于封装 MEMS IC 的顶部或底部。

MEMS麦克风主要工艺流程:

基础材料选择: 首先,选择适当的基础材料,通常为硅(Silicon),作为MEMS麦克风的基板。硅是一种常用的材料,因为它具有良好的机械性能、化学稳定性,并且可以通过微纳制造技术进行加工。

SOI(Silicon On Insulator)衬底制备: 在一些应用中,采用SOI衬底,其中硅膜位于绝缘层之上。这有助于减小声波传递到基板的影响,提高麦克风的性能。

光刻: 使用光刻技术在硅基板上定义麦克风的结构。通过涂覆光刻胶、曝光和显影等步骤,形成所需的图案,包括麦克风的振膜、支撑结构等。

腐蚀: 利用湿法或干法腐蚀技术,将通过光刻定义的区域从硅基板中移除,形成麦克风的结构。这个步骤通常包括湿法腐蚀或干法腐蚀,以定制MEMS麦克风的形状和厚度。

薄膜沉积: 通过物理气相沉积(PVD)或化学气相沉积(CVD)等技术,在麦克风结构上沉积一层薄膜,通常是金属,用作麦克风的电极或其他功能性部分。

电极定义: 利用光刻和腐蚀等步骤,定义和形成电极结构,这些电极与薄膜一起用于检测声波信号。这一步骤通常与振膜的制备过程相互关联。

振膜制备: 在麦克风的振膜区域形成薄而柔软的膜层,通常使用化学气相沉积(CVD)或其他薄膜制备技术。振膜的特性直接影响MEMS麦克风的灵敏度和频率响应。

封装: 在完成MEMS麦克风的制备后,进行封装以保护器件免受外部环境的影响。封装通常包括封装膜、封装罩等,确保器件的性能和可靠性。

测试: 进行严格的测试和校准,以确保MEMS麦克风符合设计要求,并在工作中稳定可靠。

MEMS麦克风的一些关键技术难题:

灵敏度: MEMS麦克风需要足够的灵敏度来捕捉微小的声音信号,特别是在嘈杂的环境中。提高灵敏度要求设计出高质量的微机械结构和灵敏的传感器元件。

宽频响应: 麦克风需要在广泛的频率范围内捕捉声音信号。设计MEMS麦克风以实现平坦的频率响应并同时满足高灵敏度是一个挑战。

噪声水平: MEMS麦克风在操作过程中可能受到来自电路、机械振动、环境等方面的各种噪声影响。减小这些噪声并提高信噪比是一项关键任务。

集成性能: MEMS麦克风通常集成在芯片上,与其他MEMS元件和电子设备一起工作。确保在集成过程中不会出现相互干扰,保持系统性能是一项技术难题。

稳定性和可靠性: 麦克风需要在各种环境条件下保持稳定的性能,并具有足够的可靠性,以在长时间使用中不失效。

尺寸和制造技术: MEMS麦克风通常需要非常小的尺寸,以适应各种应用场景,如移动设备、智能穿戴等。微纳制造技术的发展是制备这些小尺寸元件的一个关键因素。

功耗: 对于一些便携设备,尤其是依赖电池供电的设备,功耗是一个重要的考虑因素。设计低功耗的MEMS麦克风是一项具有挑战性的任务。

高温环境下的稳定性: 一些应用场景,如汽车内部,可能会面临较高的温度。确保MEMS麦克风在高温环境下保持性能和稳定性是一项技术挑战。

MEMS麦克风工作原理

像ECM一样,MEMS麦克风也是电容麦克风。MEMS麦克风包含一个灵活悬浮的薄膜,它可在一个固定背板之上自由移动,所有元件均在一个硅晶圆上制造。该结构形成一个可变电容,固定电荷施加于薄膜与背板之间。传入的声压波通过背板中的孔,引起薄膜运动,其运动量与压缩和稀疏波的幅度成比例。这种运动改变薄膜与背板之间的距离,进而改变电容,如图1所示。在电荷恒定的情况下,此电容变化转换为电信号。

图1. MEMS麦克风的电容随声波的幅度而变化

在硅晶圆上制造麦克风传感器元件的工艺与其他集成电路(IC)的制造工艺相似。与ECM制造技术不同,硅制造工艺非常精密且高度可重复。一个晶圆上制造的所有MEMS麦克风元件都具有相同的性能,不仅如此,而且在该产品的多年生命周期中,不同晶圆上的每一个元件也都具有相同的性能。

硅制造是在严格控制的环境中,利用一系列沉积和蚀刻工艺,产生金属和多晶硅的形状集合以形成MEMS麦克风。生产MEMS麦克风涉及到的几何结构是微米(μm)级。声波所经过的背板中的孔直径可以小于10 μm,薄膜厚度可以是1 μm左右。薄膜与背板之间的间隙仅有数微米。图2所示为典型MEMS麦克风传感器元件的SEM图像,从顶部(薄膜)观看。图3所示为该麦克风元件中部的截面图。在该设计中,声波通过元件底部的空腔进入麦克风,并穿过背板孔以激励薄膜。

图2. MEMS麦克风的SEM图像

图3. MEMS麦克风的横截面

由于几何结构在制造工艺中受到严格控制,因此不同麦克风的实测性能具有高度可重复性。利用MEMS技术构建麦克风的另一个优势是薄膜极小,因此其质量非常小,相比于薄膜质量大得多的ECM,MEMS麦克风不易受振动影响。

发展、可重复性和稳定性

MEMS麦克风已发展到很高的水平,它已成为很多要求小尺寸和高性能的音频捕捉应用的默认选择,但大部分商用级麦克风并不适合助听器行业,因为后者要求小得多的器件、更低的功耗、更好的噪声性能以及更高的可靠性、环境稳定性和器件间可重复性。MEMS麦克风技术现在已经能够满足上述所有要求:超小型封装、极低功耗以及极低的等效输入噪声。

硅制造工艺的严格控制措施令MEMS麦克风的稳定性和器件间性能差异显著优于ECM。图4所示为相同型号的数个MEMS麦克风的归一化频率响应,图5所示为不同ECM的归一化频率响应。各MEMS麦克风的频率响应几乎一致,而ECM的频率响应则显示出相当大的器件间差异,尤其是在高频和低频时。

图4. 数个MEMS麦克风的频率响应

图5. 三组ECM麦克风的频率响应

MEMS麦克风还表现出卓越的宽温度范围稳定性。图6所示为环境温度在–40°C至+85°C之间改变时灵敏度的变化。黑线显示:在MEMS麦克风的温度范围内,灵敏度变化小于0.5 dB;而ECM则表现出最多8 dB的变化。

图6. 对振动的灵敏度与温度的关系:MEMS与ECM

相比于ECM,MEMS麦克风设计的电源抑制性能显著提高,典型电源抑制比(PSRR)优于−50 dB。在ECM上,输出信号和偏置电压(电源)共用一个引脚,电源上的任何纹波都会直接出现在输出信号上。MEMS麦克风优异的PSRR为音频电路设计提供的自由度是ECM无法比拟的。器件数量和系统成本得以降低。

在助听器之类电池供电的微型应用中,每毫瓦功耗都至关重要。当助听器正在工作时,麦克风无法通过周期供电来节省功耗。因此,麦克风的工作功耗极为重要。采用典型的锌空气电池电压(0.9 V–1.4 V)供电时,助听器所用典型ECM麦克风的功耗为35 μA。而在相同电压下,助听器所用MEMS麦克风的功耗可以降至一半,使得助听器装一次电池可以使用更长时间。

最新一代MEMS麦克风拥有助听器行业要求的出色噪声和功耗性能。ADI公司利用20多年的MEMS技术经验来打造可用于助听器市场的高性能麦克风。典型全向MEMS麦克风的等效输入噪声(EIN)特性为27.5 dB SPL(A加权、8 kHz带宽),适合助听应用。⅓倍频程EIN噪声性能通常用于指定助听器用麦克风,在低频时非常出色,如图7所示。实现如此高的噪声性能只需17 μA功耗(采用典型助听器电池电压)。麦克风提供微型封装,总体积小于7.5 mm3,如图8所示。

图7. MEMS麦克风的⅓倍频程噪声

图8. 助听器用全向MEMS麦克风

a) 仰视图;b) 俯视图;c) 便于手工焊接的封装俯视图

高信噪比 MEMS麦克风如何帮助改进用户体验

虽然用户可以通过清晰直接地对着语音助手说话,避开嘈杂环境的同时只给出简单的指令,以此来避免语音助手理解错误。但这些方法会限制对话式AI的潜力,并让用户对与语音助手进行自然的对话式交互感到失望。

解决这个问题的一个成熟解决方案是改进VUI的语音捕捉or语音采集。高信噪比 MEMS麦克风能够支持在不完美的环境下捕获清晰的音频,并帮助改进语音识别、远场语音拾取和语境理解,以及实现对音频和视觉输入都能理解的多模态系统——这是解决阻碍语音助手实现广泛应用的许多挑战的关键。

改进语音识别

高信噪比 MEMS麦克风能够捕获清晰、准确的语音信号,这为改进语音识别算法的性能奠定了基础。MEMS麦克风能够从背景噪声中捕获语音,这意味着语音助手可以更好地理解用户发出的指令和咨询的问题。能否提供更优质输入信号的麦克风,也能提高语音助手理解的准确性。因为能够更好地适应用户向语音助手提出问题时所处的真实语音环境,所以高信噪比MEMS麦克风可以提升语音交互的整体用户体验和效率。

降噪和远场语音拾取

高信噪比使得MEMS麦克风能够清晰地捕捉语音指令。SNR是指麦克风应当拾取的有用音频与麦克风本身产生的噪声之间的差异,因此高信噪比意味着麦克风能够捕获更多有用信号。高信噪比结合高灵敏度可帮助实现远场语音拾取,使得用户能够远距离或在嘈杂的环境下与语音助手进行交互。

语音信号水平及语音源与设备之间的距离不同的标准VUI用例

如图所示,高信噪比麦克风在低语或轻声说话场景下拥有更高性能得分

主动降噪和远场语音拾取提高了语音助手在智能家居、会议室、客户支持系统和公共场所等不同嘈杂场景中的可用性。英飞凌进行的一项研究表明,具有75dB信噪比的高信噪比 MEMS麦克风,捕获的音频比标准麦克风(比如商用语音助手中所使用的麦克风)好40%。

语境理解和多模式交互

采用高信噪比 MEMS麦克风的VUI还能够从语调和重音等用户语音中捕获语境信息。这一语境理解能力使得语音助手能够推断用户意图,从而提供更准确和个性化的应答。

这一性能改进也为实现多模式交互提供了可能。例如,将VUI和高信噪比 MEMS麦克风与面部识别模型相结合时,用户可通过语音指令和面部表情来与设备进行交互,从而进一步提高了语音助手对用户意思的理解能力。

高信噪比 MEMS麦克风对于改进VUI中使用的对话式AI模型的效果至关重要。它们可提高语音识别精度,实现降噪和远场语音拾取,支持语境理解,并实现多模式交互。高信噪比MEMS麦克风即使在嘈杂环境下也能确保拥有最优性能,因而可以捕获清晰的语音信号。高信噪比 MEMS麦克风让用户与虚拟助手之间的交互更可靠,因而可以实现更好的用户体验。

而且,高信噪比 MEMS麦克风技术的进步为持续改进和提高语音助手可靠性提供了巨大的潜力。麦克风灵敏度、信号处理和降噪技术的不断发展,将帮助进一步提升对话式AI系统的性能。随着高信噪比 MEMS麦克风的不断改进,我们在人机交互方面也能取得巨大进步,从而为基于语音的技术释放新的潜力。

对话式AI拥有光明的前景。语音识别、语境感知和训练模型的创新,意味着语音助手将能处理更复杂的指令和对话。先进的算法结合优质的麦克风,意味着用户将能获得更舒适、更直观的语音助手使用体验。

0 阅读:0

懂智能的李星子

简介:感谢大家的关注