语音助理早已不是新鲜事物,但是近来搭载AI语音助理的智能音箱却成为了国内外科技巨头争相推出的智能家居新品,这无疑将带动语音识别中必不可少的传感器——麦克风市场的增长,不过增长并非包括所有类型的麦克风。MEMS麦克风凭借微型化、一致性好、低功耗等特性更好满足智能音箱、智能耳机、机器人等应用的语音交互需求将受惠最大,但麦克风阵列的应用也将带来技术挑战。
MEMS麦克风市场持续增长 智能音箱促进作用明显
数据显示,2016年MEMS麦克风市场为9.93亿美元,接近10亿美元大关,加上7亿美元的驻极体电容麦克风(ECM)市场,整个麦克风市场规模约为18亿美元。市场研究机构Yole Développement预估,在智能语音助理、车载等应用的加持下,MEMS麦克风出货量未来五年将保持高速增长态势,复合年增长率达11.3%,到2022年时年出货量可望超过80亿颗。ECM麦克风出货量则缓慢萎缩,到2022年时出货量仅30亿颗左右。
图1:ECM/MEMS麦克风市场规模(资料来源:Yole Développement)
在亚马逊2014年推出拥有语音助理Alexa的智能音箱Echo热销之后,搭载Google Assitant、Cortana、Siri等虚拟语音助理的智能音箱纷纷亮相。各大IT巨头陆续推出智能音箱产品,预示着消费类MEMS麦克风阵列市场蓄势待发。很显然,以智能音箱为代表的智能家居产品将助推MEMS麦克风市场的增长。意法半导体MEMS产品部华南区高级市场工程师董恺也表示:“随着智能产品在智能家居中的渗透率逐步提高,传统的交互方式已经不能满足用户的需求,语音作为一个重要的交互手段变得越来越流行。MEMS麦克风作为重要的交互窗口,已经在手机和笔记本市场获得了巨大成功,智能音箱将成为MEMS麦克风应用的第三波浪潮。”
图2:可穿戴设备(含Hearables)市场发展趋势
远场语音识别面临高SNR、AOP等挑战
智能音箱未来对MEMS麦克风市场将带来促进作用,反过来,智能音箱也将给MEMS麦克风带来多重挑战。智能音箱作为智能家居产品,不同于手机语音助理和耳机语音助理的近场语音识别,智能音箱往往配置MEMS麦克风阵列,采用波束成形(Beam-forming)等技术进行降噪语音处理,从而实现远场语音识别,整个过程无需要双手操作。对于远场语音拾取应用,结合算法应用的要求,均需要匹配高信噪比的MEMS麦克风。麦克风阵列应用对于麦克风的灵敏度一致性,信噪比一致性及相位一致性要求都是非常高的。
除了众所周知的信噪比(SNR),声学过载点(AOP)也是MEMS麦克风重要的质量指标。高SNR能够让设备更好的实现远距离收音,AOP则是评估MEMS麦克风在高声压水平下的性能指标,SNR和AOP对于使用场景的越来越多样化的智能语音设备来说非常重要。有报告显示,64dB以上的高信噪比MEMS麦克风的市场占有率已经达到50%以上,对AOP的要求,很多厂商也从之前的120dB上升到130dB以上的水平。
远场语音识别场景中麦克风的收音环境不可避免的会受到各种噪声、混音甚至反射带来的干扰,导致MEMS麦克风对声音信号采集和提取的准确率大幅下降,从而影响语音识别的准确率。此时设备就需要通过MEMS麦克风阵列去辨别哪些是有用的声音。另外,倘若MEMS麦克风阵列一直在收音状态将非常耗电,这对智能移动设备来说是非常不适合的。因此,如何把MEMS麦克风变得更加智能,能够实现低功耗的同时保证用户体验也是一个挑战。除此之外,随着智能设备朝着小型化和多样化的方向发展,MEMS麦克风射频干扰、微型化仍需提升。最后,相比传统的ECM,MEMS麦克风的成本依旧没有优势。
技术指标之外仍需考虑设计结构及生产方式 算法更为关键
董恺表示,MEMS 麦克风阵列对麦克风的性能要求很高。不过,除了器件本身特性外,麦克风算法才是产品能否被接受的关键。例如,环境噪音的过滤,MEMS麦克风就需要通过与深度神经网络(DNN)、机器学习等技术的融合。很难去评判到底多少个麦克风会更合适麦克风阵列,产业内的各家芯片公司、算法公司均推出了自己的阵列方案,不同的硬件和算法的搭配也推出了不少优秀的智能音箱产品,因此麦克风数量的选择还取决于方案商产品的设计、定位、具体应用场景等。涉及到波束成形、关键字唤醒等功能的实现,更多依赖于语音算法公司。
MEMS麦克风未来将融合DSP 朝智能化方向发展
MEMS麦克风的应用趋势是始终开启,就像耳朵一样,要保持一直打开的状态。融合DSP的意义在于,简单算法麦克风自行处理,并且满足低功耗的要求。ST和DSP Group推出集成关键词唤醒的MEMS麦克风,帮助客户解决低功耗麦克风低功耗的挑战,该麦克风在微型系统封装(SiP)内集成意法半导体的低功耗MEMS麦克风、DSP Group的超低功耗语音处理芯片和 Sensory的语音识别固件,利用意法半导体的先进封装技术取得了非常好的轻量型封装、极长的续航时间和先进的功能。
随着MEMS麦克风成本的下降,智能音箱麦克风阵列选择MEMS麦克风已经是趋势,并且MEMS麦克风市场目前发展很好,正在进行多领域开发。
对于未来MEMS麦克风更多的应用场景,董恺认为车载市场将会是另一个MEMS麦克风爆发的应用。汽车操作系统联网化,提供丰富应用的同时对汽车的人机交互界面也提出了新的需求,语音作为最自然、安全的人车交互方式,必将主导汽车内的交互方式。他同时表示未来几年MEMS麦克风市场会持续保持增长势头,同时新的竞争对手入场导致市场竞争也会更加激烈。