在HMI实现中,启用具有本地识别功能的语音来控制设备功能,为用户体验带来诸多好处。界面没有查找/按下按钮,显得更加自然;使用基于本地语言的命令,可获得更直观的体验;因为眼睛和手都是自由的,所以操作更便捷;语音数据不需要云连接,因此隐私性更强。恩智浦为希望在其HMI设计中启用语音控制的MCU开发人员提供了几种选择,如:作为MCUXpresso SDK的一部分,或者与其中提供的驱动程序兼容。恩智浦基于EdgeReady MCU的解决方案面向Alexa Voice Service (AVS) Integration for AWS IoT Core,采用i.MX RT106A跨界MCU,让开发人员能够快速、轻松地将Alexa语音助手功能添加到自己的产品。同样,借助基于恩智浦EdgeReady MCU的本地语音控制解决方案,开发人员可以快速轻松地添加对远场、离线本地语音控制和优化的语音识别引擎的支持。对于希望在其他MCU上实现较低级别集成和/或实现的客户,MCUXpresso SDK包含了免费的智能语音技术(VIT)。我们战略合作伙伴提供的语音识别和音频前端技术提供了更多选择,例如自然语音识别,以及能够在音频播放系统(如条形音箱)中组合语音识别。对于想要开发内部语音识别的客户,请参考我们的 eIQ® ML解决方案。
Retune DSP已加入恩智浦。 了解更多信息。
选择区域:
恩智浦基于EdgeReady MCU的解决方案面向Alexa Voice Service (AVS) Integration for AWS IoT Core,采用i.MX RT跨界MCU,让开发人员能够快速、轻松地将Alexa语音助手功能添加到自己的产品。这种超小型的全包式硬件设计与亚马逊认证的软件完全集成,可提供现成的AVS体验,无需提前了解语音控制,就能使语音控制以最快的时间面市。请单击上面的链接了解更多信息。
恩智浦已经开发了智能语音技术(VIT),可以免费识别语音命令,而无需进行冗长而昂贵的培训。可用的合作伙伴解决方案能够将语音识别与音频播放解决方案相结合,可与MCUXpresso SDK兼容,并提供演示,对您的设计进行深入评估。
VIT基于最先进的深度学习和语音识别技术,由恩智浦公司开发,是一款完整的唤醒词/语音命令解决方案。VIT在MCUXpresso SDK中支持的恩智浦设备上免费提供,目前支持英语。VIT功能包括:
VIT支持的平台如下:
设备系列 | 内核 | 协处理器 | 推荐评估板 |
---|---|---|---|
i.MX RT600 | Cortex-M33 | Cadence® Tensilica® HiFi 4音频DSP | MIMXRT685-EVK |
i.MX RT1060 | Cortex-M7 | - | MIMXRT1060-EVK |
恩智浦已与语音识别(例如Sensory)和远场音频前端(例如DSP Concepts&Alango)领域的领先企业合作,为我们基于Arm Cortex-M的微控制器系列提供一系列专业的高性能解决方案。
Alango的DSP/MCU声音处理软件技术提高了语音通信的质量,并增强了汽车免提系统、蓝牙通信耳机、智能扬声器、移动和无绳电话、高端音频/视频会议系统、对讲机系统、笔记本电脑、办公室扬声器、平板电脑、助听器和助听增强设备的音频体验。
下面是Alango为恩智浦Arm Cortex-M微控制器提供的语音产品。Alango的产品还支持多款恩智浦i.MX处理器。
Alango产品 | 概述 | i.MX RT600 Arm® Cortex® M33+Cadence Xtensa Hifi4 DSP | i.MX RT 1xxx Arm Cortex M7 |
---|---|---|---|
OnlyVoice™ | OnlyVoice™ 是Alango的先进语音采集技术,适用于真正的无线(TWS)耳机、蓝牙耳机和耳塞以及高性能耳机。 | ||
语音活动检测(VAD) | Alango的语音活动检测(VAD)技术能够可靠地检测到声音信号中的人类语音。这项技术基于一个专有的、实时运行的高分辨率光谱噪声估计算法。 | ||
语音通信包(VCP) | 语音通信包(VCP)是用于语音应用的数字信号处理技术的通用软件包,可在各种环境下实现高品质、全双工和无噪声通信。 | ||
语音增强包(VEP) | 语音增强包(VEP)是一套实时软件DSP技术,旨在提高语音控制多媒体设备的语音识别性能。 |
使用Audio Weaver Designer创建、调优和制造音频功能,这是一个低代码实时拖放界面,具有实时模块检查器和400多种不同音频构建块。使用AWE Core将高度优化的音频部署到恩智浦最受欢迎的嵌入式处理器上。定制您自己的播放声音,并将其与音频前端TalkTo相结合,实现市场上性能最高的语音控制系统。TalkTo可在极其嘈杂的环境中检测并提取微弱的语音命令,并通过AVS 2.1高级版和Google ART版。
下面显示了面向恩智浦基于Arm Cortex-M微控制器的DSP Concepts产品。DSP Concepts的产品还支持多款恩智浦i.MX处理器。
DSP Concepts产品 | 概述 | i.MX RT600 Arm Cortex M33+Cadence Xtensa Hifi4 DSP |
---|---|---|
Audio Weaver Designer | 一个低代码实时拖放界面,具有实时模块检查器和400多种不同音频构建块,可快速集成或创建高级音频功能。 | |
TalkTo | TalkTo是一个音频前端,也是市场上性能最高的语音控制系统。TalkTo可在极其嘈杂的环境中检测并提取微弱的语音命令,并通过AVS 2.1高级版和Google ART版。 |
Sensory的TrulyHandsfree唤醒词和短语识别技术以响应速度快、功耗低以及在远距离或嘈杂环境中的出色性能而闻名。这项技术是家庭、汽车和任何可以部署语音用户界面地方的全功能语音控制设备不可或缺的组成部分。Sensory的技术与DSP Concepts等其他合作伙伴的前端处理解决方案相辅相成。它可用于Arm Cortex M4/M33/M7内核,也可用于Cadence Xtensa DSP内核。TrulyHandsfree与Sensory VoiceHub兼容,使开发人员能够快速构建自定义命令的模型,并通过文本输入唤醒词。
Sensory还支持多款恩智浦的其他产品,包括i.MX处理器。
5 培训