语音处理
支持边缘语音处理的综合软件
支持边缘语音处理的综合软件
恩智浦提供一系列语音控制、音频和通信软件与解决方案,为人对人和人对机器的语音应用提供高质量、可靠的嵌入式语音处理。恩智浦语音通信软件专为基于我们各类MCU、MPU和DSP的小尺寸、低功耗应用而设计。
先进的音频播放与调优工具:均衡器、3D音效、低音/高音增强、限幅器及立体声PCM支持。
专为唤醒词、ASR和AI对话优化,具备高通滤波、波束赋形和声学回声消除功能。
端到端语音AI:唤醒词检测、ASR、用于情境感知响应的基于RAG的LLM、以及用于自然语音输出的TTS。
完整的AI流程:唤醒词检测、ASR、用于智能响应的基于RAG的LLM、TTS输出,以及依据手册的聊天机器人微调。
全面的语音解决方案:唤醒词检测、语音命令、语音转意图、ASR转录及TTS转换。
采用小型及大型AI模型,为单向或全双工通信提供智能降噪和回声消除,确保语音清晰。
|
恩智浦为人与机器语音处理提供可靠的语音、音频及通信解决方案。 |
简介 |
2023年9月19日 |
第1版 |
VIT唤醒词和语音命令引擎可通过在线工具及我们的MCUXpresso SDK获取。如需了解VIT Speech to Intent的更多详情,请将具体需求发送至邮箱voice@nxp.com与我们联系。
语音UI指以语音为主要交互方式的“语音优先”设备。恩智浦的语音UI软件技术包括VIT、VoiceSpot和VoiceSeeker。
语音通信指人与人之间使用语音进行的双向通信,如电话。恩智浦使用的语音通信软件技术是Conversa。
VoiceSpot是一款高精度、高度优化的唤醒词及声学事件检测引擎。它基于深度学习神经网络技术,需要大量数据集进行训练。VoiceSpot适合对响应率要求高、需最大限度减少误报的客户,也适合需要在超低功耗状态下等待语音/声学触发的应用场景。
VIT软件套件基于音素自动语音识别技术构建。该技术将口语音素(语音的构建模块)映射为单词,进而识别为唤醒词和命令,并转换为意图与动作。由于VIT基于音素,客户可通过键盘和恩智浦在线模型创建工具快速创建唤醒词和命令模型。VIT唤醒词和语音命令引擎适合希望独立构建定制唤醒词和语音命令,或希望快速尝试将语音作为用户界面的客户。VIT Speech to Intent则面向希望在边缘处理器上实现类自然语言理解体验、且无需依赖云连接与云ASR转录服务的客户。
VoiceSeeker是一款多麦克风波束赋形音频前端信号处理解决方案,适用于语音用户界面。它能有效区分信号与噪声,在远场混响环境中表现尤为出色。VoiceSeeker提供标准免费版与高级版两种选项。不含AEC功能的VoiceSeeker标准版可通过恩智浦MCUXpresso SDK免费获取,并能轻松与VoiceSpot或VIT集成。包含声学回声消除器(AEC)的高级版则需通过恩智浦受控分发渠道提供。VoiceSeeker常用于智能音箱、家庭控制器等远场语音控制应用,也可用于需要消除干扰噪声的中场及近场场景。