作者
Davis Sawyer
Davis Sawyer现任恩智浦半导体AI产品市场经理,专注于软件工具以及基于i.MX微处理器的生成式AI使能解决方案。他常驻加拿大卡纳塔,同时担任边缘AI基金会“产业”工作组主席,致力于推动基于边缘AI的实际应用。此前,他参与创立了AI模型压缩初创公司Deeplite,该公司于2025年被收购。Davis热衷于打造跨学科产品,并乐于与睿智且友善的团队合作。

生成式AI不再局限于云端。借助恩智浦的eIQ® GenAI Flow ,开发人员如今可直接将大语言模型(LLM)(如Llama和Qwen)部署在嵌入式边缘设备上,实现安全、高效、贴近数据的运行。这一范式转变为汽车、工业自动化等多个行业带来了实时智能的新机遇。
作为一套完整的软件部署流程,eIQ GenAI Flow大幅简化了在功耗和算力受限的系统上部署生成式AI模型的复杂任务。该方案融合了量化等先进的模型优化技术,并结合恩智浦eIQ Neutron NPU的硬件加速能力,使GenAI在边缘既实用又性能卓越。
GenAI Flow的核心优势在于突破了嵌入式环境运行高级模型的传统障碍。该流程已支持当前强大的开源语言模型,并即将扩展至多模态和视觉语言模型(VLM)。它为i.MX 95等应用处理器器提供开箱即用的优化方案,满足会话式AI、物理AI等场景对实时性能的需求。
GenAI正在从云端向边缘迁移,这对嵌入式开发人员意味着什么?在Apple Podcasts 、Spotify 或YouTube 上收看我们的EdgeVerse Techcast节目,了解详情。
通过采用保持精度的量化技术,如整数8位和4位(INT8和INT4)精度,GenAI Flow能充分发挥神经处理单元(NPU)的推理加速能力。动态运行GenAI Flow可显著提升设备端的响应速度与能效。例如,“首个Token响应时间”(TTFT)是衡量GenAI应用的关键指标,可从Arm Cortex CPU (Float32精度)的9.6秒缩短至Neutron NPU (使用INT8量化)的不到1秒。这意味着无需依赖高功耗服务器或云基础设施,即可实现流畅、实时的AI体验。
GenAI Flow还支持小语言模型(SLM),SLM模型更轻量,但仍具备生成高质量结果的能力。该流程支持在中央处理器(CPU)、神经处理单元(NPU)或混合配置之间灵活切换,开发人员可根据具体产品需求灵活调优性能表现。
GenAI Flow的一项核心功能是对检索增强生成(RAG) 的内置支持。这种模型微调方式允许LLM访问特定领域或私有数据源,如设备与服务手册、内部PDF文件、设备维护日志等,而无需重新训练原始模型。RAG将相关外部知识以向量数据库形式注入并存储在边缘设备,使生成的响应更加情境化、扎根现实,有效减少AI的“幻觉”现象并避免某些判断错误。
RAG尤其适用于边缘场景,因为所有数据处理均在本地完成。这不仅保护了敏感信息,还能提供动态、按需的AI响应。开发人员只需将新文档转化为高度压缩、适配LLM的数据库,模型即可立即采纳新增情境,无需重新训练。这种效率可节省大量成本与能耗,避免在数据中心反复进行GenAI微调。
GenAI Flow已在多个行业中得到广泛应用,特别是在对低延迟性能和数据隐私要求极高的场景中。
在汽车业,AI娱乐中控系统能够通过参考车载服务手册,响应自然语音指令,从而实现无缝的免手动操作体验,无需依赖传统的网络连接。
在医疗保健业,非接触式AI界面使临床医生能够通过语音提示安全访问手术或患者数据,在高敏环境中有效降低身体接触和污染风险。
在移动机器人领域,生成式AI模型结合光学字符识别(OCR)与RAG技术,能够解析书面指令与视觉输入,并据此执行具备情境感知的智能操作。这类系统已突破基本自动化范畴,迈向人与环境之间更深层次的智能交互。
在工业自动化领域,AI助手可利用实时传感器数据与维护文档协助技术人员排查和解决设备故障。所有数据与文档均在本地处理,即使在远程或低带宽环境下也能高效运行。
在上述应用场景中,GenAI Flow为开发人员提供了一个强大且注重隐私保护的框架,用于构建智能边缘解决方案。
GenAI在边缘的下一阶段演进将聚焦多模态与智能代理。未来的系统将融合语音、视觉和语言等多种输入形式,打造更丰富、更直观的用户体验。借助GenAI Flow,这一融合已在逐步实现,助力构建统一的边缘流程,可根据不同输入组合进行智能判断与响应。
另一个关键方向是持续优化边缘AI的性能——既包括扩展对大模型的支持,也包括加快小模型的运行速度。这涵盖了模型量化、执行灵活性以及对日益紧凑的LLM架构的支持等方面的技术进展。
随着AI系统适应性日益增强、本地响应速度不断加快,获取合适的工具变得尤为重要。GenAI Flow在设计上充分考虑了可扩展性,帮助开发人员将当今快速演进的AI能力集成至跨微处理器单元(MPU)平台的产品中,甚至未来可扩展至微控制器单元(MCU)级别的设备。
恩智浦半导体AI产品市场经理
Davis Sawyer现任恩智浦半导体AI产品市场经理,专注于软件工具以及基于i.MX微处理器的生成式AI使能解决方案。他常驻加拿大卡纳塔,同时担任边缘AI基金会“产业”工作组主席,致力于推动基于边缘AI的实际应用。此前,他参与创立了AI模型压缩初创公司Deeplite,该公司于2025年被收购。Davis热衷于打造跨学科产品,并乐于与睿智且友善的团队合作。