Ara240独立神经处理单元(NPU)助力边缘AI创新

2026年4月7日
by Bassel Saab

如今模型越来越大并走向多模态，还出现了设备端生成式AI和智能体AI，AI工作负载不断增长，边缘系统需要的已不仅仅是渐进式的算力提升，而是专门的加速能力，以实现实时性能、更低功耗、强大的数据隐私保护以及可扩展性。Ara240独立神经处理单元(DNPU)正是为了满足这些边缘AI需求而构建。

作为恩智浦首个独立神经处理单元(DPNU)，Ara240提供了AI优化的架构，拥有高达40 eTOPS的算力、大容量片上存储器和高片外带宽。总而言之，它专为运行先进AI、大语言模型(LLM)、视觉语言模型(VLM)、多模态语言模型以及下一代边缘推理而打造。

借助Ara240 DNPU带来的更高性能和效率，将边缘AI提升至全新高度。探索Ara240 DNPU，并利用Ara生态合作体系规划您的下一个设计。

无论是设计工业自动化系统、自主机器人、智能基础设施、先进的人机接口(HMI)平台还是边缘服务器，Ara240 DNPU都能提供所需的性能余量，直接在边缘运行现代AI工作负载。

图1. Ara240 DPNU为先进的AI应用实现实时、设备端推理

Ara240 DNPU如何专为边缘先进AI应用而设计

Ara240 DNPU专为高需求的设备端AI应用而设计，在这些应用中，延迟、隐私和能效至关重要。Ara240 DNPU支持广泛使用的AI模型架构——包括卷积神经网络(CNN)、Transformer、大语言模型(LLM)、视觉语言模型(VLM)和多模态模型——使开发人员能够将生成式AI和高性能AI引入嵌入式系统和边缘系统，而无需依赖云端计算。

该DNPU的关键技术能力包括：

高达40 eTOPS的等效算力：为主机处理器分流复杂的并行AI工作负载提供高吞吐量
大容量片上存储器+专用LPDDR4接口(高达16GB)：支持更大模型和更高带宽处理，同时不增加对主机内存的争用
PCIe G4x4和USB 3.2 G1主机接口：提供灵活、高速的集成
安全启动和硬件信任根：实现安全的AI管道和受保护的部署
支持Linux和Windows运行时：为边缘系统提供广泛的兼容性
框架支持：包括TensorFlow、PyTorch和ONNX

作为可扩展的AI配套处理器，Ara240 DNPU为那些需要在本地执行复杂推理的系统带来强大的AI加速能力——从而提供更低的延迟、更低的云成本以及更强的数据隐私保护。

借助Ara240 16GB M.2模块加速原型设计

为帮助开发人员更快地评估Ara240 DNPU，恩智浦提供了Ara240 16GB M.2模块，该模块可无缝集成到任何带有M‑Key PCIe接口的主机平台而设计。

模块亮点包括：

高达40 eTOPS的AI性能
专有神经网络处理器，运行频率高达900MHz
16GB LPDDR4存储器
M.2 2280 M‑Key外形尺寸
PCIe G4x1/x2/x4配置
目前支持i.MX 8M Plus和i.MX 95应用处理器

该模块为评估Ara240性能、加速概念验证开发以及将高性能AI集成到现有设计提供了一条简化路径。Ara240 16GB M.2模块将于2026年6月开始供货，您可在恩智浦官网nxp.com和代理商处购买。

图2. Ara240 16GB M.2模块让开发人员能够更快地基于Ara240进行原型设计

相得益彰：Ara + i.MX

Ara240 M.2模块可用作我们i.MX应用处理器的AI协处理器：

i.MX 95应用处理器：高性能边缘计算平台，集成了eIQ® Neutron NPU
i.MX 8M Plus应用处理器：Arm® Cortex®‑A53平台，内置了机器学习和视觉加速能力
未来支持M‑Key PCIe的恩智浦平台

这种适配性使得目前使用恩智浦MPU的开发人员能够轻松地将Ara240 DNPU作为配套加速器，显著扩展AI性能。

合作伙伴生态系统提供紧凑、可扩展的Ara240加速器模块

除了恩智浦Ara240 M.2模块外，我们的生态系统合作伙伴也在推出各自基于Ara240的模块。

合作伙伴	产品	板载存储器	功率	模块类型	独特特性
F&S	FS-M2-AI	16GB	~12W(典型值)	M.2	德国制造. F&S工程支持与AI培训课程
Forlinx	FAI-ARA240-M	8/16GB	~12W(典型值)	M.2	中国制造。面向大模型的高带宽架构
Gateworks	GW16168	16GB	~12W(典型值)	M.2	美国制造；安全启动与信任根
Geniatech	AIM-M-K	8/16GB	~12W(典型值)	M.2	中国制造。可无缝集成到边缘服务器

这些模块使客户能够在不同的散热、机械和性能配置下轻松评估Ara240 DNPU——支持工业PC、机器人系统和紧凑型嵌入式边缘设备等应用。这些板共同为客户提供了一条从早期评估到完整系统设计流程的顺畅开发路径。

赋能物理世界AI的专用软件

恩智浦eIQ® Agentic AI框架扩展了eIQ AI软件开发环境，增加了专门设计的功能，在边缘充分利用其DNPU的加速能力。该框架通过协调多个模型(例如视觉、语言和控制模型)，同时将推理和决策高效地映射到硬件加速器而非通用CPU上，从而实现智能体AI工作负载的确定性、实时执行。

通过结合硬件感知型模型准备、优化的编排以及安全的设备端执行，我们的eIQ® Agentic AI框架使DNPU能够为自主式和生成式AI工作负载维持低延迟和可预测的性能，在减少对云端依赖的同时，简化复杂的多模态边缘AI系统的部署。

借助Ara240 DNPU以及不断壮大的M.2模块生态系统，开发人员可以获得：

可扩展的AI性能
实时推理能力
通过本地处理提升隐私保护
更低的运营成本和云成本
支持不断演进的模型架构的灵活性

借助Ara240加速边缘实时、设备端AI处理。Ara240是我们首款DNPU，提供高达40 eTOPS的算力，配备可扩展的内存和带宽。了解更多关于Ara240 DPNU的详情。

标签: 工业控制

作者

Bassel Saab

恩智浦半导体资深技术产品市场经理

Bassel拥有法国ESIGELEC工程学院工程硕士学位，以及加拿大UQAC大学计算机科学硕士学位。他秉持客户至上的思维理念，曾担任半导体行业售前工程师和高级AI现场应用工程师，积累了丰富的AI专业能力。