AI芯片新架构发布，性能飙升引期待 – realnews.my 马来西亚新闻经济科技旅游娱乐体育生活

一场算力革命的序曲：洞悉 Imagination E 系列的架构飞跃与市场潜力

边缘智能的新纪元

数字世界的脉搏正在加速跳动，人工智能正以前所未有的速度重塑我们的生活和工作方式。在这场由数据和算法驱动的变革中，算力成为了最核心的引擎。特别是“边缘AI”，即在设备本地进行AI计算，正因为其低延迟、高效率和更好的隐私保护而备受瞩目。从智能手机、自动驾驶汽车到工业自动化，边缘AI的应用场景如雨后春笋般涌现，对处理器的性能、效率和灵活性提出了更高的要求。正是在这样的背景下，Imagination Technologies 推出了其全新的 E 系列 GPU IP，旨在打破边缘AI和图形处理所面临的瓶颈，开启一个全新的时代。

架构革新的双重奏：神经核与爆发式处理器

Imagination E 系列 GPU 的核心竞争力，来源于其两大创新架构的协同作用：神经核（Neural Cores）和爆发式处理器（Burst Processors）。

神经核：AI 算力的倍增器

传统的 GPU 主要面向图形渲染任务，尽管也能进行通用计算，但在AI计算方面与专用的NPU（神经网络处理器）相比存在差距。Imagination E 系列的神经核正是为了弥补这一差距而生。它在每个 GPU 核心中深度集成了针对低精度、高能效AI操作的加速能力，将经典的 Imagination GPU 核心转化为计算密度极高的神经核。官方数据显示，E 系列的 INT8/FP8 算力最高可扩展至 200 TOPS，相较于前代 D 系列，AI 性能提升高达 400%。这种显著的提升，使得 E 系列能够轻松应对自然语言处理、工业视觉检测等对算力要求极高的任务。

神经核的强大之处不仅在于其原始算力，更在于其对多种 AI 数值格式的支持，这赋予了开发者极大的灵活性，可以根据不同的性能、精度和功耗需求设计和优化神经网络。此外，E 系列采用了对 AI 友好的内存架构，优先使用本地内存进行计算，每个统一着色器集群（USC）配备 512KB 寄存器存储空间，是同类边缘 GPU 的两倍，大幅减少了访问外部存储带来的功耗和性能损失。这种设计思路有效解决了边缘设备内存带宽受限的问题，提高了整体计算效率。

爆发式处理器：能效的守护者

在边缘计算场景中，功耗往往是比绝对性能更重要的考量因素。Imagination 深知这一点，并在 E 系列中引入了极富创新的爆发式处理器技术。这一技术并非通过复杂的算法优化，而是纯粹基于硬件架构的改进，通过缩短流水线深度和最小化 GPU 内部的数据移动，实现了平均 35% 的能效提升。这种提升在 AI 推理、游戏和用户界面等工作负载下尤为明显。爆发式处理器能够自动将相邻指令分组并局部执行，从而减少数据传输延迟并提高指令命中率。这种架构层面的优化，为对实时性要求苛刻的应用场景（如 AR/VR、自动驾驶）提供了强大的硬件保障。例如，在移动端游戏中，爆发式处理器可以在保持 4K@120Hz 流畅输出的同时，将 AI 驱动的帧生成技术功耗降低 70%。

Imagination 多年来坚持采用 VLIW（超长指令字）流水线设计，虽然在特定场景下有优势，但也存在管线过长、数据传输延迟较高等问题。 E 系列通过缩短 ALUs（算数逻辑单元）的管线深度，使得基础架构更加“现代化”，更接近目前主流桌面 GPU 的设计理念，即每一个流处理器都是一个完整的 ALU。这种“回头”式的改进，反而带来了能效的显著提升。

统一算力平台：融合的未来

Imagination E 系列最大的亮点之一，在于它将 AI 计算单元与传统的图形计算单元进行了深度融合。官方称，E 系列完全将“AI 单元”与统一着色集群（USC）进行了合并，使得 GPU 里的每一个 USC 都可以随时“切换”成为 AI 加速单元使用。这种设计理念与传统的“独立 GPU + NPU”方案有着本质区别。在 E 系列中，AI 加速单元与主 GPU 执行管线深度耦合，共享寄存器和本地缓存，从而避免了数据多次搬运带来的功耗和延迟，提升了资源利用率。此外，E 系列支持多种数值格式的混合计算，兼顾了灵活性与性能。

这种统一的算力平台，意味着一颗芯片可以同时承担图形渲染和 AI 推理任务。这对于现代设备日益复杂的应用场景至关重要。例如，在智能手机上，E 系列可以实现视频增强、语义识别和图像生成等应用；在智能座舱和自动驾驶场景中，同一个 GPU 可以统一处理座舱图形、仪表渲染以及驾驶员监测、语音交互等 AI 推理任务；在工业和智能制造领域，E 系列可以在低功耗边缘设备上部署 AI 模型，进行实时检测、路径规划和预测性维护。这种融合不仅降低了整体系统设计的成本，还提高了系统的灵活性和可扩展性。

E 系列在多任务处理能力上也进行了增强，将硬件支持的、零开销的虚拟机数量增加到 16 个，并提供先进的 QoS（服务质量）支持。多核版本的 E 系列 GPU 可以利用额外的核心来提升性能或增加灵活性，同时处理多个图形工作负载、多个 AI 工作负载，或者图形与 AI 工作负载的组合。

生态与市场的静待花开

强大的硬件架构需要成熟的软件生态来支撑。Imagination E 系列在这方面也做足了准备。E 系列神经核与更广泛的 GPU 和异构计算软件生态系统紧密结合，其能力可以通过 OpenCL 等流行的 API 来解锁。开发者可以使用 oneAPI, Apache TVM 或 LiteRT 等开放标准和工具轻松地将他们的工作负载迁移到神经核上。 Imagination 还提供了计算库和高度优化的图编译器，以最大限度地提高 GPU 的效率。

Imagination 的 PowerVR GPU 架构以其能效著称，并已在功耗受限的设备中应用了近二十年。 E 系列的推出，进一步巩固了 Imagination 在边缘计算领域的优势。 E 系列 GPU IP 适用于多种市场，包括移动设备、汽车、桌面计算和消费电子产品。特别是在边缘 AI 市场快速增长的当下，E 系列提供的兼具高效和灵活性的 AI 与图形综合解决方案，恰逢其时。市场研究机构 IDC 的研究总监 Phil Solis 表示，E 系列将 GPU 的可编程性与 AI 性能的飞跃相结合，为边缘 AI 系统开发者带来了极具吸引力的解决方案。 Counterpoint Research 高级分析师 Parv Sharma 也认为，E 系列使开发者能够在多种应用场景和终端设备上部署端侧 AI 算法。

首款 E 系列 GPU IP 已于 2025 年秋季正式上市并完成授权，汽车、消费电子、桌面及移动版本也同步开发中。 Imagination E 系列凭借其在架构上的巨大进步，特别是神经核和爆发式处理器带来的 AI 性能和能效的飞跃，以及其统一算力平台的理念，无疑为边缘 AI 和图形处理领域注入了新的活力。它的出现有望推动边缘设备的设计革新，将 GPU 推向图形和边缘 AI 系统的核心位置。

挑战与展望

尽管 E 系列在架构上取得了显著进展，市场对其最终表现仍需拭目以待。新的架构需要在实际应用中证明其稳定性和可靠性，软件生态也需要进一步的完善和推广。与竞争对手（如NVIDIA和Qualcomm）在边缘AI领域的激烈竞争也将是 Imagination 需要面对的挑战。

然而，E 系列所展现出的创新精神和技术实力是毋庸置疑的。它不仅仅是对现有 GPU 架构的迭代，更是对边缘计算未来发展趋势的深刻洞察。通过将 AI 计算深度集成到 GPU 中，并优化能效，Imagination 为开发者和设备制造商提供了一个更高效、更灵活的解决方案。随着边缘 AI 应用场景的不断拓展和复杂化，对这种通用且强大的算力平台的需求也将持续增长。

Imagination E 系列的发布，是边缘智能时代算力革命的重要一步。它是否能在广阔的市场中充分发挥其潜力，赢得客户和开发者的青睐，最终推动边缘AI技术的普及和创新，让我们静待市场给出答案。这无疑是一场值得期待的技术演进，也将深刻影响我们未来的智能生活。

Related Articles