不久前AMD刚刚更新了嵌入式领域的显卡产品,并在第一时间公布了其面向不同应用领域的新一代嵌入式解决方案。与以往不同的是,除了强调新品的性能,AMD更多的考虑了如何使产品具有更长使用周期,更高可靠性以及可扩展性。而在近日,AMD再次曝光了基于x86架构的多核心嵌入式系统,这也表明了AMD在嵌入式领域不断寻求着创新。
新一代AMD嵌入式R系列在CPU性能在大幅度的同时,GPU性能提升高达22%。为客户提供小尺寸、高性能的CPU、GPU以及I/O。用户可以利用GPU计算和HSA的能力,简化整体系统架构,充分利用标准的编程语言和标准化的架构与组件简化系统。而凭借DDR3和DDR4的同步支持,多数用户能够安心过渡到DDR4。
从新一代R系列SoC的设计方案来看,其产品不仅是对现有高性能x86 CPU和GPU处理器核心产品的更新,同时该平台也带有第三代GCN显卡架构,并且把控制中心(南桥)整合进了设备。因此,AMD在一颗芯片内融入了CPU、GPU以及I/O等全部设计,并对产品所应用的市场做了更精细的划分。此外,AMD还在高性能领域首次引入了运行温度范围更宽的产品,其中包括在零下40度到105度运行的设备,这一设计令其产品能够为工业控制与自动化及通讯基础设施应用提供远高于市场水平的性能,同时又能够满足该行业对运行温度的苛刻要求。
就新一代R系列SoC产品的核心来看,其采用了最新一代代号为“挖掘机”的x86核心。这一核心与前代相比执行效率大幅提高。其架构也有所改变,AMD通过提升IPC来提升核心内的性能。与此同时芯片内还融入了下一代功耗管理技术,平衡IP模块可获得的功耗,在更合理的能耗下让整个设备的效率最大化。
在新一代功耗管理技术中,当CPU在运行大量工作而GPU处于闲置状态时,功耗管理技术会把GPU的一些功耗分配给CPU,实现CPU的性能提升和执行效率的最大化。
在产品的设计上,新一代R系列SoC还提供了一项叫做“可配置的TDP”的技术,它允许开发商针对一个特定的热功耗水平进行系统优化,同时保证一定的性能范围,也就是说每一个SKU都可以根据具体的应用去优化。
另外,新的产品还融入了最新的多媒体技术,其中包括对HEVC或H.265的硬件加速解码。而考虑到嵌入式市场的发展趋势是会从DDR3迁移到DDR4,让DDR4成为主流的DDR技术制式,同时支持两种制式可以让用户更倾向于选择此产品。客户可选择现有设备使用DDR3或DDR4,或等待时机成熟后再迁移到DDR4,而无需再做硬件更替。另外,AMD平台还整合了具有安全性能的处理器——AMD安全处理器。这是符合TrustZone®标准的安全处理器,能够实现安全启动,保证安全的执行环境,处理加密运算等。
相比AMD上一代R系列的解决方案,此次展示的R系列SoC在结构设计上将CPU、GPU和控制中心都封装为一个整体,这一设计可令其体积减小30%,外观形态极具精巧的同时,释放出更宝贵的空间资源。
为了进一步平衡性能能耗比,AMD就代号为“挖掘机”的x86核心架构做出了诸多改进,其中包括IPC提高4%-15%,同时减少晶片的体积,降低核心功耗。此外,通过对缓存架构的改进,新品在预读取效率以及核心内部分支预测方面也有着更好的表现。
在产品的设计上,R系列SoC也是第一款完全符合HSA 1.0标准的SoC。在嵌入式的多个应用领域里,工作负载需要并行运算能力作为支持。在许多领域或实施方案中,这些功能在GM、FPGA、ASICS或其他加速器上运行。HSA是一个能够提高GPU运算效率与性能的架构,它允许开发人员利用GPU,而不是在系统上外接其他的组件。开发人员可以改装硬件,也能改进系统的软件架构。HSA具备统一的内存架构,CPU和GPU之间有内存连贯性。这一特性加上强大的可编程能力,不仅可以实现标准的开发方法,也能实现更快更优化的解决方案,简化整体系统架构。
在产品交付和R系列SoC投放市场的策略上,AMD此次更多的强调了GPU产品的全新Linux驱动架构。我们知道,AMD的传统是向市场提供两个版本的Linux驱动:一个是闭源驱动,另外一个是开源驱动,客户使用不同驱动,会获得相应的特性组合以及性能优化能力。而在新的产品设计中,AMD将转向统一的驱动策略,也就是高度开源的系统。开发人员可获得相应的源代码,获得AMD产品带来的全部好处及基于Linux系统的特有优势。这也意味着,如果开发人员或OEM想要发布自己的Linux版本,也可以把驱动整合进去,发挥其生态系统合作伙伴的能力,提供源代码,以便在自身的软件体系中用使用这些源代码。
从AMD嵌入式R系列SoC的各款产品及其参数来看,APU产品线中所涵盖的产品在单一设备中集成了CPU、GPU以及控制中心,而在纯粹的CPU产品线中只有CPU和控制中心。在TDP的设计上,每款产品都有TDP的选择范围,在12瓦到35瓦之间。如此设计的优势在于,针对每一款产品,开发人员都可以任意选择搭配,并对设备在可选定的功率数上进行相应的优化。开发人员可以选择增加TDP,相应提高应用所需的性能要求,或可针对同一款SoC开发不同的SKU。而且未来他们也能弹性提升性能,通过操作系统或调整Bios实现TDP改变,而无需做硬件升级。
从产品的实际性能来看,几乎同样性能的情况下,新品可以节省20瓦的热功耗。如果TDP保持在35瓦不变,新品的显卡处理性能提升高达22%。
在CPU性能方面,MFRX-421 BD,15w cTDP与前代BE RX-427BB 35w相比,虽然有较小的性能差异,约5%-10%,但节省了20瓦的热功耗,提升了每瓦性能。如果在35w的水平上比较BE和MF,可以看到基于嵌入式微处理器测试基准协会(EEMBC)的CoreMark第一版MT性能标准,CPU性能提升高达25%。
AMD R系列SoC的多媒体与图形处理性能可以为娱乐场游戏机和彩票终端的开发商所用,全方位改善用户体验,更好地招揽客户,延长游戏时间。另外,有的娱乐场出于空间考虑,也需要更小尺寸的设计。比如日本的游戏厅空间都比较狭小,因此小尺寸高性能的SoC非常适用。
除了在娱乐市场上的应用,R系列SoC也同样适用通讯基础设施。在通讯市场的许多领域还能利用GPU运算与HSA来替代加速器、FPGA和ASICS,例如可以将HSA用在Internet 协议安全性(IP Sec)上。另外在这个市场也需要强大的开源支持,考虑到OEM厂商需要开源驱动来释放GPU作为计算平台的能力,OEM厂商可将其整合进自己的Linux发布版里,以便充分地利用设备IP的能力。
针对医疗成像领域,这一市场往往要求高成像能力,因此强大的GPU和多媒体性能的应用解决方案是非常合适的。在医疗成像领域中的某些部分,例如图像转换部分,还有机会用一体化的SoC解决方案取代FPGA和DSP的配合方案,让所需应用更少更简洁。试想如果有一个强大的AMD R系列SoC支撑多屏显示,不需要独立显卡去带动图像显示,医生可以看到更多更高分辨率的成像结果,病人也可以通过多屏显示看到部分的结果。
AMD也加大了在软硬件的生态系统方面的投入,此次AMD提出一个三位一体的思路。第一个是利用Yocto,Yocto是一个让客户通过内嵌架构,开发定制版本Linux的开源项目。让用户融入开源图形处理驱动和Kernel.org提供的组件,在不需要商用Linux版本或有特殊需要的情况下去开发专属的Linux发布版。AMD还有一个基于Mentor Embedded的Linux的半成品包——MEL Lite,里面有无成本的选项,可以让用户在标准发布版的基础上进行改造。用户不用完全推倒重建,不需要从头做起,但有一定的灵活性,能够拿到源代码或选择加载的组件等用于自行开发。第三项则是纯商业发布Linux,也被称作MEL商用版,通过该方案用户可以得到更专业的开发与分析工具,还可以获得定制服务的支持。
写在最后:
一直以来,在大众的印象中,多数嵌入式系统应用强调低功耗的单板电脑、IPC工业控制电脑。此类应用大多以ARM嵌入式处理器为基础,但对比ARM为基础的SoC以及x86处理器为基础的平台,前者在能效与应用资源方面都相对较弱。而此次,AMD首次在高性能x86领域推出了嵌入式SoC,其重要意义在于进一步推进了嵌入式应用市场的应用体验。