艾巴生活网

您现在的位置是:主页>科技 >内容

科技

使用高性能图形处理器_能够支持高端图形处理的高端处理器介绍

2024-04-30 23:35:00科技帅气的蚂蚁
如今,仅仅传输纯文本是不够的。为了在一个充满极端感官刺激的世界里吸引我们,保持我们的注意力,任何数据都必须按照我们的审美来呈现。因

使用高性能图形处理器_能够支持高端图形处理的高端处理器介绍

如今,仅仅传输纯文本是不够的。为了在一个充满极端感官刺激的世界里吸引我们,保持我们的注意力,任何数据都必须按照我们的审美来呈现。因此,即使是基本的信息也必须用鲜艳的颜色显示,并配以复杂的渐变、动画和文章。

而高清、暗板、实时动画和文章都需要一个处理器来构建、渲染和显示。我们希望看到的是一个简单、明快、自然的页面。但随着显示分辨率的提高,每页的内容量、后台处理量和数据移动量也会增加。为了渲染这些变化和内容,占用的处理器资源,尤其是对时间和内存空间的需求也在增加。

本文将讨论一款具有足够的功耗、资源和架构优化能力,能够支持高端图形处理的高端处理器。这些处理器通常使用32位或更宽的内部数据路径,并使用高速时钟。内部缓存RAM和交叉存取DMA同样重要。

需求和选择

我们大多数人都没有这么幸运。设计的产品可以生产成千上万。因此,无论从成本、时间还是风险来看,ASIC通常都不是一个有效的选择。我们只能选择一个高成本的FPGA,它可以处理图形,同时仍然执行其他系统功能。

现在文章成了重点任务。数据格式化、子图像决定、图像叠加、图像滚动、颜色混合等等都涉及密集处理和数据路径任务。三维(3D)渲染和渐变增加了另一个级别的功能预期,这将耗尽处理器的资源和时间。

虽然一些高性能处理器可以被编程为专用图形外围处理器,但它们通常可以处理许多其他任务。此外,高端外围设备还可以包括预定的电容触摸接口,以及立体声、以太网和其他通信协议,以最小化应用处理器的中断次数。几乎就像有了另一个内核。像许多通用输入/输出一样,高性能DMA和外部总线接口逻辑无处不在。

典型的平板电脑的TFT显示屏通常具有1024600到25601600像素。如此大的范围严重限制了系统性能,尤其是所需的内存资源量(表1)。像三星Galaxy、亚马逊Kindle、东芝平板电脑使用的24位全彩2560 x 1600显示屏,单页就要消耗12 M的RAM。

表1:一般平板电脑显示屏单页信息内存消耗对比。

即使有32位宽的数据总线,368,640,000次单周期24位存储器数据传输仍然发生在以每秒30帧重绘的完整文章流中。即2.7 ns传输一次,对一次性数据渲染和移动处理要求过高。即使不进行MPEG这样的压缩文章格式的实时解码,渲染也没有你想象的那么简单。

另一个因素是内部高速缓存RAM和外部总线接口的速度。在高时钟速度下,外部总线RAM总是处于等待状态,这将使处理器严重过载,导致性能下降。一个好的SDRAM接口,对于处理器的总线接口来说,意味着可以在后台刷新页面,让处理器可以集中整个内核进行渲染处理。

高性能处理器可以专用于图形控制,特别是当它可以快速移入和移出数据时。Freescale MPC8245LVV333D就是高速SDRAM接口的一个很好的例子。该器件位于公司Power PC MPC603e内核的中心,是MPC82xx系列的一部分。这款32位352针处理器的时钟速度为333 MHz,某些系列可能更快。该处理器提供2、1.8和1.5 V版本,有助于降低这款拥有450万个晶体管的设备的功耗。

MPC8245采用Power PC架构和PCI桥,设计人员可以使用为PCI设计的外设和其他标准接口快速设计系统。其核心可以在各种频率下工作,允许设计师灵活权衡性能和功耗。SDRAM同步和驱动由外围控制单元独立处理,DMA功能释放给外部总线接口逻辑,使显示屏可以独立实现高速数据传输,从而释放处理器资源用于后台渲染(图1)。

图1:具有先进的高速外部存储器接口的流水线处理器模块是一种很好的专用图形处理器,可以充当高端半自主外设。这可以满足一些应用的所有需求。

注意SDRAM接口最高支持2 G SDRAM。高带宽总线可以使用32或64位传输周期。集成的DMA控制器允许离散收集操作,并支持自动连接DMA缓冲区的DMA链接。这减少了主微处理器的另一项任务。

德州仪器是数字成像和图形开发领域的高级开发人员和先驱,拥有旗舰处理器和OMAP35x等相关工具。OMAP平台集成了强大的600 MHz超级ARM Cortex-A8内核,并集成了四个OMAP应用处理器。

特别是,据说OMAP3530具有一流的文章、图像和图形处理能力,为流式文章、2D/3D移动游戏和文章拍摄提供直接支持。OMAP3530包括图形加速器和专用文章输入和文章输出端口。

特别值得注意的是64通道DMA支持和低功耗DDR接口。和其他处理器一样,RAM占据了大部分芯片面积。在这种情况下,64K通用RAM通常一次占用一到两条扫描线。提供高达256K的片内二级缓冲RAM也很有帮助,可以保存模板和一些背景图形信息。此外,我们可以注意到,还有另外96 K RAM用于DSP渲染和使用。3530还包括一个基于硬件的图形加速器。

TI和第三方开发工具制造商支持这些组件。Circuitco Electronic提供的BeagleBoard支持OMAP3530,并显示了与SDRAM、S-Video、DVI-D接口和所有LCD接口信号的连接(图2)。Digi-Key在线提供BeagleBoard产品培训模块和文章,解释如何使用运行Linux的beagle board来驱动微型投影仪。BeagleBoard可能是你非常感兴趣的文章界面。

图2: Beagle Board采用OMAP处理器架构,可以作为一个强大的测试和开发平台,尤其适用于嵌入式Linux设计。它非常适合显示驱动器和微型投影仪。

Logic PD使SOMOMAP3530-11-1782JFIR成为支持OMAP3530的开发和评估平台,并集成了ARM Cortex-M8处理器和一个TMS320C64x DSP处理器。虽然该器件主要设计用于信号处理开发,但也可以用作平台开发工具。

多核替代

多核处理器芯片可能是多处理器主板的最佳替代品。虽然在共享相同的内存和外设总线时可能会有一些带宽限制,但如果任务可以有效地分段执行,多核处理器仍有其突出的特点。

飞思卡尔有一款支持多核技术的知名芯片,即其基于ARM 8到ARM 11的强大i.MX 6系列处理器,支持最多4个1.2 GHz的四核设备,64位DDR 3和2个32位DDR 2接口。

飞思卡尔i.MX6sololite设备适用于2D和3D图形芯片MCIMX6L3DVN10AA。它是一款432引脚无ROM处理器,具有一个1 GHz内核。值得注意的是,它拥有256 K RAM和运行电压低至0.95 V的电源.

这些设备非常灵活,可以提供多媒体和图形处理功能。有一个专用的硬件图形加速器模块来执行矢量、2D和3D图形处理,从而将处理器从这些数据密集型任务中解放出来。另一个用于图像处理的特殊模块可用于处理诸如添加、反转、旋转、滚动、调整大小和混合操作等功能。此外,还有一个专用硬件模块连接摄像头和显示屏(图3)。

图3:当细分的专用硬件块可以利用高速总线和深度存储池时,最佳性能是可能的。这可以通过更多的集成外设以较低的成本提供类似ASIC的性能。

飞思卡尔更大的624针MCI MX 6D5VM 10B也是无ROM设计,配有专用图形硬件和ARM Cortex-A9。双通道和四核处于食物链的更高端,只消化单片内核无法实时处理的功能。比如i.MX6系列还包括四核1.2 GHz设备,比如MCIMX6Q5EYM10AC。这些设备还具有双2D图形引擎,并通过四个附加着色器提供3D支持。

总之,虽然ASIC可能是提供复杂图形和文章处理的有效解决方案,但大多数设计人员可能负担不起成本或没有时间使用它。幸运的是,正如本文所述,有各种各样的好的高端处理器可以提供流畅的文章处理,并完成这样的任务。