AMD|小芯片构架的RDNA 3主打差异化竞争——解读AMD次世代GPU的战略底气( 三 )


【AMD|小芯片构架的RDNA 3主打差异化竞争——解读AMD次世代GPU的战略底气】
正是通过统一计算单元 , 将运算指令紧密地结合到统一的计算单元当中 , 使得新构架的AI加速能力提升了多达2.7倍 , 可以让RDNA 3构架显卡能够满足未来应用需求对AI能力的高需求;

另一方面 , 统一的计算单元也能进一步优化光线追踪 , 它主要通过新的着色器指令集、针对ray box sorting(Ray Box排序)和traversal(遍历)多项的优化 , 实现光线追踪性能的提升 , 而这一能力的提升也高达50% , 这使得AMD显卡在光线追踪上与对手差距大大缩短 。

AMD还发现 , 很多游戏和工作负载的瓶颈更容易卡在前端工作分配和命令处理的效率上 , 一味提升后端着色器性能是解决不了这方面问题的 。 所以在RDNA 3构架上 , 便采用了全新的Decoupled Clocks(解耦时钟) 。 Decoupled Clocks的机制可以理解为一个独立电源管理器 , 也就是让前端和后端着色器分别跑在合适的频率之上 , 主要是提高了前端频率 , 达到2.5GHz , 而让后端跑在较低的2.3GHz上 , 仅这一项 , 便节省25%的用电量 , 也解决了前端的性能瓶径 。
GCD核心进步2:新的显示引擎(Radiance Display Engine)

在GCD中 , 新的Radiance Display Engine也是相当明显的进步 。 它拥有业界首个能够搭载在高性能显卡游戏上的DisplayPort 2.1的接口 , 大为提升相对未来显示设备的匹配能力 , 也是为未来以4K作为游戏主流分辨率而生的 。 这个接口拥有前所未有的54Gbps Display Link的带宽 , 可以支持4K@480Hz或者8K@165Hz的高分(分辨率)高刷(刷新率)能力 , 每通道12位色深可以渲染出让人惊艳的最高可达680亿种颜色 。 通过全新显示引擎 , 实现了RDNA 3构架的第二项设计目标 。
GCD核心进步3:全新的双媒体引擎(Dual Media Engine)

GCD中引入的全新的双媒体引擎Dual Media Engine , 是为了满足最新媒体标准与相应格式的支持 。 多媒体性能一直是AMD的优势项目 , 可以看到新的双媒体引擎支持AVC跟HEVC2个同步解码或者同步编码的直播 , 也支持8K@60Hz的AV1编码跟解码能力 , 尤其值得注意的是 , 新引擎支持AI提升视频编码质量 。 比起RDNA 2 , 双媒体引擎通过提升内部频率 , 性能比前者提升了1.8倍 , 在实际编解码操作中 , 基本能够节省一半的时间 。
正是通过这些改进 , 使RDNA 3的计算性能要比RDNA 2的计算性能高了2.7倍 , 浮点运算性能达到61 TFLOPS 。 且通过小芯片设计的RDNA 3构架实现了对5nm工艺制程的更优化利用 , 总体提升了15%的频率和54%的能效 。

汇总RDNA3 GPU特点:
首次在GPU中引入小芯片设计 , 对5nm工艺进行优化 , 频率提升15% , 能效提升54%;
统一的高密度集成计算单元 , 提升DIE上晶体管密度165% , AI加速能力提升了多达2.7倍 , 光追性能提升1.5倍;
峰值带宽提升2.7倍 , 浮点性能高达61TFlops;
每时钟周期双路指令发射 , 提长前端频率 , 效率更高、能耗更低;
全新显示、媒体引擎 , 原生支持DP 2.1、支持8K@60Hz的AV1编解码;
AMD Radeon RX 7900 XT & AMD Radeon RX 7900 XTX性能解读


从参数上来看 , 此次全新发布的RDNA 3架构台式平台旗舰级独立显卡都拥有相当不错的素质 , 以AMD Radeon RX 7900 XTX为例 , 它拥有96个RDNA 3的统一计算单元、2.3赫兹的游戏频率 , 并配有24GB , 384bit位宽的GDDR6显存 。 此外它支持最新的DisplayPort 2.1跟AV1编码解码 , 整个卡只有355W的功耗 , 作为旗舰级产品 , 这是相当不错的表现;比之略低的AMD Radeon RX 7900 XT , 则拥有84个同样的计算单元、2 GHz的游戏频率、20GB、320bit位宽的GDDR6的显存 , 同样也支持DisplayPort 2.1以及AV1 , 全卡为300W的功耗 。