
在 R600 设计的其他新快取中,也包括针对一般用途注册器 (GPR) 阵列设计的记忆体读/写快取。 DX10 想要“虚拟化”所有可用的任何资源,以提高其原始容量。遵循 DX10 虚拟化主题的设计,ATI 必须将 GPR 堆叠虚拟化。在 DX9 API 标准下,每个执行绪只能存取 16 或 32 个 GPR,而 R5xx 超越了这点。ATI 必须导入虚拟化 GPR 的系统,因此建立了和顶点快取与材质快取平行的双向读/写快取,这可让著色器核心真正在记忆体之间写入与读回。它也可处理写入结合 (combining) 与其他强化,以改良效能。写入结合是在传送到记忆体之间资料群组化的能力,这可节省写入指令,也有益 GS Stream Out 功能。在这种新设定下,每个像素可以存取高达 4K 128 位元向量或 64 kB 资料。在数万个像素于著色器核心作用时,不可能保留住所有资料,所以这也是虚拟化对 DX10 这么重要的原因。
Stream Out 可容许 R500 中称为转译为顶点 (render-to-vertex) 缓冲的新技术,现在这个动作可以在几何著色处理后执行,方法是从著色器中直接汇流出去。 它可以在著色器外写入顶点资料,然后针对镶嵌或任何其他额外处理到处流通。这也可透过执行绪沟通完成,在这个地方,一个执行绪可以写出资料,并让下一个执行绪读回、执行一个转译为顶点缓冲、或溢位 GS 资料。 只有当 GPR 堆叠虚拟化时,才能完成这件事。
