阅读新闻

石破天惊!R600-ATI DX10显卡震撼问世

记忆体读/写快取

[日期:2007-07-05] 来源:原创  作者:福气 [字体: ]

 

在 R600 设计的其他新快取中,也包括针对一般用途注册器 (GPR) 阵列设计的记忆体读/写快取。 DX10 想要“虚拟化”所有可用的任何资源,以提高其原始容量。遵循 DX10 虚拟化主题的设计,ATI 必须将 GPR 堆叠虚拟化。在 DX9 API 标准下,每个执行绪只能存取 16 或 32 个 GPR,而 R5xx 超越了这点。ATI 必须导入虚拟化 GPR 的系统,因此建立了和顶点快取与材质快取平行的双向读/写快取,这可让著色器核心真正在记忆体之间写入与读回。它也可处理写入结合 (combining) 与其他强化,以改良效能。写入结合是在传送到记忆体之间资料群组化的能力,这可节省写入指令,也有益 GS Stream Out 功能。在这种新设定下,每个像素可以存取高达 4K 128 位元向量或 64 kB 资料。在数万个像素于著色器核心作用时,不可能保留住所有资料,所以这也是虚拟化对 DX10 这么重要的原因。

Stream Out 可容许 R500 中称为转译为顶点 (render-to-vertex) 缓冲的新技术,现在这个动作可以在几何著色处理后执行,方法是从著色器中直接汇流出去。 它可以在著色器外写入顶点资料,然后针对镶嵌或任何其他额外处理到处流通。这也可透过执行绪沟通完成,在这个地方,一个执行绪可以写出资料,并让下一个执行绪读回、执行一个转译为顶点缓冲、或溢位 GS 资料。 只有当 GPR 堆叠虚拟化时,才能完成这件事。

 



上一页 [1] [..8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] 下一页   
【内容导航】
第1页:等待值得么
第2页:精神食粮:这种设计的理由
第3页:新设计-高层次检视
第4页:命令处理器 (CP)
第5页:设定引擎
第6页:超执行绪派遣处理器
第7页:排序
第8页:SIMD 阵列
第9页:材质单元
第10页:记忆体读/写快取
第11页:转译后端-AA 到 Z
第12页:Z 缓冲与 HiZ
第13页:内存界面与分散
第14页:镶嵌-必要或强制?
第15页:游戏的真实世界
第16页:AVIVO-许多新硬体
第17页:给我看效能测试!
第18页:性能测试结果
阅读:
录入:福气

评论 】 【 推荐 】 【 打印
上一篇:iPhone改变移动产业 成为全球疯狂运动
下一篇:摩托罗拉预计第二季裁员相关税前支出为1.01亿美元
本文评论       全部评论
发表评论

字数
姓名:

 
新闻查询