阅读新闻

石破天惊!R600-ATI DX10显卡震撼问世

内存界面与分散

[日期:2007-07-05] 来源:原创  作者:福气 [字体: ]

 

如果你回忆 ATI 发表 R520 (X1900) 时,应该会记得该公司导入了环圈 (ring) 形式的新式记忆体汇流排。大多数晶片设计与甚至 ATI 的前几代产品都采用集中化交叉开关 (crossbar),这先天就是不错的设计。但是当设计往上延展到其可服务的用户端数时 (确切而言是 n^2 ) 就会出现严重缺点。要服务这些用户端就需要多上许多的引线,使核心失去了核心的作用。城市人口增加时的高速公路数目愈多,用户端愈可以到处游走。ATI 从 R520 开始转变为部分分散式方法,这可以在环圈外围读取,透过交叉开关写入。“2900 是个完全分散式设计,也就是说在用户端数目增加的同时,也可避开 n^2 延展陷阱。”

一如先前提到,ATI 从 256 位元宽度汇流排移转为具有 8 通道的 512 位元宽度。设计中共有 4 个环圈停止点。

ATI 针对双向汇流排,采用堆叠式 I/O 设计,共有 4 组引线给资料读取,4 组给资料写入之用。

环圈上有读取与写入用途的资料流。上图总共有 4 组双引线满这可容许双向 1024 位元宽度,每个方向有 4 个引线。晶片四周共有逾 2,000 条引线,而资料是以全速运作。内部可使用的频宽比外部还多,这种设计概念在于确保所有内部用户端拥有尽量多的频宽存取。如我们先前提到,产品的内部频宽约为 6 TB/s。

有一个值得思考的问题是 ATI 为什么不在前几代产品就这么做?答案是这种设计需要许多空间,在新设计中,ATI 可以将 I/O 路径缩小到只有前一代产品的一半,但这些路径都是类比装置,无法像电晶体一般随著技术进展缩小,这是牵涉到电容、电感与金属电阻的类比装置设计。况且它们也不易缩小,新的 512 位元路径所占的空间和前一代的 256 位元路径差不多。

这牵涉到许多设计逻辑才能支撑所有技术的实现,这造成晶片内部占用空间的成长,但在搭配现有记忆体的情况下,这是增加频宽所必要。ATI 大可使用 GDDR4,而频宽即得以增加。然而 GDDR4 仍是供应量有限的零件,消费者也必须因此付出较大价差,并承受供应断货的风险。虽然 ATI 的确也供应 GDDR4 版本给系统整合厂商 (boutique; 专精领域厂商),但主流市场仍会推出具备 512 位元汇流排的 GDDR3 记忆体版本。ATI 原可以享受 256 位元 GDDR4 设计的优势,但在 GDDR3 搭配 512 位元宽汇流排的情况下,目前并不需要最尖端科技的记忆体来大幅提升频宽。就成本/频宽比而言,这已是一大胜利,就像以前 256 位元之于 9700。就频宽而言,GDDR3 卡标榜 105 GB/s 频宽,而 GDDR4 卡拥有 160 GB/s 频宽。

另外还有一个不成文的规则就是:提高记忆体的时脉频率,反而会变得更没有效率。DRAM 内的分页存取仍由物理与化学法则所决定,即使你可以提高时脉频率,但物理法则仍不会变。

滞后 (hysteresis) 是指材料在回到其自然低能量态之前的激发状态时,在较高时脉速度时的延迟较长的一种现象。在达成较高时脉速度时,返回低能量态的延后现象会提高较长延迟的必要性,较长的等待时间是为确保回复到低能量态。

让记忆体跑慢一点,可以提升记忆体的效率,同时也可享受较低耗能与其他好处。环圈与记忆体的配合可让频宽容许约 70 个写入用户端与 80 个读取用户端。

 



上一页 [1] [..8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] 下一页   
【内容导航】
第1页:等待值得么
第2页:精神食粮:这种设计的理由
第3页:新设计-高层次检视
第4页:命令处理器 (CP)
第5页:设定引擎
第6页:超执行绪派遣处理器
第7页:排序
第8页:SIMD 阵列
第9页:材质单元
第10页:记忆体读/写快取
第11页:转译后端-AA 到 Z
第12页:Z 缓冲与 HiZ
第13页:内存界面与分散
第14页:镶嵌-必要或强制?
第15页:游戏的真实世界
第16页:AVIVO-许多新硬体
第17页:给我看效能测试!
第18页:性能测试结果
阅读:
录入:福气

评论 】 【 推荐 】 【 打印
上一篇:iPhone改变移动产业 成为全球疯狂运动
下一篇:摩托罗拉预计第二季裁员相关税前支出为1.01亿美元
本文评论       全部评论
发表评论

字数
姓名:

 
新闻查询