阅读新闻

石破天惊!R600-ATI DX10显卡震撼问世

SIMD 阵列

[日期:2007-07-05] 来源:原创  作者:福气 [字体: ]

 

如先前提到,ATI 在阵列内使用超大指令字 (VLIW) 技术,该公司使用这个方法的理由在于每个阵列是由一个汇流处理器组成,每个汇流处理器又拥有 5 个不同的 ALU 单元、一个分支执行单元、注册器档案与一些其他项目。注册器档案被视为整个群组的一般用途注册器 (GPR)。整体上而言,SP 与 GPR 可以使用大约 6 TB/s 的频宽,每个读/写都是 32 位元结构,也可以组合成 64 位元与 128 位元。

为了使其有效运作,每个单元都必须以超纯量方式独立运作,因为指令也是独立的,当一切都放在一起时,它就像一个大型字 (large word),但每个 SIMD 只会取得一个字,每个元件也会取得本身的指令集。 SIMD 仲裁与从快取的捉取动作是同时执行,而指令也是每个单一周期 (这已在排序那段讨论) 同时发出。

“为了众多目的,ATI 拆解向量为 4 个纯量单元。在先前的设计中,ATI 采用 5 个 ALU 来处理一个 Vec4+1 (或称向量加一个纯量)。ATI 在新硬体中保持相同安排,但将之改成超纯量,并互相独立,它已不再是向量格式了,它们被安排为 5 个纯量单元,每一个都可执行一个浮点 MADD (乘、累积、加与除)与整数作业 (加法比较),因为在 DX10 的著色器模型 4.0 (SM 4.0) 中存在著这两种资料种类的运作。

较大的单元 (亦即“体积较大”) 负责 ATI 不想分散处理的额外功能,其中的作业包括浮点转定点 (fixed) 转换及正弦、余弦、记录 (log)、平方根、e, pi 与其他计算等超越数 (transcendentals)。这非常类似 Nvidia G80 中采用的特殊指令单元,但后者大多数是用在一般作业上。 些“特殊”计算的执行频率较低,因此ATI 认为每五个安排一个就足够了。如果你观察 ALU 作业的标准比例,会发现超越数并不常见,MADD 类型的作业仍是开发者在顶点方面最常见的情况。但在像素端,情况就不同了,超越数是可能阻碍效能的标准化 (normalization) 动作所需,通常这些数可以在长时间内摊平 (amortized),以最小化负面影响。 ATI 表示,迄今为止或在可见的未来内,超越数都不会形成大问题。

由于存在两种分支,因此 ATI 加入了分支执行单元。这是个重负担的单元,也就是说整个 SIMD 阵列必须分支为程式码的全新部分。这是由排序器、仲裁器与超执行绪派遣处理器 (控制器) 处理,在某些情况下,略过一或两个指令并透过预测方式执行简单类型的指令,这样的分支方式很合理。预测则由 ALU 直接处理。ALU 算出作业的典型结果及删除写入、略过指令等的旗标,因此仲裁器与排序器不必处理这些事务,所有 ALU 均具备处理此形式预测的逻辑。

ALU 附加了大量的本地储存,也就是 GPR (一般用途注册器)。虽然方块图的图例让 ALU 看起来蛮大的,但实际上恰恰相反。这是所有睡眠中的执行绪资料暂时变数-像是运算结果与运算的来源资料-保留的地方。

它是个统一著色器,所以不会在意你在执行什么著色器,顶点、几何与像素都完全一样,所以所有资源在每一周期都可供你使用。无论它是使用置换贴图 (displacement map) 执行顶点材质化,或是在你的几何著色器执行某个非寻常的查询 (lookup) 动作,所有资源都是一样。无论是顶点、几何或像素著色器都不会具有任何优势,因为它们只是无视著色器类型的待执行的指令,但真正重要的是我们正尝试测试的东西。

新一代硬体必须运用的新设计观念,较之过去的设计,开发者又要开始著手一些陌生的任务。我们所见的例子之一是从置换贴图执行镶嵌,以建立如新的“露比:雪盲”(Ruby: Whiteout) 所做的高几何复杂环境。在手上拥有两组 DX10 能力硬体的前提下,考虑到它们所提供的火力,我们应该可以期待新概念所产生的火花。

 



上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9..] [18] 下一页   
【内容导航】
第1页:等待值得么
第2页:精神食粮:这种设计的理由
第3页:新设计-高层次检视
第4页:命令处理器 (CP)
第5页:设定引擎
第6页:超执行绪派遣处理器
第7页:排序
第8页:SIMD 阵列
第9页:材质单元
第10页:记忆体读/写快取
第11页:转译后端-AA 到 Z
第12页:Z 缓冲与 HiZ
第13页:内存界面与分散
第14页:镶嵌-必要或强制?
第15页:游戏的真实世界
第16页:AVIVO-许多新硬体
第17页:给我看效能测试!
第18页:性能测试结果
阅读:
录入:福气

评论 】 【 推荐 】 【 打印
上一篇:iPhone改变移动产业 成为全球疯狂运动
下一篇:摩托罗拉预计第二季裁员相关税前支出为1.01亿美元
本文评论       全部评论
发表评论

字数
姓名:

 
新闻查询