以文本方式查看主题

-  泉州交易平台  (https://bbs.eoof.net:443/index.asp)
--  大众交易区!  (https://bbs.eoof.net:443/list.asp?boardid=2)
----  核心AIC全力加速!讯景9系列显卡物理加速测试  (https://bbs.eoof.net:443/dispbbs.asp?boardid=2&id=198574)

--  作者:伊诺维
--  发布时间:2008/10/24 11:40:00
--  核心AIC全力加速!讯景9系列显卡物理加速测试

  CUDA、PhysX、3D Stereo、SLI。这四项在业界内独一无二的视频效果处理、加速技术被NVIDIA誉为GeForce的四大内功,在GPU技术飞速发展的今天,NVIDIA无疑会将GPU应用带领至一个全新的领域,显卡未来将有可能不再单一是一张视频卡。而目前来看,显卡和游戏的关系是最密不可分的,过去显卡技术的发展,无不是围绕如何提高游戏的画面质量、效果以及游戏速度来展开的,而自NVIDIA收购AGEIA以来,提出了以GPU来进行物理加速处理的概念后,未来的游戏世界将可能引起一场革命。

  目前游戏的物理引擎主要分为PhysX和Havok两款,其中Havok物理引擎还是靠CPU来运算的,GPU并没有参与其中,这也是传统的游戏物理引擎运算。得益于Geforce 8/9/200系列支持强大的CUDA通用计算,使Geforce支持PhysX成为了可能,这样无疑能在游戏中有更好的表现效果,也增强了竞争力。收购AGEIA半年后,NVIDIA迎来了第一个成果,支持Geforce PhysX的物理驱动发布。经过几个驱动的修正和完善,目前最新版本的NVIDIA PhysX物理驱动为8.09.04版,配合最新的Geforce显卡驱动,就能在所有支持CUDA的Geforce GPU上实现物理加速。


NVIDIA收购AGEIA

  作为NVIDIA一直以来最高级的合作伙伴,讯景一直以来都走在前端,除了在新品推出的速度上无人能及,如今讯景旗下的全系列GeForce 8、9以及GT200系列显卡,都已经支持了nVIDIA最新的GeForce四大内功,今天,我们就目前市面上最为热门的三款GeForce9系列显卡,对其物理加速效果及效能进行深入的评测。


XFX最新的9系列显卡GeForce 9800GTX+

 

面向未来:CUDA并行计算的应用

  随着显卡的发展,GPU越来越强大,目前中高端统一渲染架构的GeForce GPU拥有64-240个单独的ALU,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核CPU,加上GPU为显示图像做了优化。在众多计算领域上已经超越了通用的CPU。如此强大的芯片如果只是作为显卡就太浪费了,因此NVidia推出CUDA,让显卡可以用于图像计算以外的目的。CUDA(Compute Unified Device Architecture)工具包是一种针对支持CUDA功能的GPU(图形处理器)的C语言开发环境,未来还将发布Fortran语言版本。

  CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out特性。以上几点都将大大提高GPGPU应用的效率。例如,在游戏中我们可以使用CUDA来让GPU承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用CUDA的计算可以在现有的空间里为平台提供更强大的计算性能。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。

  CUDA工具包推出已有1年,它的推出马上受到了众多软件/游戏开发商以及科研机构和程序爱好者的欢迎,NVIDIA方面也将发布最新的CUDA 2.0版本。相信在未来,CUDA将会受到越来越多的领域的支持。目前,支持CUDA环境的GPU主要有采用统一渲染架构的显示核心。

 

更真实游戏效果:GeForce PhysX物理加速

  随着NVIDIA收购AGEIA公司,PhysX物理加速技术的加入到GeForce GPU中,通过强大的CUDA架构,使PhysX物理加速技术快速移植到GeForce GPU中成为了可能。不久前,支持GeForce8/9/200系列的显卡PhysX物理驱动终于发布了,通过物理加速驱动,使GPU能分担CPU的工作,从而提高游戏的执行效率。NVIDIA宣称,PhysX是目前最先进的物理加速引擎。

  PhysX是目前支持平台最多的物理加速引擎,他可以支持目前主流的X86处理器、AGEIA公司的PPU、东芝公司的Cell以及支持CUDA环境的GPU。其中,最令人期待的就是支持CUDA的版本。借助于目前强大的GPU并行运算能力,支持CUDA环境的PhysX物理加速引擎能给用户带来最为真实的性能体验。

  随着物理引擎的加入,以后我们就可以在游戏中体验最为真实自然的服装、毛发、烟雾、爆炸等画面,可以进一步的解放目前不堪重负的CPU。目前已有数款游戏宣布支持NVIDIA Geforce PhysX,相信未来会有更多游戏支持物理效果,还原一个更真实的游戏世界。目前支持GeForce 8/9/200系列的显卡已经发布。


不带物理驱动的测试成绩


安装物理驱动的测试成绩

  从3DMark Vantage的测试中可以看出,安装物理驱动后,CPU成绩暴涨了两倍以上,使得整体的测试成绩也有了一定的提升,这是通过Geforce PhysX分担CPU计算的工作,提高效率的结果。

 

GeForce GPU与CPU规格比较

核心规格
GeForce 9800GTX+
GeForce 9800GT
GeForce 9600GT
GeForce 9500GT

核心代号

G92

G92

G94

G96

工艺制程

55nm
65nm/55nm

65nm/55nm

65nm/55nm

核心晶体管数量

7.54亿
7.54亿
5.05亿
3.14亿

核心时钟频率

738Mhz
600Mhz
600Mhz
550Mhz

核心Shader频率

1834Mhz
1500Mhz
1500Mhz
1375Mhz

显存时钟频率

2200Mhz
1800Mhz
1800Mhz
1600Mhz

显存类型

GDDR3
GDDR3
GDDR3
GDDR3

显存位宽

256bit

256bit

256bit

256bit

显存容量

512MB
512MB

512MB

256MB/512MB

Stream Processor

128

112

64

32

纹理单元

64

56

32

16

ROPs

16

16

16

8

接口总线

PCI-E 2.0
PCI-E 2.0
PCI-E 2.0
PCI-E 2.0

Shader Model标准

4.0

4.0

4.0

4.0

DirectX标准

10

10

10

10

互联技术

3-Way SLI
3-Way SLI

SLI

SLI

视频回放技术

PureVideo HD II/VP2
PureVideo HD II/VP2
PureVideo HD II/VP2
PureVideo HD II/VP2

  现在的GPU已非常强大,主流的统一渲染架构显卡,Geforce 9500GT、Geforce 9600GT、Geforce 9800GTX分别拥有32个、64个与128个单独的ALU单元,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核CPU,加上GPU为显示图像做了优化,在众多计算领域上已经超越了通用的CPU,GeForce PhysX物理加速正视利用GeForce GPU的这是特性。

  根据NVIDIA官方资料显示,主流的9800GTX GPU核心数是四核处理器的32倍,其粒子、流体、软身体以及布料处理能力分别是CPU的20倍、6倍、5倍和5倍。由此看知,GPU无疑更适合做理物理运算。

[此贴子已经被作者于2008-10-26 17:53:20编辑过]

--  作者:伊诺维
--  发布时间:2008/10/24 11:42:00
--  

讯景 9800GTX+(PV-T98W-YDF)


讯景 9800GTX+(PV-T98W-YDF)  图 库  评 测  论 坛  报 价

  

  讯景 9800GTX+(PV-T98W-YDF)用了最新的65nm转换为55nm制程工艺的G92-420核心,拥有128个Streaming Processors,64个纹理单元和16个ROP,256bit内存控制器,支持PCI-E 2.0总线。而NVIDA PureVideo HD技术的引入使其能全硬解H.264。高清视频播放能力上支持BSP技术和VP2引擎。

  讯景 9800GTX+(PV-T98W-YDF)实际上就是Geforce 9800GTX转换制程的高频版,得益于先进的55nm工艺制程,9800GTX+的G92b核心在功耗发热量以及成本上都得到更好的控制,超频能力也更为强劲,因此9800GTX+的默认核心频率就达到了738MHz,比起9800GTX的675MHz要高出不少,在性能上有了一定的提升。而nVIDIA在近段时间上更为GeForce 8/9/200系列推出了提高性能、功能的四大内功:CUDA、PhysX、3D Stereo、SLi,更为本来就已经强大的9800GTX+添上不少色彩。


公版供电设计,提供双6pin接口

新旧G92核心对比

 
左为9800GTX+,右为9800GTX

 
9800GTX+与9800GTX核心大小对比

  由于采用了55nm制作工艺,Geforce 9800GTX+的核心面积与Geforce 9800GTX相比,从289mm缩小到231mm。

讯景 9600GT(T96G-YHF)


讯景 9600GT(T96G-YHF)  图 库  评 测  论 坛  报 价

  讯景 9600GT(T96G-YHF)采用了非公版设计方案,黑色是讯景惯用的PCB颜色,而讯景这款9600GT采用的是G94-300核心打造,拥有64个统一渲染单元、32个纹理单元和16个ROPs。显卡支持了DX10和SM4.0特效,支持第二代PureVideo技术,对H.264提供全硬解,对VC-1则提供了加速解码。

  在供电用料上讯景 9600GT(T96G-YHF)非常不错,大量的固态电容、封闭式电感组成了2+1相供电设计,根据nVIDIA的官方资料显示,公版9600GT的最大功耗为95w,这款超频版的9600GT显卡功耗应该略高于官方公版的水平,但9600GT支持PCI-E2.0的规格,而PCIE-2.0已经可以提供高达135W的功率,因此在PCI-E2.0的平台上,显卡无需外接电源也可以稳定运行,但鉴于目前主流平台还是采用PCI-E16X的规范,因此为了保持显卡的稳定运行,讯景 9600GT(T96G-YHF)也提供了一个6Pin电源接口。我们还可以看见在电感旁,显卡还提供了蜂鸣器,以确保显卡的安全运行。

  讯景 9600GT(T96G-YHF)采用了1.0ns-DDR3显存颗粒,一共八颗组成512M/256bit规格,显存运行频率为1800Mhz,已经达到了1.0ns的理论值,显卡核心运行频率650Mhz,Shader单元频率为1625Mhz。


讯景 9600GT(T96G-YHF)裸卡图赏


纯铜散热器保证了显卡的散热效率


双DVI+TV-OUT输出接口

 

讯景 9500GT(T95G-UDF) 


讯景 9500GT(T95G-UDF)  图 库  评 测  论 坛  报 价

    讯景 9500GT(T95G-UDF) 采用核心代号G96的显示核心,55nm工艺制程,核心内建32个流处理器,硬件完美支持Direct10.0和Shader Model 4.0特效,支持PCI-E 2.0,支持Hybird SLI技术。显存规格为256M/128bit,默认核心/显存频率为550/1600MHz。

[此贴子已经被作者于2008-10-26 18:23:24编辑过]

--  作者:伊诺维
--  发布时间:2008/10/24 11:45:00
--  

评测平台及评测方法简介

评测平台
CPU

Intel Core 2  QX9770(OC 400x9=3.6G、12MB L2 Cache )

主板

华硕 X48

内存

威刚 DDR2-1066 1GB x 2 (5-5-5-15)

硬盘

希捷 7200.10 SATA 500G

显卡

讯景 9800GTX+ (738/1834/2200MHz)
讯景 9600GT(T96G-YHF) (650/1625/1800MHz)
讯景 9500GT(T95G-UDF)  (550/1375/1600MHz)
Radeon HD 4850 (625/1986MHz)
Radeon HD 3850 256M(670/1400MHz)

软件平台
系统软件

   Windows Vista SP1旗舰英文版 + DirectX 10

驱动程序

 AMD显卡:AMD Catalyst 8.8 For Vista
    NVIDIA显卡:ForceWare 177.98 For Vista
 NVIDIA物理驱动:NVIDIA PhysX Driver v8.08.18

评测软件

 

  • System:
  • 3DMark Vantage Ver:101 (DirectX 10)
  • Geforce PhysX Game/Demo:
  • Warmonger Demo
  • Ghost Recon Advanced Warfighter 2
  • Nurien Tech Demo Alpha v0.7
  • Metal Knight Zero v0.6
  • NVIDIA Fluids Tech Demo

  在测试平台上面,我们采用了目前的顶级的四核平台Intel Core 2  QX9770。显卡方面我们选则了主流的低、中、高端的9500GT、9600GT以及9800GTX+,以考察它们在开启/关闭物理加速的性能差距。此外,还加入AMD热门的Radeon HD 3850和4850作为参考对比。NVIDIA驱动方面,采用最新的ForceWare 177.98显卡驱动与8.08 PhysX物理驱动。

 

DX10测试软件:3DMark Vantage测试

  新的3DMark测试工具——3DMark Vantage并没有提供对显卡DirectX 9性能的测试部分,因为FutureMark认为,作为DirectX 9.0C的测试工具,3DMark 2006就已经很好的反映显卡的DirectX 9性能,因此3DMark Vantage是一款完全针对DirectX 10开发的测试软件,用户也需要安装支持DirectX 10的Windows Vista才能运行,看来Windows XP和DirectX 9显卡用户是和这款3D测试工具无缘了。

  3DMark Vantage主要包括了Graphics Test和CPU Test两个测试部分,它们各自带有两个测试场景,其中Graphic Test包括Jane Nash、New Calico,主要针对显卡的3D图形渲染性能。而CPU Test就包括AI和Physics两个部分,分别测试处理器的AI运算和物理加速性能,在现在的游戏发展中,除了图形3D性能以外AI和物理运算都是游戏中极其重要的部分,在新的3DMark中对这四项目都进行了测试,无疑更能反映整个平台的游戏性能。


主要分了四个测试项目

  3DMark Vantage 总得分标准:

  3DMark=1/(显卡权重系数 / 显卡总分+CPU权重系数 / CPU总分)

  3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:

 

Entry

Performance

High

Extreme

显卡权重系数

0.75

0.75

0.85

0.95

CPU权重系数

0.25

0.25

0.15

0.05

  测试结果:


不带物理驱动的测试成绩


安装物理驱动的测试成绩

  安装物理加速后,CPU得分暴涨了两倍之多,这时是GPU协作CPU进行了物理加速运算,使总成绩也有了一定的提高,到9500GT这一级别,由于其处理能力有限,没太多资源协作CPU工作,因此物理加速带来的提升十分有限。而A卡不支持PhysX物理加速,因此成绩没任何变化。

 

物理加速游戏对比评测:Ghost Recon Advanced Warfighter 2


不支持PhysX的话,无法进入AGEIA Island关卡

  Ghost Recon Advanced Warfighter 2,《幽灵行动:尖峰战士2》是一款FPS游戏,其丰富的系统获得不少玩家的好评,二代在原来的基础上增加了更多丰富的内容,例如更加人性化的定制功能,武器选择更加多,更自由的战斗场景,更巧妙的战术运用,以及精彩的多人游戏模式等。

  《幽灵行动:尖峰战士2》是较早支持PhysX的游戏之一,以前只能通过物理加速卡进入AGEIA Island关卡,不支持PhysX的话是无法进入的。


爆炸效果


爆炸效果


大树被风吹到倾斜,树木被打断效果

评测方法:

  进入AGEIA Island后,用FRAPS测试,场景是从直升机上降落,直到提示游戏开始。

  在《幽灵行动2尖峰战士》的测试中,由于AGEIA Island这一关卡需要PhysX支持才能进入,因此A卡不能进行测试,故成绩为0。在1680x1050分辨率下,9600GT与9800GTX+均获得比较满意的成绩,而9500GT的表现则十分差,其本身的处理能力不强,加上256M显存的不足,开启物理加速后已经成为了负担。

 

物理加速游戏对比评测:Warmonger Demo


好战者行动

  Warmonger: Operation Downtown Destruction,中文名字为《好战者行动:毁灭城市》,是一款多人在线FPS游戏。故事发生在2029年的未来世界,一场末日浩劫之后,两大军事集团为了争夺对中东石油的控制权,挑起第三次世界战争玩家必须在限定时间内占领和控制城市中的街区。

  《好战者行动》的游戏主要卖点在于采用了PhysX物理技术,游戏环境以及地图中的元素都可以被破坏。关卡中城市的各种建筑都可以随意摧毁,让人无处可藏,必须奋勇杀敌。你也可以在爬上建筑物之后毁坏掉所有楼梯,以阻止敌人的有效攻击,或者把摧毁建筑物当作另一种杀伤性武器,将敌人毙命于坍塌建筑物之下。此外,《好战者行动》还具有独特的渐变式毁坏系统,即物体并非只有完好和毁坏两种状态,另有个逐渐损坏的状态,真实反映物理世界。


破坏木板


破坏石墙


纸碎、布碎纷飞

评测方法:

  进入游戏后,用FRAPS测试,场景是开始跑到第一把枪面前。

  在此游戏的测试中,不开启PhysX物理加速功能,NVIDIA的显卡表现一般,其中9800GTX+比HD 4850还要差一点。而开启物理后,9800GTX+成绩暴增20FPS,9600GT和9500GT也有一定的提升。

 

物理加速游戏对比评测:Nurien Tech Demo Alpha v0.7


Mstar美女MM形象代言

  这个游戏的名称是Mstar,是由韩国新公司Nurien Software使用Epic公司的虚幻3引擎开发的一款舞蹈网络游戏。 Mstar将打击与舞蹈完美结合,人物的肢体语言极为丰富,由于支持PhysX,虚拟形象的局部特写制作得淋漓尽致,尤其是头发与裙子部分。玩家将得到更真实的体验。据有关消息报道,该游戏将于年底在国内推出。


MM出场


MM转身,秀发飘逸、花裙飞舞


MM摆动长裙

评测方法:

  采用自带的BenchMark进行测试。

  在这个游戏中,支持PhysX的9600GT、9800GTX表现出非常出色,在打开PhsyX物理加速后,性能提升达到100%,相当惊人。

 

[此贴子已经被作者于2008-10-27 9:06:48编辑过]

--  作者:伊诺维
--  发布时间:2008/10/24 11:46:00
--  

物理加速游戏对比评测:Metal Knight Zero v0.6

  MKZ,《铁甲突击》是由是一款地道的国产FPS游戏,由目标软件公司开发,使用了“OverMax SDK 2007”游戏引擎,加入包括GLOW、HDR、动态光照、高分辨率法线贴图等高端技术。是一款以近现代世界观为基础,现代高科技战争题材为切入点,配合写实的美术风格、真实的物理系统、专业化的武器装备、特色的载具系统以及独特的领土争夺系统和大量的网络化元素组成的第一人称在线射击游戏。

  《铁甲突击》采用了PhysX物理引擎技术,使游戏具备更强的游戏性和趣味性。在游戏场景中会出现大量的可破坏物体,玩家可以利用其物理特性对敌方造成伤害。比如,当对手从你隐藏的房顶下经过、小心翼翼的提防枪弹的袭击时,你完全可以给他一个从天而降的“惊喜”——一件自由落体的沉重木箱,而这个意外的惊喜很可能会对他造成致命的打击;而且,在战斗中物体爆炸所产生的碎片也有可能对周边的玩家造成严重的伤害。


旗帜被局部打烂,重力作用使其下坠


爆炸效果,碎片满天飞


爆炸效果

评测方法:

  采用自带的BenchMark进行测试。

  在此游戏的测试中,不打开物理加速,5款显卡性能表现相差不远,当开启物理加速后,9600GT与9800GTX+性能暴涨,但9500GT性能反而下降了,这与256M显存不足有关,可以看出,如果显存不足的情况下,开启物理加速就是一个负担。

 

物理加速软件对比评测:NVIDIA Fluids Tech Demo


Fluids 场景 1


Fluids 场景 2

  NVIDIA Fluids是NVIDIA推出的一个GPU物理加速的DEMO,共有两个场景,只允许Geforce 8/9/200系列GPU运行,可测试开启/关闭Geforce PhysX物理加速的区别。

  开启Geforce PhysX后,9600GT以上级别的显卡运行状况良好,比较流畅,而9500GT只能勉强运行起来。关闭Geforce PhysX后,只有CPU在做运算,即使是目前最强的QX9770,速度也是非常缓慢,完全是“幻灯片模式”。

 

PConline评测室总结

  作为NVIDIA一直以来最高级别的合作伙伴,讯景近来在对NVIDIA GeForce四大内功进行了广泛的宣传,新科技慢慢改变我们的生活,Badaboom、Adobe CS4....越来越多的软件支持CUDA运算,而GeForce PhysX目前还处在起步阶段,但已经有多款尚未发布的游戏已经宣称将支持NVIDIA的物理加速技术,游戏世界的视觉革命已经开始了,我们期待PhysX带来更多的惊喜。下面我们对本次评测进行总结。


XFX联同NVDIA力推GeForce四大内功

  从目前几个支持PhysX物理加速的游戏评测结果可看出,开启与关闭GeForce PhysX物理加速,评测结果相差甚远,高端的显卡更为明显。在《MStar》与《铁甲突击》这两款游戏中,开启GeForce PhysX后,9800GTX+的测试成绩超过100%,9600GT也有60-90%的性能提升,9500GT的性能提升甚微,在《铁甲突击》的测试中开启物理加速甚至成为了其负担,这与其处理能力有关,更可得出一个结论,256M显存不足以同时应付高特效与物理加速。对于即将发布支持PhsyX的游戏,我们认为,9600GT 512M以上级别的显卡物理加速才会有意义。

  基于现在PCI-E总线的优势,使多卡进行图像渲染或物理加速成为了可能,使任何一款支持CUDA(目前有Geforce 8/9/200系列)的GeForce显卡都可以用于辅助物理加速。由于目前支持PhsyX物理加速的正式版游戏还没有,因此我们只进行了简单的单卡测试,更详细的混合测试,如9800GTX+搭配9500GT、甚至A卡的HD 4850搭配9600GT等测试,我们将在正式版游戏发售后进行,请大家密切留意。

游戏物理加速未来发展:

  关于PhysX物理加速的争议一直存在,但抛开其他因素来看,NVIDIA这样的做法是具有积极意义的,无论NVIDIA PhysX将来是否能成为主流的物理加速接口,它也正带动着这一行业发展,就如VOODOO一样,PhysX也会在历史留下烙印。从历史的潮流发展来看,物理加速也会成为未来NVIDIA和AMD显卡的一个基本技术。但就现在来说,NVIDIA已经有了自己的物理加速技术,而AMD并不打算采纳NVIDIA的PhysX,AMD还是依靠Intel的Havok来进行物理加速,AMD目前还未拥有自己的物理加速技术,在Intel推出旗下的独立显卡后,AMD在物理引擎的前景无疑是雪上加霜....究竟将来谁会成为物理加速的主流接口呢?是NVIDIA PhysX,还是Havok?我们还不得而知,但我们可以肯定的,激烈的竞争将会为我们带来更加先进的技术,更加真实的游戏世界正在不远处等待着我们。

 

[此贴子已经被作者于2008-10-27 9:12:43编辑过]

--  作者:伊诺维
--  发布时间:2008/10/24 16:27:00
--  
up
--  作者:伊诺维
--  发布时间:2008/10/24 16:27:00
--  
up
--  作者:伊诺维
--  发布时间:2008/10/24 16:27:00
--  
up
--  作者:伊诺维
--  发布时间:2008/11/7 14:49:00
--