Radeon X800 vs. GeForce 6800

0

NH tar en grundlig titt på prestandan i ATis nya Radeon X800. Vi har testat både Pro och XT-varianterna och jämfört prestandan med GeForce 6800 Ultra. En giganternas kamp inom grafikkortsmarknaden.

Det har gått cirka tre veckor sedan nVidia lanserade sitt GeForce 6800 Ultra. En av de tre veckorna spenderade vi, tillsammans med kollegor från hela världen, i Toronto med ATi. Det ATi hade att visa upp för oss var givetvis grafikkortet som upp till nu gått under kodnamnet R420. Den 14:e April skrev vi att nVidia satte stopp för ATis trend som härskare på tronen men idag är det alltså dags för ATi att försöka återta tronen. På de kommande sidorna kommer vi att visa om de lyckats eller inte.


Det nya kortet som nu ska kämpa mot GeForce 6800 Ultra går under namnet Radeon X800 XT, ATi var goda nog att också förse oss med ett Radeon X800 Pro.



Precis som NV40 bjuder R420 på 16 stycken renderingspipelines, GDDR3-minnen med höga klockfrekvenser och finesser utöver vad föregångaren kunde erbjuda. På sätt och vis gömmer det sig mindre under ATis skal än nVidias då R420, till skillnad från NV40, till väldigt stor del bygger på “gammal” teknik.


I vårt test av GeForce 6800 Ultra var vi något begränsade vad det gällde tester. Tid, felande referenskort och andra faktorer gjorde att vi inte hade tid att köra alla tester men framförallt alla olika inställningar vi tänkt oss. Det här testet, vilket blir en regelrätt shootout mellan NV40 och R420, har betydligt mer detaljerade tester. Innan vi börjar att mäta prestandan tar vi dock en liten titt på teorin bakom.




Radeon X800-serien består av två hittills officiellt lanserade kort: Radeon X800 Pro och X800 XT Platinum Edition. Hädanefter kommer vi referera till det sistnämnda kortet som Radeon X800 XT för enkelheten skull. Båda korten är utrustade med 256 MB minne och det är troligt att Pro-versionen kommer att finnas tillgänglig med enbart 128 MB. Vidare har vi säkra källor som indikerar att XT-versionen förr, snarare än senare, kommer att lanseras med 512 MB.
Det som skiljer ut Pro-versionen är att den enbart har 12 pipelines och att klockfrekvenserna är lite lägre; 475/900 MHz istället för XT’s 550/1100 MHz. Vidare går det många rykten om att ett X800 SE kommer lanseras med 8 pipelines och förmodligen något lägre klockfrekvenser än Pro-versionen. Fler variationer är säkerligen att vänta men idag är det alltså ett Radeon X800 Pro och Radeon X800 XT som vi ska utvärdera.




































































































































Kort/Krets:

GeForce FX 5950 Ultra / NV38

GeForce 6800 Ultra / NV40

Radeon 9800 XT / R360

Radeon X800 Pro / R420

Radeon X800 XT / R420

Tillverkningsteknik:

0.13-micron

0.13-micron

0.15-micron

0.13-micron low-k

0.13-micron low-k

Transistorer:

~130 mil.

~222 mil.

~115 mil.

~160 mil.

~160 mil.

GPU-hastighet:

475

400

412

475

525

Pixel Pipelines/Pixel Fillrate:

4 (8) / 1900 MP/s

16 (32) / 6400 MP/s

8 / 3296 MP/s

12(24?) / 5700 MP/s

16(32?) / 8400 MP/s

TMU’s/Texel Fillrate:

2 / 3800 MT/s

1 / 6400 MT/s

1 / 3296 MT/s

1 / 5700 MT/s

1 / 8400 MT/s

Minneshastighet:

950 MHz

1100 MHz

730 MHz

900 MHz

1150 MHz

Typ av minne/Bandbredd:

256-bit DDR / 30,4 GB/s

256-bit GDDR3 / 35,2 GB/s

256-bit DDR / 23,4 GB/s

256-bit GDDR3 / 28,8 GB/s

256-bit GDDR3 / 36,8 GB/s


Pixel Shader:

2.0a

3.0

2.0

2.0b

2.0b


Vertex Shader:

2.0a

3.0

2.0

2.0

2.0


FSAA:

2x RGMS, 4x OGMS + MS/SS komb.


4x RGMS + MS/SS komb.

6x RGMS + GK*


6x RGMS + GK* + Temporal AA

6x RGMS + GK* + Temporal AA

Centroid Sampling:

Nej

Ja

Ja

Ja

Ja

Aniso:

8x

16x

16x

16x

16x

Standardutgångar:

1x VGA, 1x DVI och 1x “S-Video” (HDTV)

2x DVI och 1x “S-Video” (HDTV)

1x VGA, 1x DVI och 1x “S-Video” (HDTV)

1x VGA, 1x DVI och 1x “S-Video” (HDTV)

1x VGA, 1x DVI och 1x “S-Video” (HDTV)

Rekommenderat nätagg:

350w

480w

300w

300w

300w

Antal kortplatser:

2x

2x

1x

1x

1x

* GK = Gammakorrigering

Om vi ska kröna en specifikationskung baserad på våra lista här ovan blir det såklart Radeon X800 XT om vi ser till antalet “vinster” i litsan, det vill säga de specifikationer vi markerat med fetstil. Vad det gäller klockfrekvenser har X800 ett stort övertag. Om vi å andra sidan tittar på features är det GeForce 6800 Ultra som imponerar med sitt stöd för Shader Model 3.0.

OBS: Under tiden vi skrev denna recension fick vi meddelande från nVidia att de har en ny version av GeForce 6800 Ultra vid namn GeForce 6800 Ultra Extreme och att de även har nya drivrutiner i form av Forceware 61.11. Extreme-versionen av 6800U har 50 MHz snabbare core vilket bör förbättra prestandan en hel del. Även den nya drivrutinen ska förbättra prestandan rejält i vissa specifika tester, bland annat Far Cry.
Vi bad om ett kort men tyvärr har kortet fastnat på flygplatsen och vi kommer inte att få det i tid. Dock ska vi jobba på en uppdaterad version av recensionen så snart vi har möjlighet.
I dagens recension bör man alltså ha visst överseende med nVidias resultat då den färdiga produkten lär prestera cirka 10 % bättre.

ATis 525 MHz gör att de sprutar ut cirka 35 % fler pixlar i sekunden än vad nVidia kan göra. Knappast något att fnysa åt med andra ord. Med en pixel- och texel-fillrate som ligger på 0.84 Terrapixels per sekund får det här monstret tom. NV40 att se lite småtaskigt ut. Med en fillrate på denna nivå kan kortet rita upp inte mindre än 2100 bilder tagna med en 4 MegaPixel-kamera… i sekunden. För att nå dessa hastigheter har ATi valt att använda TSMCs 0.13 microns low-k som tillverkningsprocess. Det faktum att coren har 62 miljoner färre transistorer än NV40 bidrar givetvis också till varför de kan ha så mycket högre klockfrekvenser. 62 miljoner transistorer är ungefär lika mycket som ett modernt mid end-grafikkort, sett ur den synvinkeln är det inte svårt att se att det skiljer korten en hel del åt vad det gäller yields.
Något som vi inte riktigt har få tydlig information om är R420’s förmåga att bearbeta 32 Z-värden. Till synes är alltså R420 en 16×1/32×0 arkitektur precis som NV40. Så fort vi har mer kött på benen ska vi förklara mer.

Som väntat är kortet utrustat med GDDR3. Det som är något mindre väntat är att ATi för första gången på väldigt länge har snabbare minen än nVidia, nämnligen 1150 Mhz. Jämför vi med 9800 XT har vi alltså ökat kortets pixel fillrate med över 160 % medan bandbredden bara har ökat med cirka 50 %. Resultatet, om vi sätter det i jämförelse med de grafikkort vi hittills känt till, blir precis som NV40 något “obalanserat”. GDDR3 har dock en del andra förbättringar i sig, inte minst vad det rör strömförbrukning.

Det som kommer som en trevlig överraskning är att kortet, trots sina höga klockfrekvenser och transistorantal, inte har några speciellt höga krav på strömförsörjning. Några 480w är det alltså inte tal om här då kortet enligt ATis utsago drar enbart runt 60 % av vad ett NV40 gör. Mindre ström innebär förstås mindre värme vilket innebär mindre krav på stora kylningar vilket vi kommer att gåin på på nästa sida.

Vad det gäller Shaders har inte X800-serien så mycket att komma med jämfört med NV40. ATi har visserligen utökat antalet instruktioner något enormt (från 160 till 1536) men det är knappast något att spendera många rader text på. Fler instruktioner betyder längre shaderprogram vilket i sin tur betyder mer avancerade effekter. Men några helt nya features så som på NV40 är det alltså inte tal om här. Den enda saken som sticker ut är stödet för double sided lightning. (Dvs. detektion av vilken sida av en polygon som betraktaren har vänd mot sig, vilket kan användas för att välja vilken typ av ljussättning man använder.)
Inte direkt något man faller ur stolen och börjar tugga fradga av upphetsning på grund av med andra ord. Väl en nämnvärd förbättring men blekt i jämförelse med vad nVidia hade att erbjuda. Som vanligt handlar det dock om vad spelen har stöd för. Vi är inte kapabla att se in i framtiden men av vad vi hört hittills låter det faktiskt som om nVidia lyckats locka in en del utvecklare på Shader Model 3.0-spåret. Frågan är väl om de främst kommer att använda SM3.0 för att nå högre prestanda eller om de är ute efter helt nya features så som texture lookups i Vertex Shadern.
För tillfället är det inget vi kan utvärdera då Shader Model 3.0 inte ens är exponerat på NV40 ännu, vi återkommer i framtiden rörande detta ämne.

Eftersom vi inte har så mycket teknisk information att gå igenom idag, på grund av att R420 är ett R360 på crack för er som inte fattat galoppen, kommer vi inte ta någon lång genomgång av features som introducerades redan med Radeon 9700 Pro. Vi hoppar direkt på kortets utseende och fysiska aspekter istället.


Ni som läste recensionen av NV40 minns att det var ett ganska stort kort som tog upp två kortplatser, var ganska långt och krävde två molexkontakter. ATis senaste skapelse är ganska nätt i jämförelse.








Framsidan



Baksidan


Kortet påminner starkt om Radeon 9800 XT både vad det gäller PCB och kylning. Faktum är dock att kylningen är mindre och därmed gör kortet lättare. Tack vare GDDR3 har man också sluppit kopparplattan på baksidan då minnet utvecklar mindre värme.








Kopparfläns



In- och utgångar

Kylningen är ganska simpel: en stor fläkt pressar ut luften genom den tunnbladiga kopparflänsen. Fläkten har två lägen: snabbt eller långsamt. Tacksamt nog håller den sig i det långsamma läget i princip hela tiden. Det långsamma läget är tystare än tom. gamla goa Radeon 9700 Pro, några problem med ljudnivån är det inte på långa vägar tal om. Vad det gäller värmeutvecklingen så är kortet betydligt svalare än det skållheta Radeon 9800 XT.

Till höger ser vi in- och utgångarna och som ni ser har ATi valt att fortsätta med en VGA och en DVI medan nVidia som bekant körde med två DVI på sitt NV40. Personligen föredrar vi nVidias lösning här.

Och nu undrar alla varför vi bara har bilder på ett kort när vi nu recenserar två kort idag. Faktum är att de två korten är omöjliga att skilja åt genom att bara titta på. De är fysiskt identiska så när som på minneskapslarna. X800 XT är utrustat med 1.6ns minne och Pro-versionen har 2ns minne.

I övrigt är korten identiska förutom vad det gäller klockfrekvenser och antal pipelines. X800 XT har dock ett ess i rockärmen och det är Video In. ATi skickade dock inte med några kablar så det är inget vi kunnat testa.

Innan vi går vidare med några tester är det dags att gräva lite bland de teoretiska specifikationerna igen. Vi börjar med 3Dc.


En av de största nämnvärda nyheterna i R420-serien är “3Dc”. Det här är ett nytt komprimeringsformat skapat av ATi själva. Det följer fourcc-standarden och fungerar under nuvarande DirectX-versioner direkt. Det är teknik som ATi dessutom ger bort gratis till vem som helst som vill implementera funktionen i sitt grafikkort.

Vad gör då 3Dc, jo det komprimerar texturer. Dock inte den typen av texturer som vi brukar tala om utan här rör det sig om så kallade Normal Maps. En normal map är en textur som innehåller information om hur ljus och skuggsättningen ska ske av en textur. Med hjälp av denna teknik kan man alltså simulera mer detaljer utan att behöva höja polygonantalen. Tekniken har visat sig väldigt populär och antalet spel som använder tekniken växer snabbt. För att lättare förklara rippar vi helt enkelt en av bilderna från ATis presentationer:

Det stora problemet med normal maps är att de äter stora mängder minne vilket i sin tur betyder stora mängder bandbredd. Med 3Dc kan man nu komprimera detta texturformat ner till en fjärdedel av sin originalstorlek.

Det tål att noteras att det inte är frågan om automatisk komprimering, spelen måste alltså ha stöd för tekniken. Kommande stortitlar som tex. Half Life 2 kommer att använda sig av 3Dc hur pass vanligt det blir återstår dock att se.

Nästa nyhet är inget som är unikt för Radeon X800-serien men vi tar ändå en genomgång av “Temporal AA”.


På FSAA-fronten har vi främst en stor nyhet: Temporal Anti Aliasing. Med denna metod kan man alternera sample patterns var annan/var tredje frame. Så länge frameraten är hög kommer det alltså ge en illusion av att man tar dubbelt så många samples (jämför med synvillan där man låter en vit pinwheel snurra snabbt över en svart bakgrund och det ser ut som om man ser en solid grå färg).

Tekniken är simpel, det som slår mig är att ingen hittills implementerat det i ett grafikkort. Rent teoretiskt borde vilket kort som helst med stöd för programmerbara samplepatterns kunna göra det här. Det trevliga med det hela är att det inte innebär någon prestandaförlust att alternera sample patterns på detta vis. Kort sagt kan vi “dubbla” FSAA-nivån från tex. 4x till en “8x synvilla” utan att det kostar någon extra prestanda. Det som är viktigt att notera här är att 1: tekniken är inte exponerad officiellt i de drivrutiners kontrollpanel vi fått till kortet och 2: tekniken fungerar precis lika bra på alla andra kort i Radeon 9×00-serien (9000, 9100 och 9200 undantagna).

För att ge er en bild av hur det fungerar kan ni ta en titt nedan. På första bilden har vi Frame 1 med ett 2x sample pattern i Frame 2 har vi också ett 2x sample pattern fast här omvänt och något förskjutet (att bara “invertera” sample pattern hade inte gett optimalt resultat), En frame är alltså en bildruta som du ser på skärmen. Eftersom grafikkortet alternerar mellan samplepatterns mellan varje frame uppstår en effekt där båda ser ut att synas samtidigt. Förutsättningen för att det ska fungera är att man har en hög framerate. Om programmet vi testat bara hade gått i 2 fps hade det blivit mycket tydligt att kortet alternerade och då hade effekten framstått som ett störande moment snarare än något som höjde bildkvalitén.

Nedan kan ni se en grov skiss öve rhur det fungerar (var goda att notera att det här inte är de sample patterns som används utan bara exempel vi själva skapat).















Frame 1









Frame 2















Uppfattad bild

För att illusionen ska bli godtycklig krävs det som sagt en hög framerate. Det är svårt att ge några siffror här men ATi har satt ett minimum på 60 fps kommer fps:en under det så stängs Temporal AA automatiskt av. Vi bör också nämna att Temporal AA kräver Vsync för att fungera.

Hur fungerar då temporal AA i praktiken? Inte helt felfritt måste vi tråkigt nog säga. För det första fungerar effekten bäst när man är helt stillastående, så fort man rör på sig blir de positiva effekterna i princip försumbara. I de spel där fps:en “hoppar” upp och ner är Temporal AA snarast försämrande än förbättrande då det ofta syns väldigt tydligt flimmer längs kanter, precis det man vill motverka med FSAA till att börja med med andra ord. Vidare kunde vi inte få Temporal AA att fungera i Open GL alls.
I de spel där det försigår mycket stillastående alternativt långsamma rörelser och där fps:en är konstant hög är det här ett trevligt alternativ men det är långt ifrån den “killer feature” vi först tänkte oss när vi hörde talas om tekniken. Ett extra kvalitetshöjande alternativ skadar dock aldrig och givetvis är det helt valfritt om man vill aktivera funktionen eller ej.

Sample patterns har i grunden inte ändrats sedan Radeon 9800 så därför ber vi er titta här för jämförande bilder.

Vad det gäller anisotropisk filtrering har vi inte sett några förändringar. För er som är intresserade av en jämförelse kan vi hänvisa till vår recension av NV40 här.


Testsystemet är oförändrat sedan sist.


Testsystem
Hårdvara
Processor:
AMD Athlon XP 3200+ (400) Mhz
Moderkort:
ABIT AN7 uGuru
(nForce2 400 Ultra)
RAM:
768 MB DDR400 @ 2-5-2-2 Timings:
3x 256 MB Corsair TWINX512-3200LL DDR-SDRAM
Grafikkort:

Recenserade kort:
Radeon X800 Pro (256 MB, 475/900)
Radeon X800 XT (256 MB, 525/1150)

Referenskort:
GeForce FX 5950 Ultra (256 MB, 475/950)
Radeon 9800 XT (412 MB, 412/730)
GeForce 6800 Ultra (256 MB, 400/1100)

HDD:
RAID0: 2x 37 GB Western Digital Raptor 10 000 RPM (SATA, 8 MB cache)
Ljudkort:
Creative
Soundblaster Audigy 2 ZS Platinum Pro
PSU:
Tagan TG480-U01 480w
Ethernet:

3Com 10/100

Mjukvara
Operativsystem:
Windows XP Professional (Service Pack 1 + uppdateringar)
Videodrivrutiner:
nVidia: Forceware 60.72, 60.86 och 65.04
ATi: Catalyst 4.4 och 4.5 Beta
Andra drivrutiner:
nVidia ForceWare UDA Chipset Drivers v3.13
Benchmarkprogram:

Unreal Tournament 2003 (v2225)
Quake 3: Arena (v1.32)
Tomb Raider: Angel of Darkness (v.49)
Star Wars Jedi Knight: Jedi Academy (v1.1)

Battlefield 1942: Secret Weapons of World War II (demo “1.0”)
Comanche 4 (demo “v1.0”)
WarCraft 3: Reign of Chaos (demo “1.0”)
Counter-Strike (v1.6)
Mafia: City of Lost Heaven (v1.1)
Halo (v1.4)
Max Payne 2: The Fall of Max Payne (v1.01)
Unreal Tournament 2004 (“v1.0”)
SPECViewperf (v7.1)
FillrateTester (v1.0)
Shadermark (v2.1 beta)

Call Of Duty (v1.4)
Far Cry (v1.1)

3DMark03 (v.340)*
D3D AF-Tester (v1.3a)

D3D FSAA Viewer (v5.1)

FSAA Tester (v2.3)

Vi har gjort fler tester nu än vad vi vanligtvis presenterar. Dock har vi valt att koncentrera oss på prestanda. Om tiden tillåter ska vi göra en uppföljningsartikel där vi utesluter prestandatester och istället helt koncentrerar oss på features och bildkvalitet. Det är inget löfte men vi ska göra vårt bästa för att hinna med det.

Eftersom recensionen skrivits under tidspres har resultat från vissa kort uteslutits från vissa tester. Och som vi nämnde i vår NV40-preview har vårt 5950 Ultra gått sönder så vi har väldigt få resultat med det. Ska vi då ta en titt på lite spelprestanda?

Som vi nämnde på sida två saknar vi också den nya versionen av NV40: GeForce 6800 Ultra. Inom en dag eller två uppdaterar vi med resultat från det kortet.


Vi börjar lätt med en gammal klassiker: Quake 3.

























Quake 3: Arena

Open GL-spelet Quake 3 testar vi för att utvärdera prestandan i något äldre titlar. En stor mängd titlar bygger på "Q3"-motorn. Vi använder oss av testdemot four.dm_67 i testverktyget Q3Bench.

Spelmotor:

Open GL (DX7-klass)

Pixel Shaders:

Nej

Vertex Shaders:

Nej































Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

Utan AA/AF:
2048×1536

256.1

111.3

153.4

210.0


2xAA/4xAF:
2048×1536

217.5

59.7

98.5

149.5


4xAA/8xAF:
1280×1024
1600×1200
2048×1536

321.3
261.5
102.8

202.5
129.9
35

213.1
161.7
89.1

265.4
212.2
145.1

GeForce 6800 Ultra visar sig fortfarande vara kung i Quake 3. Med ett ganska imponerade övertag lyckas NV40 prestera bättre än X800 XT i alla tester utom 2048×1536 med 4xAA/8xAF. Å andra sidan betvivlar vi att någon skulle spela spelet med dem inställningarna så här är det alltså 6800 Ultra som gäller för hela slanten.


UT2004 visade sig vara ett mycket bättre spel än 2003-versionen. Här har vi valt att testa alla olika nivåer av kantutjämning och anisotropisk filtrering för att ge er en bild av hur de påverkar kortet i ett test som är krävande både på bandbredd och fillrate.


Vi har kört alla tester i tre upplösningar men som ni kommer att märka nedan har många tester i 1280×1024, alla utom två för att vara exakt, uteblivit då vi stötte på problem med denna upplösning i UT2004. Efter lite undersökningar upptäckte vi att problemet låg i att AA/AF inte blev aktiverat i spelen om vi körde spelet i samma upplösning som vi hade i Windows (dvs. 1280×1024). Efter att vi upptäckt detta var vi dock ganska stressade med att få recensionen färdig och prioriterade det lågt. Kanske kommer vi att fylla i de saknade resultaten senare.

























Unreal Tournament 2004

UT2004är ett DirectX 8-spel som pressar grafikkorten hårt med stora texturer och höga polygonantal mm. Ett flertal spel bygger på Unreal-motorn. Vi använder oss av det mer grafikkrävande flyby-testet. Vi testar spelet på banan Torlan.

Spelmotor:

Direct3D (DX8.1)

Pixel Shaders:

Ja (1.1 och 1.4)

Vertex Shaders:

Ja (1.1)
































































































Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

Utan AA/AF:
1024×768
1280×1024
1600×1200

174.5
170.8
166.1

188.2
145.4
105.3

202.2
190.9
160.5

203.8
203.5
185.9

Tester med

kantutjämning (AA)

2x AA:
1024×768
1280×1024
1600×1200

172.5
169.2
164.4

178
125.2
89.8

191.7
174.6
129.1

200.7
197.8
168.8

4x AA:
1024×768
1280×1024
1600×1200

172.5
167.5
149.6

164.7

77.9

190.2
167.6
118.5

198

137.5

8x/6x AA:
1024×768
1280×1024
1600×1200

78
49.5
30.4

133.7

61.7

181.7
130.1
92.3

197.4

129.1

Tester med

Anisotropisk Filtrering (AF)

2x AF:
1024×768
1280×1024
1600×1200

174.4
169.8
157.9

166.4

87

202.1
182.8
151.7

199.5

182.3

4x AF:
1024×768
1280×1024
1600×1200

171.2
167
136.6

150.6

76.5

198.8
177.7
143.3

198.9

179.5

8x AF:
1024×768
1280×1024
1600×1200

170.3
162.6
126.6

140.8

73

198.6
175.5
140.1

198.8

178.2


16x AF:
1024×768
1280×1024
1600×1200

169.9
160
124.4

139.5

72.3

198.9
175.6
139.7

197.9

177.2

Tester med kantutjämning (AA) och Anisotropisk Filtrering (AF)

2xAA/4xAF:
1024×768
1280×1024
1600×1200

169.4
162.8
128.3

137

68

188.5
158.7
118.2

199.2
184.3
158.2


4xAA/8xAF:
1024×768
1280×1024
1600×1200

164
140.7
103.9

116.6

58.8

185.7
145.7
109

195
167.6
127

8/6xAA/16xAF:
1024×768
1280×1024
1600×1200

53.9
35.6
23.1


101.1

50.2

169.2
118.4
86.9

192.4
160.4
119.9

Radeon X800 regerar skoningslöst i Unreal Tournament 2004, det är ingen tvekan om den saken. I endast en inställning lyckas nVidias NV40 pressa sig förbi XT. Det som kanske imponerar mest här är X800 XT’s prestanda då anisotropisk filtrering är aktiverat.

Som ni ser råkar NV40 väldigt illa ut så fort 8x FSAA är aktiverat. Anledningen till det är att denna FSAA-lösning använder Super Sampling som, till skillnad från Multi Sampling, bearbetar hela bilden vilket resulterar i ökad texturkvalitet.


Vi fortsätter med Open GL-spel numero dos: Call Of Duty. Quake 3-motorn är en av de få spelmotorer som är smart nog att låta en välja upplösningar över 1600×1200 så här testar vi 2048×1536 för hela slanten.

























Call Of Duty

Call Of Duty är ett av de mest krävande spelen som bygger på den gamla Quake 3/Return To Castle Wolfenstein-motorn. Med stöd för Vertex och Pixel Shaders, med ett stort antal karaktärer på skärmen samtidigt, högupplösta texturer osv. Vi testar ett eget demo inspelat på banan dawnville.

Spelmotor:

Open GL (DX8.0-klass)

Pixel Shaders:

Ja (1.1-klass)

Vertex Shaders:

Ja (1.1-klass)































Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

Utan AA/AF:
1024×768
1280×1024
1600×1200
2048×1536


139.1
139.4
134.2
121.3

117.0
108.2
92.9
57.9

117.5
114.7
106.2
82.7

118.5
116.6
111.5
95.2


2xAA/4xAF:
1024×768
1280×1024
1600×1200
2048×1536


137.8
132.2
121.9
96.9

103.5
83.4
62.9
33.1

112.5
99.3
84.1
55.2

114.2
104.8
93.9
73


4xAA/8xAF:
1024×768
1280×1024
1600×1200
2048×1536


136.1
125.2
109.2
64.6

92.0
71.4
55.3
20.9

105
88.7
75
53.6

108
97.9
86.8
71.6

Radeon X800 får storstryk av GeForce 6800 Ultra. nVidia kort imponerar och har övertaget med ganska god marginal i alla inställningar utom en. Som vi ser är skillnaden mellan X800 XT och X800 Pro ganska liten i våra tester i Call Of Duty. Kanske vågar vi gissa på ineffektiva Open GL-drivrutiner eller så är helt enkelt CPU-begränsningen för hård.
Det som imponerar när vi jämför med Radeon 9800 XT är givetvis de enorma prestandaförbättringarna i 2048×1536.

Att döma av Quake 3 och dessa benchmarks så har nog nVidia fortfarande övertaget vad det gäller Open GL-prestanda.

En annan intressant sak som vi kan notera här och som vi uppmärksammat förr är att nVidia, i Open GL, alltid får vesäntligt hhögre fps i CPU-begränsade lägen något som definitivt verkar peka på bättre drivrutiner (dvs. CPUn spenderar mindre cykler i grafikkortsdrivrutinen när vi kör nVidia).


Nästa speltest är Far Cry, spelet som får väntan på Doom 3 och Half Life 2 att kännas uthärdlig.

























Far Cry

Far Cry använder högupplösta texturer, höga polygonantal, avancerade shader-effekter, och allt annat man kan tänka sig, för att presentera vad vi anser vara den vackraste grafiken hittills i ett datorspel. Vi testar ett eget demo inspelat på banan Pier.

Spelmotor:

Direct3D (DX9.0)

Pixel Shaders:

Ja (1.1 och 2.0)

Vertex Shaders:

Ja (1.1 och 2.0)































Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

Utan AA/AF:
1024×768
1280×1024
1600×1200

55.9
53.6
46.1

54.7
45.1
32.3

51.8
50.1
48

54.4
52.8
51.2


2xAA/4xAF:
1024×768
1280×1024
1600×1200

50
40.7
30.3

39.6
27.1
19.5

51.6
47
34.6

54
52.6
48.3


4xAA/8xAF:
1024×768
1280×1024
1600×1200

44.3
32.6
12

33
22.6
16.2

48.9
39.8
29.1

54.7
51.7
39.5

NV40 inleder genom att ha högst fps i både 1024×768 och 1280×1024, efter det tillfaller resten av vinsterna X800 XT. Desto högre upplösning och ju mer AA/AF desto större blir X800 övertag över GeForce 6800. I 1600×1200 med 4xAA/8xAF är X800 XT inte mindre än 3.29 gånger snabbare än GeForce 6800 Ultra. Faktum är att tom. Radeon 9800 XT lyckas klå NV40 i denna inställning, drivrutinsbugg från nVidias sida måhända?

Det som tål att nämnas här är att NV40 under de nuvarande förhållandena använder samma path som NV3x i Far Cry. Detta resulterar i att NV40 använder mer Pixel Shader 1.1 än vad R420 gör i vårt test. Kort sagt har NV40 sämre bildkvalité och sämre prestanda just nu. Dock väntar vi på nästa patch där detta ska vara ordnat. Möjligtvis är också det extrem låga resultatet i 1600×1200 med 4xAA/8xAF också någon form av bugg. Vi får helt enkelt återkomma när patch 1.2 kommit.


Halo lär väl knappast behöva någon längre inledning.

























Halo: Combat Evolved

Halo skulle man nog kunna kalla det första riktigt spelvärda DirectX9-spelet vilket givetvis gör det mycket intressant. Vi testar prestandan genom att lägga till kommandoraden -timedemo vilket mäter prestandan i spelets “cutscenes” vilket ger en hyffsad bild av kortens prestanda i spelet.

Spelmotor:

Direct3D (DX9)

Pixel Shaders:

Ja (1.1, 1.4 och 2.0)

Vertex Shaders:

Ja (1.1)
























Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

Utan AA/AF:
1024×768 
1280×1024
1600×1200

80.5
78.8
64

60
42.7
29.9

73.6
61.4
47.2

79.5
75.3
62.6


8xAF:
1024×768 
1280×1024
1600×1200

75.2
65.9
50.7

53.2
36.3
25.8

70.6
56.9
43.3


77.3
72.6
59

Radeon X800 XT och GeForce 6800 Ultra ligger ganska lika i våra tester dock drar XT ifrån när vi aktiverar 8xAF och använder hög upplösning. Några större skillnader är det dock inte tal om. X800 Pro ligger strax efter de två bjässarna men presterar helt klart godkänt.
Om vi tittar på resultaten i 1600×1200 ser vi att både 6800 Ultra och X800 XT är mer än dubbelt så snabba som Radeon 9800 XT, imponerande minst sagt.


Vi har fått en del önskemål om att köra tester som undersöker grafikkortens Open GL-acceleration i profesionella tillämpningar. Valet föll på SPECViewperf 7.1 och i nästa omgång kanske vi lägger till ännu något test.

























SPECViewperf

För att testa profesionell 3D-prestanda använder vi det beprövade testet SPECViewperf 7.1. Testerna körs i 1280×1024 utan AA/AF.

Spelmotor:

Open GL (DX7-klass)

Pixel Shaders:

Nej

Vertex Shaders:

Nej




















































Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

3dsmax-02

15.1

12.2

13.2

13.4


drv-09

69.4

25.6

28.1

28.5


dx08

85

73.3

75.6

77.1

light-06

13.8

13.5

13.5

13.5

proe-02

15.3

11.1

11.3

11.3

ugs-03

8.9

23.6

22.5

22.4

Detta test brukar vara ett av nVidias trumfkort och mycket riktigt åker X800 XT på stryk i fem av sex deltester. nVidia är traditionellt snabbare i profesionella Open GL-tillämpningar precis som SPECViewperf indikerar. Om vi jämför Radeon 9800 XT med Radeon X800 XT ser vi att prestandaskillnaderna uteblir, vårt 9800 lyckas tom. prestera ett bättre resultat i det sista testet. Något av en besvikelse med andra ord. Dock bör man ha i åtanke att det till väldigt stor del är drivrutinerna som avgör prestandan här.
Men för mer seriösa användningsområden är det nog smartare att satsa på NV40 om man är ute efter kostnadseffektiv Open GL-accelerering.

Som en liten sidnot har vi också kört testet GLParser från 3DLabs. Detta lilla program tester grafikkortsdrivrutinens kompabilitet med GLSlang.



























Chip/Drivrutin:

NV40 / 60.72

NV40 / 65.04

R420 / 4.5

Passed

20

70

131

Failed

120

70

9

Crashed

4

4

0

Här är det ingen tvekan om att det är ATi som står i ledningen vad det gäller deras GLSlang parser. Dock ska vi nog inte läsa in för mycket i resultaten. Som vi ser har nVidia jobbat hårt och betadrivrutinen 65.04 som vi lyckats lägga vantarna på lyckas betydligt bättre.


Traditionellt sett använder vi så få syntetiska benchmarks som möjligt men nu när vi utvärderar två helt nya arkitekturer ansåg vi det ändå vara intressant med några få syntetiska tester. Shadermark 2.1 (beta) är ett av dem och här testar vi prestandan med Pixel Shader 2.0. När Microsoft senare släpper DirectX9.0c kommer vi även att kunna använda detta test för att utvärdera Pixel Shader 2.0a, 2.0b och 3.0.

























Shadermark

Shadermark är ett syntetiskt pixelshadertest där DirectX9-shaders pressar grafikkorten hårt. Vi testar med standardinställningar i 1024×768 och kör också ett par omgångar med “Anti Detect Mode” för att försäkra oss om ärliga resultat.

Spelmotor:

Direct3D (DX9.0c)

Pixel Shaders:

Ja (2.0, 2.0a, 2.0b och 3.0)

Vertex Shaders:

Nej




































































































































































Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

Diffuse Lighting

511

260

428

628


Directional Light Shader

408

209

346

509


Point Light Shader

397

214

355

521

Spot Light Shader

298

186

309

456

Anisotropic Lighting

403

204

338

498

Fresnel Reflections

368

203

333

487

BRDF-Phong/Anisotropic Lighting

151

231

350

Car Surface Shader

255

152

239

358

Environment Mapping

287

470

689

Environment Bump Mapping

521

258

400

568

Bump Mapping

411

208

340

497

Shadowed Bump Mapping

272

94

156

245

Veined Marble Shader

279

98

215

314

Wood Shader

312

155

276

409

Tile Shader

199

105

173

257

Fur Shader with Anisotropic Lighting

35

18

29

42

Refraction and Reflection Shader with Phong Lighting

180

123

187

283

Dual Depth Shadow Mapping with 3×3 Bilinear Percentage Closer Filter

34

55

81

High Dynamic Range Shader (cross blur)

80

134

201

High Dynamic Range Shader (gaussian blur)

89

147

218

Edge Detection And Hatching Shader

46

78

114

Water Colour Shader

58

70

85

Resultaten här talar för sig själv. NV40 lyckas inte köra sju av de 23 testerna. I de tester som de båda korten klarar att köra är X800 XT snabbare i alla utom ett. Eventuellt kan detta ändras när DirectX9.0c släpps och NV40 kan använda Pixel Shader 3.0 i testerna. Med all sannolikhet kommer NV40 också att kunna köra alla tester så fort nästa uppdatering av DirectX kommer.
Jämför vi med Radeon 9800 XT ser vi att de nya generationernas kort har makalös Pixel Shader-prestanda i Shadermark 2.1.

Som det ser ut nu är Radeon fortfarande kung vad det gäller Shaderprestanda. För att förvissa oss om att det inte är just detta test som ger vilseledande syntetiska resultat har vi också testat med programmet FillrateTester.
























FillrateTester

FillRate tester mäter precis som namnet antyder fillrate. I ett par olika tester med allt från fixed function till Pixel Shader 2.0 testas kortens fillrate. Även z-only fillrate testas. Upplösningen vi valt är 1024×768. Resultaten anges i miljoner pixlar per sekund avrundat till närmsta heltal.

Spelmotor:

Direct3D (DX9.0)

Pixel Shaders:

Ja (1.1, 1.4 och 2.0)

Vertex Shaders:

Nej


























































































































Kort:

GeForce 6800 Ultra

Radeon 9800 XT

Radeon X800 Pro

Radeon X800 XT

FFP – Pure fillrate

5948

2842

3188

5924

FFP – Z pixel rate

10943

2798

5352

7958

FFP – Single texture

1227

2767

3056

4526

FFP – Dual texture

669

1469

1896

2528

FFP – Triple texture

453

980

1191

1818

FFP – Quad texture

339

645

899

1395

PS 1.1 – Simple

2048

1621

2775

4103

PS 1.4 – Simple

2054

1621

2766

4088

PS 2.0 – Simple

3061

1621

2769

4091

PS 2.0 PP – Simple

2060

1621

2768

4096

PS 2.0 – Longer

1548

816

1399

2076

PS 2.0 PP – Longer

1548

817

1399

2080

PS 2.0 – Longer 4 Registers

1553

817

1399

2088

PS 2.0 PP – Longer 4 Registers

1548

817

1399

2076

PS 2.0 – Per Pixel Lighting

317

234

402

596

PS 2.0 PP – Per Pixel Lighting

424

234

402

596

Vad det gäller pure fillrate är de snabbaste korten till synes identiska i denna låga upplösning. Vad det gäller Z-fillrate har NV40 övertaget tack vare sitt omtalade 32×0-läge. Faktum är att även R420 har möjlighet att bearbeta fler Z- än pixelvärden, vi har inte riktigt lyckats lista ut om de använder samma metod som nVidia (dvs låter color render outputen bearbeta Z-värden istället för pixlar). Faktum är dock att ATis metod, vilken den nu än är, verkar relativt ineffektiv jämfört med nVidias. I resten av testerna åker NV40 på storstryk av R420. Tom. Pro-versionen av X800 lyckas spöa upp 6800 Ultra i många tester.


I samtliga tester använder vi upplösningen 1280×1024 med 4x AA (Full Scene Anti Aliasing dvs. kantutjämning) och 8x AF (Anisotropic filtering dvs. avancerad texturfiltrering) om inte annat anges. På ATIs kort använder vi Quality Aniso och på nVidias kort använder vi Trilinear Optimizations off och inställningen Quality. Vi har valt upplösningen 1280×1024 (eller 1280×960 i de spel där inte 1280×1024 erbjuds) för att detta är en rimlig inställning vad det gäller prestanda men också för att de flesta av våra läsare lär ha monitorer som klarar denna upplösning.
I de tester där 1280×1024-4xAA/8xAF visat sig vara för krävande har vi i första hand valt att sänka upplösningen till 1024×768 och sedan sänkt och slutligen stängt av AA/AF tills en spelbar prestandanivå är nådd.


Efter att vi gjort de faktiska prestandatesterna har vi spenderat cirka 30 minuter (i vissa fall mycket längre än så) med att sätta oss ner och spela spelet ordentligt för att se hur det fungerar i praktiken.
























Quake 3: Arena

Open GL-spelet Quake 3 testar vi för att utvärdera prestandan i något äldre titlar. En stor mängd titlar bygger på “Q3”-motorn. Vi använder oss av testdemot four.dm_67 i testverktyget Q3Bench.

Spelmotor:

Open GL (DX7-klass)

Pixel Shaders:

Nej

Vertex Shaders:

Nej











Den nykrönte Quake3-kungen GeForce 6800 Ultra sitter säkert kvar på sin tron trots Radeon X800’s tappra försök. Det här är helt klart ett av nVidias starkaste tester vilket 5950 Ultra-resultatet vittnar om. Det som är lite oväntat är att X800 Pro’s ledningen över föregångaren 9800 XT är så liten, riktigt vad det beror på har vi faktiskt ingen aning om.

Subjektiv analys: Visst behöver man inte 300 fps för att spelet ska flyta. Men med 300 fps i genomsnitt har man också mycket högre fps även i de riktigt krävande situationerna än ett kort som har 100 fps i genomsnitt. Här finns det gott om utrymme att höja nivån av FSAA/Aniso och upplösning för samtliga kort vilket vi såg tidigare.
























Unreal Tournament 2003

UT2003 är ett DirectX 8-spel som pressar grafikkorten hårt med stora texturer och höga polygonantal mm. Ett flertal spel bygger på denna motor. Vi använder oss av det mer grafikkrävande flyby-testet. Vi testar spelet på banan Inferno.

Spelmotor:

Direct3D (DX8.1)

Pixel Shaders:

Ja (1.1 och 1.4)

Vertex Shaders:

Ja (1.1)










UT2003 har varit ATis starka sida ett bra tag nu. 6800 Ultra trumfade 9800 XT men nu tar ATi åter igen ledningen mitt sitt nya XT medan Pro-varianten lägger sig exakt på samma prestanda som 6800 Ultra.

Subjektiv analys: Prestandan med de tre snabbaste korten här är inget annat än makalös, flytet är felfritt. X800 XT har ett försprång på cirka 10 fps men i själva spelet var det knappast något vi märkte av. Med tanke på de små skillnaderna mellan X800 Pro och X800 XT här verkar det nästan som om vi sprungit in i CPU-begränsningar trots att vi bara testar flyby.
























WarCraft 3: Reign of Chaos

WarCraft 3 är ett av förra årets bäst säljande spel vilket gör det till ett bra testobjekt. Trots att grafiken saknar extravagant teknik är spelet rätt så krävande. Prestandatesterna är utförda på första banan i WC3-demot med hjälp av FRAPS.

Spelmotor:

Direct3D (DX8.1)

Pixel Shaders:

Nej

Vertex Shaders:

Nej










FRAPs har visat sig ge underliga resultat i Warcraft 3 när vi testat tidigare. Den här gången valde vi att övervöka själva fps-mätaren under demots gång och då insåg vi begränsingen på 64 fps i spelet. Samtliga kort utom 5950 Ultra når upp till denna begränsning.

Subjektiv analys: Det finns inga skillnader vad det gäller spelbarhet här. Alla kort är lika välanpassade.

























Mafia: The City of Lost Heaven

Mafia bygger på en egenutvecklad Direct3D-motor och använder stora mängder relativt lågkvalitativa objekt för att på så vis skapa en stor detaljrikedom. Liknande spelmotorer finnes i tex. GTA-serien. För att mäta prestandan har vi kört Free Rides första bana och använt FRAPS.

Spelmotor:

Direct3D (DX8.1)

Pixel Shaders:

Ja (1.1)

Vertex Shaders:

Ja (1.1)











NV40 lyckades inte ta ledningen över Radeon 9800 XT. Å andra sidan är det knappt att Radeon X800 lyckas göra det häller. Till synes har vi nått CPU-begränsning även här. Moderna grafikkort springe ruppenbarligen ifrån vår stackars Athlon XP 3200+.

Subjektiv analys: Prestandaskillnaderna mellan X800 och 6800 är större på pappret än hur de i verkligheten upplevs. Spelet flyter tom. helt ok på 5950 Ultra trots sina knappa 35 fps.
























Comanche 4

Comanche 4 bygger på en egen Direct3D-motor som använder Pixel och Vertex Shaders samt högupplösta testurer. Spelet är ett av de få som verkligen “behöver” ett grafikkort med 256 MB. Vi testar med det nerladdningsbara demots benchmarkverktyg.

Spelmotor:

Direct3D (DX8.1)

Pixel Shaders:

Ja (1.1)

Vertex Shaders:

Ja (1.1)










nVidia står kvar som vinnare i Comanche 4-testet. Det som är anmärkningsvärt här är att Pro och XT-versionerna presterar mer eller mindre identiskt.

Subjektiv analys: Comanche 4 flyter givetvis bra på alla kort vi testat.
























Counter-Strike


Counter-Strike behöver någon direkt presentation. Dock sägs det att nya 1.6-versionen är mer krävande än föregångare och därför valde vi att testa det. Testet består i ett demo av banan de_aztec med sammanlagt 18 spelare.

Spelmotor:

Open GL (DX6-klass)

Pixel Shaders:

Nej

Vertex Shaders:

Nej










CPUn sätter gränserna igen. För CS-fantasten lär det inte spela stor roll vilket kort man väljer.

Subjektiv
analys:
CS flyter på alla korten här. Det finns inte mycket mer att säga än så.

























Battlefield 1942:
Secret Weapons of WWII


Svenskutvecklade Battlefield 1942 är fortfarande ett väldigt populärt onlinespel och känns därför viktigt att testa. Återigen använder vi verktyget FRAPS och testar det nerladdningsbara demot.

Spelmotor:

Direct3D (DX8.1)

Pixel Shaders:

Nej

Vertex Shaders:

Nej











Battlefield 1942 presterar mer eller mindre identiskt oavsett om vi har ett NV40 eller ett R420 i burken. 5950 Ultra däremot har väldigt svårt att hänga med.

Subjektiv analys: Alla kort utom 5950 Ultra klarar uppgiften galant.
























Tomb Raider:
Angel of Darkness



Tomb Raider är det första kommersiella spelet som fullt ut använder DirectX 9.0 för sin grafik och gör det därför till ett intressant testobjekt. Testet utförs med den senaste patchens inbyggda verktyg. Banan Prague3a valdes för ändamålet.

Spelmotor:

Direct3D (DX9)

Pixel Shaders:

Ja (1.1, 1.4 och 2.0)

Vertex Shaders:

Ja (1.1 och 2.0)










NV40 tog förstaplatsen från 9800 XT, X800 tar tillbaks den.

Subjektiv analys: Tomb Raider blir riktigt njutbart med X800-korten. Jämfört med vårt stackars NV38 är skillnaderna enorma. Jämfört med NV40 är de desto mindre märkbara.
























Star Wars Jedi Knight:
Jedi Academy



Jedi Academy är uppföljaren till det populära Jedi Knight II. Det bygger på Q3-motorn men har bland annat väldigt högupplösta texturer och mer ljuseffekter. Vi har testat ett egenhändigt inspelat demo från banan Traspir där vi mötte 7 motståndare.

Spelmotor:

Open GL (DX8.X-klass?)

Pixel Shaders:

Ja? (1.x?)

Vertex Shaders:

Ja? (1.x?)










Det krävs inte ett snille för att räkna ut att vi är CPU-begränsade igen.

Subjektiv analys: Här finns inga skillnader värda att nämna. Ska vi nämna något är det att vi behöver en snabbare CPU.

























Halo: Combat Evolved

Halo skulle man nog kunna kalla det första riktigt spelvärda DirectX9-spelet vilket givetvis gör det mycket intressant. Vi testar prestandan genom att lägga till kommandoraden -timedemo vilket mäter prestandan i spelets “cutscenes” vilket ger en hyffsad bild av kortens prestanda i spelet.

Spelmotor:

Direct3D (DX9)

Pixel Shaders:

Ja (1.1, 1.4 och 2.0)

Vertex Shaders:

Ja (1.1)












GeForce 6800 Ultra imponerade enormt i Halo och det gör även X800 XT. Pro-kortet får se sig slaget av nVidias senaste skapelse. Det tål att påpekas att X800 Xt här är mer än 100% snabbare än Radeon 9800 XT!

Subjektiv analys: Prestandaskillnaden här är väldigt markant. De nya generationens grafikkort klarar Halo galant jämfört med 2003’s kort.
























Max Payne 2: The Fall of Max Payne

Uppföljaren till det omåttligt populära Max Payne utvecklat av finska Remedy. Vi testar spelprestandan genom att benchmarka med FRAPS i en så kallad “cut-scene”. Spelet använder den spektakulära Havok-fysikmotorn och Pixel Shaders bland annat.

Spelmotor:

Direct3D (DX9)

Pixel Shaders:

Ja (1.1 och 1.4)

Vertex Shaders:

Ja (1.1)











Sist ut är Max Payne 2. NV40 tog ledningen över 9800 XT i vår förra recension och idag är det dags för Ati att ta tillbaka förstaplatsen, dessutom säkrar de andraplatsen också. Uppenbarligen springer vi in i en CPU-begränsning när vi når upp till ca 150 fps vilket den minimala skillnaden mellan XT och Pro vittnar om.

Subjektiv analys: De få tillfällen där Radeon 9800 XT säckade ihop i Max Payne 2 är nästan helt bortblåsta när vi kör med NV40. Med X800 ser vi inga tendenser alls till att slöa ner.







Avslutande ord om speltesterna

Det är inte med enorma marginaler, speciellt inte med den nya retail-GeForce 6800 Ultra, som Radeon X800 XT tar ledningen som snabbaste grafikkortet. Överlag ligger GeForce 6800 Ultra och Radeon X800 XT relativt lika. Det som imponerar oss mer är hur pass bra Radeon X800 Pro klarar sig. Det ska bli väldigt intressant att se hur pass bra Pro-varianten står sig mot GeForce 6800 och 6800 GT/Pro.

Det som verkligen talar för Radeon X800 är dess Pixel Shader-prestanda där nVidia fortfarande ser ut att, i alla fall rent teoretiskt, att ligga i underläge. Testerna i Far Cry visade också upp att det här verkar stämma i praktiken också. Precis som GeForce 6800 Ultra ser vi de största vinsterna när vi kör med AA/AF i hög upplösning.
Ska man vara krass skulle man kunna påstå att det rentav är idiotiskt att köpa dessa kort om man inte tänker lira med AA/AF aktiverat.

nVidia har fortfarande en hållhake på ATi vilket är Open GL. Som vi såg tog NV40 hem vinsten i våra Open GL-tester nästan konstant. Även profesionell 3D-prestanda klarade sig bättre på nVidias kort. Det var också trevligt att se hur pass mycket den nya revisionen av GeForce 6800 Ultra ökade prestandan.

I våra elva standardtester tog ATi’s XT ledningen i 5 tester med nämnvärd marginal. I fyra ligger de i princip lika och i de två kvarvarande tog NV40 ledningen. I våra detaljerade tester tog nVidia ledningen i tre av åtta tester. När vi lägger samman resultaten blir det alltså ett någorlunda märkbart övertag för ATis del.
De stora skillnader vi såg mellan NV3x och R3x0 är inte med i bilden här dock.


Eftersom vi idag testar referenskort som av allt att döma inte är den slutgiltiga produkt som hamnar i affären bör ni ta våra överklockningsresultat med en nypa salt.

För överklockning använder vi Coolbits/PowerStrip och för att testa stabilitet och leta efter så kallade artifacts använder vi Mother Nature-testet i 3DMark03. Vi tar också med resultaten från nVidias NV40 för att ge er en jämförelse.

Produkt
Standard
Överklockat
Procent
nVidia 6800 Ultra
400/1100

446/1170

11.5/6.4

ATi X800 Pro
475/900
540/1050
13.7/16.7
ATi X800 XT
525/1150
540/1210
2.9/5.2

NV40 var knappast en imponerande överklockare. R420 når ännu lägre nivåer tyvärr och går knappt att överklocka alls. Vi var beredda på detta då ATi antytt att de skulle ha klockfrekvenser på smärtgränsen sedan länge. X800 Pro bjuder dock på helt ok överklockning där både minne och core går att skrämma upp cirka 15 % mer än standard.

Som jag tjatat om tidigare var vi under tidspress då vi skrev recensionen och utförde testern, överklockning prioriterades därför inte särskilt högt och vi har inga tester att visa upp. Dock kan jag dela med mig av några observationer:

På de två R420-korten gör det inte mycket nytta att höja corens klockfrekvenser. Inte ens de 13.7 procenten som vi överklockade Pro-coren med gav några störra förbätringar. När vi klockar minnet är det andra bullar. Prestandan höjdes direkt även av bara små höjningar av klockfrekvensen. Vi testade tre fyra olika tillämpningar och resultaten var entydiga vilket indikerar att korten, precis som väntat, “lider” av bandbreddbrist.
Vad det gäller NV40 hade vi väntat oss liknande resultat men faktum är att vi här blev överraskade av att core-överklockning verkade göra större nytta än när vi klockade minnet.

Det har blivit dags att slå igen butiken.


På sida nummer nitton har det nu blivit dags att sammanfatta våra intryck av R420 och dess motståndare.

Det mest uppenbara här är helt makalös prestanda. Radeon X800 krossar vårt gamla trogna Radeon 9800 XT, den förra generationens bästa kort. Prestandan med X800 XT var överlag snäppet över GeForce 6800 Ultra. Marginalerna är inte jättestora men som det ser ut nu är Radeon X800 XT det snabbaste grafikkortet vi någonsin testat. Det som kanske imponerade mer är hur pass bra X800 Pro stod sig i merparten av testerna.








Ruby – R420



Nalu – NV40

På bilderna ovan ser ni ATi resp. nVidias flickor. Ruby vs. Nalu, R420 vs. NV40. Frågan är ju klart vilket som är bäst men i ärlighetens namn anser vi fortfarande att vi inte är kapabla att fullt ut avgöra det. Dels fattas stortitlar som Doom 3 och eventuellt Half Life 2 och dels fattas DirectX 9.0c.

Prestandan med de två arkitekturerna är någorlunda likvärdig överlag. Det som skiljer här är bildkvalitet och finesser samt de fysiska aspekterna. På kvalitetsfronten ser vi fortfarande ATi som vinnarna på grund av bättre FSAA-kvalitet bland annat. Vad det gäller finesser så är det ju NV40 som på pappret ser mest imponerande ut med Shader Model 3.0. ATi har inte legat på latsidan dock och deras Pixel Shader 2.0b är i alla fall ett steg framåt om än inte lika stort som det NV40 tog. Det ATi har som nVidia inte kan skryta med är 3Dc vilket kan betyda förbättrad bildkvalitet och/eller prestanda.
Vad det gäller finesser måste vi helt enkelt vänta på DirectX9.0c och spel med stöd för de nya teknikerna innan vi kan avgöra hur pass viktiga dessa olika finesser är. Som det ser ut nu är vi dock mest imponerade av nVidias Shader Model 3.0.

Om vi går över till de fysiska aspekterna är det ingen tvekan om vem som har övertaget. ATis kort är mindre, drar mindre ström, är något tystare och tar bara upp en kortplats. Att leverera så här bra pretanda med ett kort som håller förhållandevis låg fysisk profil samtidigt som det konsumerar lite ström och alstrar lite värme är inget annat än makalöst.

 

Radeon X800 XT snor, i våra ögon, kungakronan från GeForce 6800 Ultra med relativt små marginaler. Om GeForce 6800 Ultra Extreme i kombination med de nya drivrutinerna kan jämna ut det och/eller ta ledningen igen återstår att se. Men oavsett hur vi ser på det är det här en jämn fight som knappast har något gemensamt med den fight vi såg mellan Radeon 9700 Pro och GeForce 5800 Ultra.

Idag har vi främst koncenterat oss på prestanda som ni märkt. Vi hoppas göra en uppföljande artikel där vi dels mäter Radeon X800 XT mot GeForce 6800 Ultra Extreme och dels gör en riktigt grundlig inspektion av bildkvalitet.

Subscribe
Notifiera vid
0 Comments
äldsta
senaste flest röster
Inline Feedbacks
View all comments