Så
var det återigen dags för en ny processorlansering från chipgiganten
Intel och i grunden har vi inte helt oväntat den beprövade Pentium
4-kärnan med sin NetBurst-arkitektur.
Intels Pentium 4-processorer var inte direkt en succé vid sin lansering
då prestandan kom till korta mot konkurrenterna pga. Willamette-kärnans
svårigheter att skala upp i höga klockfrekvenser, något som
mer eller mindre är ett måste för Intels NetBurst-arkitektur.
Vinden har dock vänt sedan dess och Intels Pentium 4-processorer har
genom de uppdateringar som gjorts i kärnan och dess tillverkningsteknik
blivit marknadsledande på processormarknaden.
Intel rider klart och tydligt på en framgångsvåg för
tillfället medan det varit relativt vindstilla för ärkerivalen
AMD. Det som kan/ska sätta fart i AMDs segel är såklart den
nylanserade Athlon64-processorn som vi inom kort kommer titta närmare
på.
Intel
har under åren med Pentium 4-processorn gjort otaliga frekvensuppdateringar
och optimerat både processorkärna och plattformar för att
utnyttja processorernas kapacitet till det yttersta. Genom att göra det
slipper man ändra arkitektur eller förfina tillverkningstekniken
lika ofta vilket sparar tid och pengar.
Det har alltså hänt en hel del sedan lanseringen av Intel Pentium
4 Willamette och vi har därför sammanställt en kort resume
på Historian bakom Intel Pentium 4. Alla uppdateringar och förändringar
på processorn är nämnda förutom alla vanliga klockfrekvensökningar.
Intel
Pentium 4 Historik: |
|
20-10-2000 |
Intel
Pentium 4 lanseras i Socket 423 format vid två klockfrekvenser 1.4/1.5GHz. Specifikationer:
400 MHz FSB, 256KB L2 cache, Socket 423, Willamette-kärna, 0.18micron tillverkningsteknik |
27-08-2001 |
Intel
lanserar de två sista modellerna av Pentium 4 med Socket 423 i 1.9/2.0 GHz klockfrekvenser men samma modeller lanseras även för det nya Socket 478 interfacet. Specifikationer:
400 MHz FSB, 256KB L2 cache, Socket 423/478, Willamette-kärna, 0.18micron tillverkningsteknik |
07-01-2002 |
Intel Specifikationer:
400 MHz FSB, 512KB L2 cache, Socket 478, Northwood-kärna, 0.13micron tillverkningsteknik |
06-05-2002 |
Intel
introducerar en snabbare processorbuss för Pentium 4 på 533 MHz genom att lansera tre nya modeller. Pentium 4 2.26B ,2.4B , 2.53B. Specifikationer:
533 MHz FSB, 512KB L2 cache, Socket 478, Northwood-kärna, 0.13micron tillverkningsteknik |
14-10-2002 |
Intel
lanserar deras första desktop-processor med HyperThreading-stöd, Pentium 4 3.06GHz. Specifikationer:
533 MHz FSB, 512KB L2 cache, Socket 478, Northwood-kärna, 0.13micron tillverkningsteknik, HT-stöd |
14-04-2003 |
Intel
uppdaterar deras processorbuss på nytt, denna gång till 800 MHz genom lanseringen av Pentium 4 3.0C. Specifikationer:
800 MHz FSB, 512KB L2 cache, Socket 478, Northwood-kärna, 0.13micron tillverkningsteknik, HT-stöd |
23-09-2003 |
Intel
lanserar deras Extreme Edition av flaggskeppet Pentium 4 3.2 GHz. Processorn är utrustad med en L3 cache på 2 MB. Specifikationer:
800 MHz FSB, 512KB L2 / 2 MB L3 cache, Socket 478, Northwood-kärna, 0.13micron tillverkningsteknik, HT-stöd |
Som synes har
det alltså hänt en hel del sedan introduktionen av Pentium 4 och
NetBurst-arkitekturen. Allt från mindre uppdateringar till helt nya
processorkärnor. Intel Pentium 4 3.2 GHz Extreme Edition tillhör
en av de förstnämda om vi tittar på dess specifikationer.
Vi vet dock av egen erfarenhet att första anblicken kan vara vilseledande
och vi kommer därför titta närmare på Intel Pentium 4
3.2 GHz Extreme Edition för att se vilka förändringar som verkligen
skett sedan den "vanliga" 3.2 GHz-modellen.
Som ni såg var Pentium 4 3.2 GHz Extreme Edition med i vår lilla "Pentium 4-historik" och det enda vi nämnde där var att processorn blivit utrustad med en extra L3-cache. Det stämmer också så länge vi enbart tittar på ytan och vad man gjort för att förbättra prestandan på processorn. Vad vi inte nämnde var att en man inte direkt bara slänger in lite extra cacheminne i en processor och defenitivt inte när det handlar om 2MB extra!
2MB låter inte så imponerande i dagsläget men cacheminne går inte direkt att jämföra med minneschip på t.ex. en minnesmodul eller ett grafikkort. Vi ska snart titta lite närmare på det här med cacheminne och Pentium
4 3.2GHz Extreme Editions 2MB L3-cache men först går vi vidare med processorns specifikationer.
Pentium 4
|
Pentium 4 EE
|
AthlonXP
|
Athlon64
|
Athlon64 FX
|
|
---|---|---|---|---|---|
Processorkärna |
Northwood
|
Northwood
(Gallatin?) |
Barton
|
Hammer
|
Hammer
|
Tillverkningsteknik |
0.13µ
|
0.13µ
|
0.13µ
|
0.13µ
|
0.13µ
|
Antal transistorer |
55 miljoner
|
169 miljoner
|
54.3 miljoner
|
105.9 miljoner
|
105.9 miljoner
|
Processorkärnans yta |
146 mm2
|
?
|
101 mm2
|
193 mm2
|
193 mm2
|
Interface: |
Socket 478
|
Socket 478
|
Socket 462
|
Socket 754
|
Socket 940
|
Max klockfrekvens |
3.2 GHz
|
3.2 Ghz
|
2.2 GHz (3200+)
|
2.0 GHz (3200+)
|
2.2 Ghz
(FX 51) |
CPU-spänning* |
1.550v
|
1.550v
|
1.65v
|
1.50v
|
1.50v
|
Max värmeutveckling* |
82.0 Watt
|
?
|
76.8 Watt
|
?
|
?
|
Processorbuss klock* |
200 MHz
|
200 MHz
|
200 MHz
|
200 MHz
|
200 MHz
|
Effektiv processorbuss |
800 MHz
|
800 MHz
|
400 MHz
|
1.6 GHz**
|
1.6 GHz**
|
L1-cache (data) |
8 KB
|
8 KB
|
64 KB
|
64 KB
|
64 KB
|
L2-cache |
512 KB
|
512 KB
|
512 KB
|
1 MB
|
1 MB
|
L3-cache |
–
|
2 MB
|
–
|
–
|
–
|
** Athlon 64 använder ingen "vanlig" processorbuss utan en integrerad, HyperTransport.
Som ni kan se av specifikationerna bidrar den stora L3-cachen en del innre förändringar mot sin föregångare. Pentium 4 EE ‘Extreme Edition’ som vi kallar den för hädanefter väger in på ofattbara 169 miljoner transistorer vilket är drygt 3 gånger så mycket som den vanliga Pentium 4-processorn är utrustad med.
Tyvärr har vi ännu inte fått några uppgifter på processorns ytstorlek eller värmeutveckling men vi hoppas få dessa uppgifter inom kort och kommer då uppdatera recensionen därefter.
Enligt vad vi sett på Intels Xeon-processorer verkar värmeutvecklingen påverkas överraskande lite av den stora L3-cachen men vi vill inte dra några slutsater förrän vi får säkra uppgifter på detta.
I övrigt är det väldigt få skillnader mellan den vanliga Pentium 4-processorn och Pentium 4 EE.
Det har ryktats om att Intel Pentium 4 EE är en hybrid av Intels vanliga Pentium 4 och deras Xeon-modeller för servermarknaden. Detta låter faktiskt inte alls så otroligt då Intel sedan ett par månader tillbaka haft Xeon-processorer i deras sortiment med just 2MB L3-cache. Intel Xeon MP som baseras på Gallatin-kärnan finns i modeller med antingen 1Mb eller 2MB L3-cache. Det betyder att både tekniken och tillverkningsmöjligheterna har funnits där ett tag eftersom Pentium 4 och Xeon MP är baserade kring samma processorarkitektur, Intels NetBurst.
Det enda Intel egentligen behövt ändra på Xeon MP är att öka processorbussen från 533 MHz till 800 MHz och även pressa upp själva processorn i 3.2 GHz vilket förmodligen inte varit några större problem.
Det sista som man behövt ändra är själva sockeln på processorn för att den ska passa på dagens desktop-moderkort. Vi har inga säkra uppgifter på hur Intel tagit fram deras Pentium 4 EE men detta låter som en klart godtagbar förklaring i våra öron och vi ser absolut inget negativt i detta.
Vad som är mycket positivt med Pentium 4 EE är att trots den stora ökningen i transistorer och kärnans yta har de inte behövt ändra de fysiska förutsättningarna för processorn. Det är fortfarande Socket 478 som gäller och det finns inte heller några nya krav för strömförsörjning eller liknande. Detta gör att man utan problem kan använda alla moderkort som har stöd för Intels Pentium 4-processorer med 800 MHz processorbuss. Det ska inte ens behövas en BIOS-uppdatering för att Pentium 4 EE ska fungera på dagens moderkort vilket verkligen är skönt.
Som ni kan se nedan är det inga fysiska skillnader på de olika Pentium 4-processorerna trots att specifikationerna skiljer sig på mer än ett ställe.
Vi kan tillägga att ES står för
‘Engineering Sample’
och betyder att man kan ändra processorns multipel (multiplikationsfaktor). Vi kan bara hoppas att detta kan bli en av Extreme Editions egenskaper men det är förmodligen bara önsketänkande.
I WCPUID ser vi att L3-cachen rapporteras korrekt men "name string" kunde vår version av programet inte identifiera vilket visar att processorn verkligen är okänd och ny modell.
Nu är det alltså klart att den stora L3-cachen är det enda som skiljer Pentium 4 EE mot den vanliga Pentium 4-processorn ur prestandasynpunkt. Innan vi går vidare med våra prestandatester ska vi vilka teoretiska prestandaskillnader vi kan vänta oss med den nya L3-cachen. Vi ska även titta lite närmare på cacheminne i allmänhet då det är en
mycket viktig del i processorn.
Cacheminne och vanligt ramminne kan ses som en mellanhand för processorn och hårddisken. Ett nödvändigt redskap utan tvekan men rent teoretiskt skulle vi klara oss utan både cacheminne och ramminne. En PC behöver något som kan lagra information och något som kan behandla den. Hårddisken används för lagring av operativsystem, program och annan data medan processorn sedan startar och håller igång de processer som får all mjukvara att fungera.
Efter processorn kommer ramminnet som vi faktiskt kan se som ett cacheminne för hårddisken. Hårddisken är tillverkad för att hålla enorma mängder data och inget annat. Dess prestanda och åtkomsttid är egentligen mycket begränsad om vi ser till övriga delar i systemet varav ramminnet kommer in i bilden. Genom att datorn lagrar nödvändig information från hårddisken på ramminnet under uppstarten kan processorn mycket snabbare komma åt den informationen. Operativsystemet lagras i minnet under uppstarten och startar du t.ex ett nytt program lagras även detta i ramminnet under tiden det är aktivt för att optimera prestandan för den applikation du använder för tillfället.
Stänger du sedan ner programet ska det även rensas helt från ramminnet vilket tyvärr inte fungerar helt korrekt i alla lägen, speciellt på äldre operativsystem.
Allt handlar alltså om snabb åtkomst och även om ramminne är många gånger snabbare än en hårddisk är det likt en snigel i jämförelse med en processorn. Därför behövs ytterligare en mellanhand vilket då blir processorns cacheminne.
De snabbaste ramminnena i dagsläget (vi bortser från RDRAM vilket är väldigt sällsynt på PC marknaden i dagsläget) ligger på klockfrekvenser runt 500 MHz (250 MHz DDR-SDRAM, 500 MHz effektivt) och är onekligen mycket snabba i sin klass. Men om vi då jämför med processorns cacheminne är skillnaderna markanta, cacheminnet på mer eller mindre alla nya processor arbetar idag vid samma klockfrekvens som processorn själv. I detta fallet 3.2 GHz vilket onekligen är mycket, mycket snabbare än datorns ramminne.
Intel Pentium 4 3.2 GHz ska för optimal prestanda använda sig av DDR400-minne i sitt originalutförande. Det betyder att dess cacheminne är i runda slängar 8 gånger snabbare, om vi ser till ren klockfrekvens. Sen ska man tänka på att avståndet till ramminnet är fysiskt mycket längre än till cacheminnet för processorn och det finns ett flertal hinder på vägen. Mellan processorn och minnet finns t.ex. processornbussen och en extern minneskontroller som måste passeras vilket ytterligare ökar latencyn.
Cacheminne baseras i regel på SRAM (Static RAM) och är alltså snabbare lösning än DRAM som vi använder på t.ex. minnesmoduler och grafikkort. SRAM kräver dock mer plats per MB och är även dyrare än DRAM. Detta gör att man som processortillverkare inte bara kan slänga in extra cacheminne utan att se över processorkärnans design och även förbereda sig för högre kostnader.
Detta med kostnader och Intels tankar bakom lanseringen av Pentium 4 EE är något vi kommer ta upp igen senare i recensionen men nu går vi vidare med mer information om cacheminnets funktion.
Det som lagras i processorns cacheminne är data som ofta används och på så sätt tjänar mest på att vara lättåtkomligt. Desto mer data som kan lagras i cacheminnet desto mindre blir risken att processor kommer behöva gå till ramminnet för att hämta data vilket man av uppenbara skäl vill ska hända så sällan som möjligt.
Med detta i åtanke är det inte så svårt att förstå varför ett större cacheminne kan förbättra prestandan.
Det hela handlar om latency, enkelt översatt till "väntetider" på svenska, och att förkorta dem så mycket som möjligt. Därav finns det även olika nivåer av cacheminne och det är därifrån vi får benämningarna L1, L2 och L3. L:et står för "Level" och betyder alltså i vilken ordning efter processorn cacheminnet sitter.
Diagramet här nedan kan ge en bra bild av detta och även hur ramminnet och hårddisken står sig i relation till cacheminnet och processorn.
Bilden är hittad på tomshardware.com.
Som man tydligt kan se är det stora skillnader på åtkomsttiderna när vi går från hårddisk till ramminne till cacheminne och slutligen processorns register. Vi ser även att L1-cachen inte helt oväntat är den cache som har bäst åtkomsttid. Även alla nivåer av cache på Intel Pentium 4 EE är integrerade i kärnan är det bara L1-cachen som sitter i direkt kontakt med processorns pipeline vilket förklarar den mycket låga latencyn.
L2-cachen kommer därefter och sist L3-cachen. Vad som är intressant här är att L3-cachen faktiskt inte verkar skilja sig mot L2-cachen i åtkomsttid. Detta är mycket intressant då det i praktiken betyder att Pentium 4 EE:s L3-cache borde vara exakt lika effektiv som dess L2-cache, något som borgar för mycket fin prestanda.
Det förklarar även Intels tillvägagångssätt att integrera en ny L3-cache istället för att öka storleken på L2-cachen. Först och främst hade det förmodligen behövts ytterligare förändringar i processorkärnan om man utökat L2-cachen vilket tagit både mer tid och kostat mer pengar. Och eftersom L3-cachen rent teoretiskt verkar ha precis samma förutsättningar var valet förmodligen inte så svårt.
Ett större cacheminne är helt klart förmånligt i många applikationer men det är inte alltid man har så stor nytta av mer än 512 KB cache varför man inte kan förvänta sig enorma prestandavinster under alla förutsättningar. Detta är något vi kommer gå in närmare på under våra prestandatester men då Intel lanserar denna processor som en "gaming-processor för entusiaster" har vi vissa förhoppningar.
Ett annat sätt att minska latencyn i systemet är att optimera minneskontrollen eller ännu bättre integrera minneskontrollern i själva processorn vilket drastiskt förbättrar förutsättningarna. Det sistnämnda är just vad AMD gjort med deras Hammer-serie av processorer och det är något vi helt klart kommer titta närmare på inom en snar framtid.
Men vi kan anta att Intels val att lansera en Pentium 4-processor med 2MB L3-cache är just för att sätta käppar i hjulet för AMDs effektiva hantering av systemminnet.
En processor som riktas mot entusiaster och gamers av tillverkaren själv är verkligen ett villigt offer i överklocknings sammanhang. Även om vi överklockar det mesta vi kan komma åt är det extra intressant med en processor som, i vår tolkning, riktar sig mot entusiaster och då självklart överklockare.
Eftersom vår testprocessor var ett ES-exemplar hade vi fördelen att kunna ändra multipel efter egna önskemål och i.o.m detta gjorde vi två överklockningstester på processorn. Först och främst överklockade vi processorn genom att enbart ändra busshastigheten vilket man hade fått göra i ett vanligt system med en icke upplåst processor. Efter det testade vi att pressa processorn till högsta möjliga busshastighet genom att sänka multipeln.
Det sistnämnda testet förlitar sig väldigt mycket på testsystemets moderkort men vi tyckte ändå det var värt att undersöka om den stora L3-cachen skulle ge några problem vid inte bara ren processoröverklockning utan även vid höga busshastigheter.
Våra
överklockningstester utfördes på ett 875P-baserat moderkort,
ABIT IC7-MAX3 och vi parade ihop detta med Corsair TWINX1024-4000 Pro minne.
Tyvärr kunde vi bara göra överklockningstesterna med vanlig
luftkylning då vår Prometeia Mach II slutade fungera i helt fel
tillfälle.
Processorkylaren var Intels originalkylare som visade sig vara ganska effektiv trots dess intetsägande design. Men värmeutvecklingen var ändå det som förmodligen satte stopp för våra överklockningstester då vi nådde optimala resultat vid 1.575v processorspänning. Drygt 1.6v ska inte vara några problem om man har ordentlig kylning.
Trots denna minimala ökning i processorspänning (1.550v original) nådde vi klart godkänt resultat i våra överklockningstester.
Vi kunde pressa upp systemet i hela 3.68 GHz och utan problem fullfölja hela vår testsuite som inte går av för hackor och verkligen stressar systemet och dess stabilitet.
Vi kan verkligen inte klaga på denna överklockningen då det faktiskt handlar om en processorkärna som är på väg att ersättas av en ny med finare tillverkningsteknik. Det hör även till att Pentium 4 EE är en gigant om vi ser till antalet använda transistorer vilket verkligen inte har en positiv inverkan på överklockning, snarare tvärtom.
Under våra FSB-överklockningstester lyckades vi pressa upp systemet i 305 MHz busshastighet vid full stabilitet vilket är mycket imponerande. Det verkar onekligen inte vara några problem för Pentium 4 EE att nå höga busshastigheter, något vi faktiskt inte trodde skulle vara ett problem från början.
Mest credit ska vi dock ge till ABIT IC7-MAX3 som ligger i grunden för denna imponerande busshastighet. Därför kommer vi utelämna all vidare information om FSB-överklockningen till vår kommande ABIT IC7-MAX3 recension.
Vi har valt att inkludera resultaten från det överklockade systemet i våra prestandatester och även ytterligare några överklockade resultat som du kan läsa mer om under testsysteminformationen.
Testsystem
|
|
Intel
|
|
Processor: |
Intel Pentium
4 3.2GHz Extreme Edition (800MHz FSB, 2MB L3 Cache + 512Kb L2 Cache) Intel Pentium 4 2.8Ghz (800MHz 512Kb L2 Cache) |
Moderkort: |
ABIT |
AMD
|
|
Processor: |
AthlonXP 3200+ (Barton, 400 MHz FSB, 512KB L2-cache)
|
Moderkort: |
ABIT NF7-S v2.0 (NVIDIA nForce2) |
Övrig
hårdvara som återfinns i alla testsystem |
|
RAM:
|
2 x 512MB GeILPC3500 Ultra CL2
Vid överklockning på P4-system: 2 x 512MB Corsair XMS4000Pro |
Grafikkort:
|
nVidia
GeForce FX5900 Ultra@ 475/950MHz |
Hårddisk:
|
120GB
S-ATA Seagate Baracuda V |
Mjukvara
|
|
Operativsystem: |
Windows
XP Professional SP1 + updates |
Upplösning: |
1024x768x32bit,
90Hz |
Drivrutiner: |
nVidia
Detonator 51.75 DirectX 9.0b Intel Chipset Driver 5.0.2 |
Testprogram:
|
Sisoftware Sandra 2003 |
Som
ni kan se av tabellen ovanför blev det lite fler tester än
vanligt den här gången. Allt för att få en
så bra bild som möjligt över den prestandaförbättringen
utökat L3 Cache kan medföra. Dessutom nöjde vi
oss inte heller med att bara testa CPUn i de 3.2 GHz som är
standard utan vi körde den i inte mindre än fyra olika
konfigurationer. Genom att behålla busshastigheten på 800 MHz och istället ändra multipeln på vårt Engineering
Sample har vi kunnat simulera andra modeller av Pentium 4 EE. Vi körde Pentium 4 EE i följande hastigheter; 2.8 GHz, 3.2 GHz, 3.4 GHz och till sist 3.6 GHz Extreme Edition. 3.2GHz modellen
är den första Extrem Edition varianten som
Intel lanserat och vi är inte säkra på om vi får se ytterligare modeller av Extreme Edition. Men om Intel lanserar ytterligare modeller av Extreme Edition före eller efter lanseringen av Prescott-kärnan är det dessa modeller vi förväntar oss att se.
Tyvärr har vi inte lyckats få tag i AMDs nylanserade Athlon64/FX till denna recension varav ni får nöja er med att se AMDs trotjänare AthlonXP 3200+ strida för blotta livet. Eftersom vi saknar AMDs flaggskepp på processormarknaden i denna recension kommer vi till störst del fokusera på skillnaderna mellan Intels "vanliga" Pentium 4-linje och deras nylanserade Extreme Edition. Inom kort kommer ni även få se hur Athlon64/FX står sig mot denna best men tyvärr alltså inte ännu.
Innan vi sätter igång med vår "benchmark-bonanza"
ett par kvicka ord om testinställningarna. CPUn testades som
sagt var i hastigheterna 2.8, 3.2, 3.4 och 3.6GHz. För att
nå dessa hastigheter justerades endast multipeln medan FSBn
hölls låst på 200MHz. AGP/PCI-klockrekvenserna
var fixerade till 66/33MHz. Spänningen på processorn
höjdes en smula till 1.575 för att garantera hundraprocentig
stabilitet även i 3.6GHz.
Minnet som användes i samtliga
tester med 200MHz FSB var 2x256MB GeIL PC3500 CL2 minne som kördes
i minnesratiot 1:1 med 2-2-5-2 timings. Vad det gäller
kylningen så användes Intels paketerade fläkt som
till vår stora förvåning faktiskt presterade bättre
än den Zalman CU7000NPS-kylare vi annas brukar använda.
Överklockningstesterna gjordes med 2x512MB PC4000 minnen från
Corsair. Även här körde vi med 1:1 som minnesratio
för att få så hög effektiv bandbredd som möjligt.
Minnets timings var vi dock tvungna att höja då minnet
annars inte fungerar stabilt. De timings som användes istället
var 3-4-7-4.
Vad det gäller 3D-testerna gjordes alla tester med V-Sync,
FSAA och ANISO avslaget. Ett litet undantag finns dock då
Aquamark 3 testet kör med 4xANISO i standardinställningarna.
Låt festligheterna börja. Först ut är minnestesterna.
Som vi redan nämnt i sidan om vårt testsystem lider denna recension av en gnagande brist på en Athlon 64 processor. AMD har inte hört av sig eller skickat en och vi är inte så bra på att trolla fram saker så tyvärr får ni klara er utan AMDs nylanserade CPU i denna recension.
Innan
ni börjar titta på några grafer vill vi klargöra
vad vi testat: De tre gråa staplarna i varje diagram representerar
Pentium 4 Extreme Edition som vi överklockat. I 3.4 och 3.6
GHz har vi använt multipliern (något som INTE går
att göra på processorerna som går att köpa
ute i butiker) för att överklcoak processorn vilket resulterar
i att resultaten ni ser kommer att vara gällande om Intel senare
släpper en 3.4 och/eller 3.6 GHz-version av "P4 EE".
I 3.68 Ghz har vi låtit multipliern stå kvar på
16x och har istället valt att klocka FSBn (något som
gåt utmärkt att göra på de processor som finns
i butik) så långt som vi kunde utan att få stabilitetsproblem.
FSBn gick upp till 230 MHz med den kylning som vi hade till hands.
Väldigt viktigt att notera här är att vi använt
ett minne som bara klarar av slappare timings (med högre klockfrekvenser)
när vi kör processorn i 3.68 GHz.
Vidare har vi tre blåa staplar som ni ser. P4 3.2 GHz EE är givetvis Intels senaste flaggskepp, den procesor som artikeln handlar om. Eftersom varken Intel eller någon av våra vänner bland landets distrubitörer elelr återfösäljare kunde hjälpa oss att hitta en "vanlig" Pentium 4 3.2 Ghz för utlåning valde vi istället att klocka ner processorn till 2.8 GHz och jämföra den med en "vanlig" Pentium 4 2.8 Ghz utan det extra L3-cachet. Detta för att ge er en bild av hur det utökade cacheminnet påverkar prestandan (vilket klart är artikelns främsta mål egentligen).
Att vi har med testerna med den överklockade FSBn ger oss en vital inblick i huruvida bandbredd är av stor vikt eller ej i de tester vi kör.
För att se om cacheminnet verkligen har någon större inverkan på minnesprestanda generellt sett börjar vi med lite fler tester i SiSoft Sandra där vi testar minnesbandbredd.
include_once("/public_html/dia.php"); ?> do_diagram(320); ?> do_diagram(321); ?> do_diagram(322); ?> do_diagram(323); ?> |
Skillnaderna
vi ser här, 3.68 GHz borträknat, är helt slumpmässiga
och vi kan lugnt säga att processorhastighet och cache-storlek
inte har någon betydelse. Bättre resultat får vi
dock när vi klockar upp FSBn 30 MHz.
Om vi tittar på AthlonXP 3200+ är det verkligen ingen vacker syn, minnesbandbredden på AMD-systemen har dock varit bristande enda sedan lanseringen av Intels Pentium 4-processorer. AthlonXP 3200+ har en effektiv processorbuss på 400 MHz vilket bara är hälften av vad Intels nya Pentium 4-processorer stoltserar med. Det blir helt enkelt en för stor flaskhals i mån av bandbredd, men som tur var säger våra tidigare erfarenheter att denna skillnad inte visar sig lika tydligt i riktiga applikationer.
Då är det alltså dags att se om Intels satsning på gamers har gett utslag med lanseringen av Pentium 4 Extreme Edition. Först tänkte vi ta en titt på Aquamark 3 som ger en inblick i lite halvhjärtad DirectX9-prestanda.
include_once("/public_html/dia.php"); ?> do_diagram(307); ?> |
Aquamark 3 är varken imponerad av 2 MB L3-cache eller ökad bandbredd. Faktum är att Aquamark 3 mest av allt vill ha ett riktigt snabbt grafikkort. Även AthlonXP 3200+ hänger på sina konkurrenter bra här vilket ytterligare stärker vår slutledning om grafikkortets påverkan.
do_diagram(309); ?> |
Att
Commanche 4 gillar cacheminne visste vi sedan tidigare och det är verkligen
uppenbart att det faktiskt kan göra riktigt stor nytta med mer cacheminne.
Vill man få lite perspektiv på det kan man formulera det som att
vi tjänade ungefär lika mycket på att öka klockfrekvensen
400 MHz som att lägga till 2 MB cache. Prestandavinsten av det extra
cacheminnet ligger på närmare 14 % i våra tester. Helt klart
trevligt. AthlonXP 3200+ hänger på Intel Pentium 4 2.8 GHz bra i detta test men mot EE-modellerna är det verkligen klasskillnad.
do_diagram(312); ?> |
Unreal
Tournament 2003 käkar också upp vårt cacheminne med glupskhet.
Att döma av testerna i 3.68 GHz är minnesbandbredd knappast något
som UT2003-motorn behöver. Här ser vi ett test som AthlonXP 3200+ klarar sig relativt bra i och lyckas ta sig förbi både Pentium 4-systemen vid 2.8 GHz klockfrekvens. Intel Pentium 4 3.2 GHz Extreme Edition finns det dock inget att göra åt.
do_diagram(315); ?> |
Quake
3s timedemos flyger förbi så snabbt att man knappt hinner blinka
på dagens datorer. Dock krävs det att vi kommer över 3.6 GHz
för att vi ska nå den magiska 500 fps-gränsen. Även här
ser vi att extra cache kan göra nytta för ens spel då det
här höjer prestandan med nästan 14 %. Intels Pentium 4-processorer visar verkligen upp imponerande prestanda i Quake3 vilket med stor sannolikhet är pga. deras höga minnesbandbredd. AthlonXP 3200+ är inte ens i närheten av den lägst klockade Pentium 4-processorn i testet.
Dags för lite 3DMark-tester, ingen klarar sig utan dessa penisförlängare idag verkar det som.
do_diagram(308); ?> |
Även 3DMark2001 myser i blotta åsyn av Pentium 4 Extreme Edition. Dock krävs det återigen överklockning för att vi ska kunna nå ännu en magisk gräns: 20000 3DMarks. AthlonXP har alltid varit stark i 3Dmark2001 och även om Intel ligger i topp även här hänger 3200+ med hjälpligt i alla fall.
3DMark03 lär inte vara lika påverkat av det extra cacheminnet på EE-modellen:
do_diagram(314); ?> |
Det
extra cachet gör visserligen en skillnad men inte direkt något
att bli imponerad av. Å andra sidan gör en överklockning på
480 MHz inte någoon skillnad heller nästan så vi ska inte
döma Extreme Edition allt för hårt. Placeringarna är dem samma som i de flesta tidigare tester.
3DMark03 är löjligt
grafikkortsbegränsat och passar sig knappast som processortest egentligen.
Det är dock viktigt att visa det här då kommande spel lär
mer och mer visa upp samma beteende då grafikkortens Pixel och Vertex
Shaders kommer stå för den stora delen av prestandabegränsningarna
i framtiden. Futuremark har dock varit goda nog att bygga in två stycken
CPU-tester i 3DMark03, låt oss ta en titt på resultaten från
dessa:
do_diagram(318); ?> do_diagram(319); ?> |
Test 1 får en bra knuff av 2 MB L3 men andra testet är svårflörtat.
På föregående sidan visade vi att Pentium 4 Extreme Edition är ett bra val för gamern i många fall. Nu är det dags att se om det gör några skillnader på andra krävande situationer som tex. musik- och videoencoding. Först ut har vi ett videoklipp i MPEG(1)-format som vi kodar om till DivX 5.1 i 780 kbps. Vi valde att inte koda om ljudet dock.
include_once("/public_html/dia.php"); ?> do_diagram(310); ?> |
Lite blandade resultat här. Till synes är testet nästan helt oberoende av minnesbandbredd, cacheminnet gör däremot stor nytta. Athlon XP 3200 har inte mycket att säga till om här, detta trots att vi inte använde den Pentium 4-optimerade versionen av VirtualDub.
do_diagram(311); ?> |
För att testa hur pass bra processorn är på att hantera ljudencoding tar vi en 200 MB WAV-fil och gör om den till MP3 i 192 kbps. Som vi ser här är det i princip bara "rå" MHz som spelar roll. Allt annat är sekundärt. AMD har inte mycket att sätta emot om man tittar på deras XP-serie, dock har vi sett indikationer att kommande 64:an är stark inom detta område.
Härnäst ska vi ta samma WAV-fil fast istället ska vi komprimera den med förlustlös komprimering med hjälp av WinAce.
do_diagram(313); ?> |
Mer cacheminne gör stor skillnad i den här typen av tester vilket vi tydligt ser, tänk bara på att lägre värde är bättre vilket stämmer för både audioencodningen och winace. Athlon XP 3200+ har ännu en gång svårt att hänga med och hamnar på efterslänten.
do_diagram(316); ?> do_diagram(317); ?> |
Ovan hittar vi några syntetiska tester från PCMark2002 som mäter generell "kontorsprestanda". Egentligen hade vi velat använda Sysmark här men vi är inte allt för sugna på att slänga tusentals kronor på ett syntetiskt test när det finns sådana som är gratis. Som vi ser är CPU-testet, precis som MP3-encoding, helt och håller begränsat av antal MHz. Minnestestet visar dock upp helt andra resultat. Det extra cacheminnet gör löjligt stor nytta, långt mer än vad vi sett i något "riktigt" test. PCMark2002 har speciellt i minnestestet visat sig vara mycket buggigt och även Futuremarks Online ResultBrowser är full av felaktiga minnestester varav vi misstänker att de resultat man ser i detta test inte är riktigt tillförlitliga.
Det finns inga av våra
övriga tester som ser i närheten så hög prestandaökning av den extra L3-cahchen som PCMark2002 Memory vilket talar för en bugg i programet.
Resultaten för AthlonXP 3200+ hade vi önskat varit buggade men tyvärr är inte så fallet.
Vi har för tillfället inga tester på audio/video-encodning och filkomprimering för AthlonXP-systemet då vi fått lite problem med testsystemen efter det rikstäckandeströmavbrottet i Sverige under dagen. Dessa resultat kommer inkluders senare under kvällen eller tidigt nästa dag.
De avancerade 3D-testerna utförs med SPECviewperf 7.1. För er som inte är bekanta med SPECviewperf så är det ett testprogram som innehåller 3D-renderingar från sex olika 3D program som finns på marknaden i dag och används i professionella sammanhang. Testerna som körs är följande:
3ds max (3dsmax-02)
DesignReview (drv-09)
Data Explorer (dx-08)
Lightscape (light-06)
Pro/Engineer (proe-02)
Unigraphics (ugs-03)
Dessa tester körs i fönster och påverkas därför av systemets skrivbordsupplösning. Under våra tester använda vi oss av en upplösning på 1024x768x32bit och en uppdateringsfrekvens på 90Hz.
Den sista delen i vår testsvit slutar i samma manér som vi sett genomgående sen dess början. Intel dominerar starkt med deras Pentium 4 3.2 GHz Extreme Edition och L3-cachen gör sig påmind även i vissa av SPECviewperftesterna. Skillnaderna mellan 2.8 GHz och 2.8 GHz EE är dock överlag mycket små i dessa tester och i vissa fall är prestandan mer eller mindre identisk. AMD AthlonXP 3200+ har blivit överkörd flertalet gånger av Pentium 4-systemen och speciellt då Extreme Edition-modellern. I SPECviewperf handlar det i flera fall om total förnedring för AthlonXP 3200+ som i några av testerna ligger 40 % bakom Pentium 4 3.2 GHz EE.
Man kan kanske argumentera att AMD-processorn inte ska jämföras med Intels senaste flaggskepp och rent prismässigt kan ju detta se ut att stämma, men PR-ratingen på 3200+ ställer den faktiskt i direkt jämförelse.
Det är helt klart tydligt att AMD måste ta till tyngre artelleri för att peta ner Intel från prestandatronen och det ska bli mycket intressant när vi väl får tag i ett Athlon64/FX-system och kan testa det mot Intel Pentium 4 3.2 GHz EE.
Vi har alltså sett imponerande prestanda från Pentium 4 EE under hela recensionens gång och nu är det dags att undersöka hur stora skillnader den extra L3-cachen verkligen gjort för prestandan.
Vi har under testernas gång tydligt sett att den extra L3-cachen inte bara är ett löst PR-trick utan verkligen gör nytta. Det är inte i alla applikationer ska vi tillägga, men faktiskt i många av dem. Vi kommer då oundvikligt in på frågan, hur stor är verkligen skillnaden då?
För att svara på det har vi sammanställt alla våra testresultat och räknat ut de procentuela skillnaderna mellan Intels Pentium 4-processor utan L3-cache och Intel Extreme Edition med 2MB L3-cache.
Eftersom vi inte hade tillgång till en 3.2 GHz Pentium 4 har vi jämfört resultaten på vår 2.8 Ghz P4 och den underklockade Pentium 4 EE-processorn vid 2.8 GHz. Trots de lägre klockfrekvenserna borde skillnaderna vara mer eller mindre identiska.
Diagrammet nedan baseras på prestandan för Intel Pentium 4 2.8 GHz som är grunden för värdena. De procentuella värden vi ser i diagramet är hur hög prestandaökning vi såg på Intel Pentium 4 EE vid 2.8 GHz och visar alltså exakt hur mycket vi tjänade i prestanda under respektive test tack vare den extra L3-cachen.
Vi ser att prestandaökningen var 1 % eller mer i 13 av de 21 testerna och 5 av testerna visade en prestandaökning på över 10 %. Medelprestandaökningen ligger på 6.7 % om vi tittar på alla testerna vilket inte alls är fyskam. Men då är även det tveksamma resultatet i minnestestet för PCmark2002 inräknat.
Tar vi bara speltesterna med i beräkningarna ser vi att medelförbättringen ligger på 7.8 % och är allltså ännu bättre. Bland speltesterna räknar vi in Aquamark 3, UT 2003, Quake 3, 3Dmark2001 och 3Dmark03 (inte de två CPU-testerna).
Vi är faktiskt något förvånade över medelprestandaökningen av den extra L3-cachen och då i positiv mening. Vi hade inte räknat med en så pass stor prestandaökning överlag och vissa av testresultaten var riktigt imponerande på Intel Pentium 4 EE.
Det finns heller inga tvivel om Intels uttalande att Pentium 4 3.2 GHz Extreme Edition skulle vara riktad mot spelmarknaden och gamers, Pentium 4 EE är mycket vass i spelapplikationer och därmed basta.
Intel har aldrig varit mycket för att vända kappan efter vinden men dagens lansering av Intel Pentium 4 3.2 GHz Extreme Edition är i våra ögon ett undantag. Intel har aldrig uppmuntrat överklockning eller visat sig direkt intresserad av entusiastmarknaden. Även om flera av deras processorer under åren blivit förknippade med överklockning och entusiaster har det inte varit chipgigantens avsikt, inte officiellt i alla fall.
Även om Intel inte nämnt något om överklockning och överklockare i lanseringen av Pentium 4 Extreme Edition är deras kommentarer om inriktningen för deras processorer mycket ovanliga. Intel har öppet deklarerat att den nya Intel Pentium 4 Extreme Edition riktar sig mot gamers och entusiastmarkanden vilket är minst sagt stora ord för företaget som annars brukar vara försiktig med att märka deras produkter.
Anledningen till Intels lansering av en “gaming processor” är inte så svåra att lista ut. AMD lanserar en ny processor för desktopmarknaden och Intel passar samtidigt på att lansera en processor som enligt dem själva är som gjord för att användas till datorspelande. AMD Athlon64 är med stor säkerhet en mycket väl presterande processor i just spelapplikationer och Intel har valt att replikera direkt.
Hur man ska tolka detta “spel” är en annan fråga och inget vi är direkt intresserade av, vi vill bara se så snabba processorer som möjligt.
En sak är vi i testlabbet rörande överrens om, Intel Pentium 4 3.2 GHz Extreme Edition är en mycket snabb processor. Det finns ingen som kan säga något annat helt enkelt. Prestandan är onekligen den största fördelen med processorn men även dess bakåtkompabilitet är mycket bra. Alla moderkort som är certificerade för Intels Pentium 4 3.2 GHz ska fungera utan ens en BIOS-uppdatering med den nya Extreme Edition-modellen och det fungerade även helt smärtfritt på vårt testsystem.
Tyvärr finns det två stora nackdelar med Intel Pentium 4 Extreme Edition, tillgänglighet och pris. I dagsläget har vi ingen direkt information om något av dessa två bitar men vi är rädda att de två går hand i hand. Intels Pentium 4 3.2 GHz kostar i dagsläget runt 7000 kr i butik vilket är en summa väldigt få är beredda att lägga på en processor och av väldigt god anledning. Man kan faktiskt få en hel dator för dessa pengar. Om vi sen lägger till kostnaden för en 2MB L3-cache på detta och det prispremium vi brukar se på nylanserade processorer är det rena fantasisummor vi pratar om.
Hur seriös gamer eller entusiast du än är finns det ingen prestanda i som kan motivera dessa priser, så länge pengar inte är en faktor vill säga.
Utan några direkta uppoffringar har Intel lyckats skapa ett nytt prestandamonster på desktopmarknaden. Med Intels Xeon-kärna Gallatin i grunden har man mer eller mindre bara behövt pressa upp klockfrekvenserna på processorn och processorbussen. Det har i sin tur gett en processor med enormt prestandapotential vilket våra tester tydligt påvisat.
Hur Intel Pentium 4 3.2 Ghz Extreme Edition står sig mot Athlon64/64 FX återstår dock att se men det kan bli en riktigt hård match.
Tyvärr är vi rädda för att Intel Pentium 4 3.2 GHz Extreme Edition bara kommer vara en dröm för de allra flesta gamers och datorentusiaster pga. det förväntade höga priset. Frågan är om vi ska vara glada över att Intel producerat en så här imponerande processor eller sura för att vi inte har råd att köpa den…
Tack till Intel som gjort recensionen möjlig.