Intel passar paradoxalt nog på att lansera sin dyraste processor samtidigt som mellandagsreorna duggar tätt i våra butiker. Vi har kikat närmare på det monster Intel döpt till Pentium Extreme Edition 955.
Vid övergången till 90nm tillverkningsprocess började något som skulle bli långdraget bakslag för Intel – värmeutveckling. Under flera år har man kämpat med att förfina tillverkningsprocessen för att kunna öka frekvenserna så att Prescott-kärnan kan visa vad den går för. Målet att släppa en processor med 4GHz som arbetsfrekvens gick helt enkelt inte att nå. Intel har under det senaste året börjat ställa om sina fabriker för att kunna tillverka processorer med 65nm-teknik och man har enligt uppgift redan nått en tillverkningseffektivitet som motsvarar den väl inarbetade 90nm-processen.
Intel lanserar idag 900-seriens processorer som ersättare till 800-seriens processorer. Det är alltså dubbla kärnor det är frågan om, som med hjälp av 65nm tillverkningsprocess har fått en dos högre frekvenser. Till toppmodellen har man ryckt bort alla stoppklossar genom att öka processorbussen till 1066FSB, lämnat multiplarna olåsta och sist men inte minst aktiverat Hyper-Threading på båda kärnorna. Namnet är förstås Intel Pentium Extreme Edition 955, kort sagt 955XE.
Låt oss ta en närmare titt.
Det finns två huvudsakliga tillvägagångssätt att göra en processor med dubbla kärnor. En är att designa en krets som innehåller två beräkningsenheter och en annan metod är att helt enkelt ta två vanliga processorer och sätta de i samma förpackning. Det är naturligtvis inte riktigt så enkelt. 900-seriens processorer är designade på det senare viset med hjälp av två Cedarmill-kärnor och detta paket går under kodnamnet Presler hos Intel. Den största förändringen från 800-serien är som vi pratade om i inledningen övergången till 65nm tillverkningsprocess som kraftigt ökar antalet kretsar man får ut på en så kallad wafer i fabrikerna. Generellt så minskar värmeutvecklingen när man går till en finare tillverkningsprocess vilket dock inte riktigt stämde på Prescott-kärnan som hade avsevärt större strömläckage jämfört med Northwood. Vi får hoppas att Intel har lärt sig en läxa och klarar att hålla detta under kontroll. Låt oss ta och lista några av huvuddragen hos 900-seriens processorer jämfört med tidigare serier.
600-serien | 800-serien | 900-serien | 955XE | |
Kärna | Prescott | Smithfield | Presler | Presler |
Tillverkningsprocess | 90nm | 90nm | 65nm | 65nm |
Antal kärnor | 1 | 2 | 2 | 2 |
Klockfrekvenser | 3.0 – 3.8GHz | 2.8 – 3.2GHz | 2.8 – 3.4GHz | 3.46GHz |
Front Side Bus | 200MHz/800FSB | 200MHz/800FSB | 200MHz/800FSB | 266MHz/1066FSB |
Nivå 2-cache (L2) | 2MB | 2MB (2x1MB) | 4MB (2x2MB) | 4MB (2x2MB) |
Hyper-Threading (HT) | Ja | Nej | Nej | Ja |
EIST | Ja | Ja | Ja | Ja |
EM64T | Ja | Ja | Ja | Ja |
Execute Disable Bit | Ja | Ja | Ja | Ja |
Vanderpool | Nej | Nej | Ja | Ja |
La Grande | Nej | Nej | Ja | Ja |
Vi tar och tittar lite närmare på hur dual core fungerar samt hur det ser ut med HT.
Här ovan ser vi en bild på Cedarmill-kärnan, som två till antalet bildar Presler. De båda kärnorna sitter bredvid varandra och kommunicerar med varandra med samma frekvens som processorbussen. Med den skyddande värmeplåten ovanpå ser man ingen skillnad mellan Presler eller vilken annan P4 som helst. Denna konstruktion, där man använder två separata processorkärnor, brukar kallas dual chip, medans en processor som från början är designad med två beräkningsenheter i samma kärna kallas dual core. I dagligt tal kallar man dock båda typerna för dual core. De två stora mörka områdena på bilden ovan är L2-cachen som utgör en väsentlig del av de 376 miljoner transistorer som processorn är uppbyggd av. Cedarmill har 2MB L2-cache och således har Presler totalt 4MB, vilket gör den till den första desktop-processorn med så mycket minne.
Single core + HT
Hyper-Threading (HT) är en intressant feature som Intel har använt i sina P4-processorer sen Northwood-kärnan. När HT är aktiverat tror Windows att det finns två kärnor som kan utföra beräkningar. Tack vare denna simulering av en logisk kärna kan processorn stuva om lite som den vill när den ska beräkna flera olika saker, vilket gör att effektiviteten i processorn utnyttjas mer optimalt. Ett grafiskt exempel på detta kan vi se här.
Som vi ser klarar processorn med HT i vissa fall att utföra beräkningar effektivare jämfört mot samma processor utan HT, trots att det fortfarande bara finns en fysisk beräkningsenhet. Vad händer då när vi har två fysiska kärnor? Kika vidare.
Dual core
En dual core-processor har två fysiska beräkningsenheter som är helt frånskilda varandra. Detta innebär att processorn kan beräkna två olika saker samtidigt, vilket teoretiskt sett dubblar beräkningskapaciteten. För att ta vara på den extra beräkningskraften krävs att det flera trådar som körs samtidigt genom att köra flera program samtidigt eller använda flertrådiga program. Här ser vi en schematisk bild över skillnaden mellan en single core HT-processor och en dual core-processor.
Värt att notera är att HT endast ökar effektiviteten i processorn, den teoretiskt maximala beräkningskraften är fortfarande oförändrad. Anledningen till att HT fungerar bygger på att en processor i normala fall har en stor andel klockcykler där ingeting beräknas, till exempel att processorn väntar på data från cache-minnet, eller RAM-minnet. Med hjälp av HT kan man säga att processorn ges möjlighet att utföra andra instruktioner medans den väntar på data till andra instruktioner. Den logiska följdfrågan är: Kan man inte har HT på en dual core-processor?
Dual core + HT
Visst kan man det, och det är precis vad Intel har gjort med sin Extreme Edition-processor. Windows uppfattar nu 4st kärnor varav två alltså är fysiska och två stycken logiska, och så här ser det ut.
Den motsvarande schematiska bilden för hur trådar exekveras med både dual core och HT ser ut på följande vis.
Vi går vidare och kikar på fler features.
Enhanced Intel SpeedStep Technology (EIST)
EIST är något som kommer från mobila marknaden där processorern har möjlighet att klocka ner sig själv då det inte krävs full prestanda. EIST introducerades till desktop-marknaden i 600-serien där processorn ges möjlighet att ändra sin multipel från orginal (15x – 19x) ner till 14x. Detta sker vid väldigt låg belastning av processorn och så fort belastningen ökas så går multipeln tillbaka till sitt max-läge.
Extended Memory Technology (EM64T)
Intels utökning av 32bits-systemet till 64-bitar. Några av fördelarna med 64-bitsteknik är att mer minne kan addresseras (max för ett 32-bitarssystem är 4GB) och att man kan erhålla högre precision i beräkningar. För att dra nytta av dessa funktioner behöver man i likhet med AMDs Athlon64 ett 64-bitars operativsystem.
Execute Disable Bit (XD)
Funktion som begränsar området där programkod kan exekveras. Många av dagens virus utnyttjar svagheter i andra program för att själv kunna exekvera egen kod. Med XD kan processorn upptäcka detta och med hjälp av operativsystemet avsluta exekvering av viruset.
Vanderpool Technology (VT)
Teknik för att skapa virtuella system för att köra olika operativsystem eller utföra kritiska uppgifter frånskilt från andra delar av systemet. Program med ökade säkerhetskrav/sekretesskrav kan ges möjlighet att köra i en isolerad och säker miljö.
LaGrande Technology (LT)
LaGrande är ett samlingsnamn för en rad säkerhetsfunktioner som Intel planerar att införa på plattformsnivå. Det är alltså inte bara en feature i själva processorn utan även något som kommer att integreras i framtida moderkortskretsar.
Som vi ser gillar Intel att lägga till teknologier av olika slag. Många är relativt färska och ytterligare stöd för dessa kommer med framtida moderkortskretsar. Många av dessa nya tekniker går mer och mer mot något man kallar “Trusted Computing”,
där man på ett smidigt sätt försöker infoga allt från virusskydd till skydd mot piratkopiering direkt i hårdvaran.
Vi går vidare och kikar på vår testplattform.
Hårdvara | Intel | AMD |
Moderkort | Intel D975XBX (i975X) Asus P5WD2 (i955X) | Abit Fatal1ty AN8 SLI |
Processor | Intel 955XE, 3.46GHz Intel P4 660, 3.6GHz | AMD Athlon64 FX-57 |
Minne | Corsair XMS 5400UL (2x512MB) | Corsair XMS 3200 (2x512MB) |
Grafikkort | nVidia GeForce 7800GTX512 | |
Nätaggregat | OCZ PowerStream 520W | |
Mjukvara | ||
Operativsystem | Windows XP (SP2) | |
Drivrutiner | Intel Chipset Driver 7.2.2.1006 nVidia Forceware 81.95 nVidia nForce 6.67 | |
Monitoringprogram | Asus AI Booster | |
Testprogram | SiSoft Sandra 2005 SR3 SuperPi 1.4 3DMark2003 3.6.0 3DMark2005 1.2.0 AquaMark 3 VirtualDub 1.6.10, XviD 1.0.3 WinRAR 3.42 |
Definitioner | |
Idle | En timme i Windows utan belastning |
Load | En timme med fyra instanser av Prime95 |
Stabil | Inga fel rapporterade av Prime under load |
Multitasking | Tester utförda med en instans av SuperPi körande en 32M beräkning i bakgrunden |
Processortemperatur | Temperaturen i processorn som rapporteras av AIBooster |
Under våra tester kommer vi att simulera en multitaskingmiljö genom att köra en 32M-beräkning av SuperPi i bakgrunden. Då huvuddelen av dagens spel endast är enkeltrådiga kan vi på så sätt tydligare påvisa effekten av en processor med fler kärnor.
Effektutveckling är något som verkligen är på tapeten nu för tiden så vi börjar våra tester med att undersöka hur Intel har lyckats tämja strömförbrukningen med den nya tillverkningsprocessen.
Effektutveckling står högt upp på dagordningen hos både Intel och AMD och man jobbar hela tiden med att utveckla nya metoder för att minska energiförbrukningen hos sina kretsar. Att gå till en finare tillverkningsprocess brukar innebära lägre strömförbrukning och vi ska nu undersöka hur det är med den saken. Till vår hjälp har vi en Ampere-meter som är inkopplad innan nätaggregatet. Resultaten är alltså summan av vad hela datorn drar (ej inkluderat skärmen) och alltså inte bara processorn. Idle är strömförbrukningen utan belastning i Windows medans Load är med fyra instanser av Prime igång. Detta är för att vi verkligen ska belasta alla 4 logiska processorer som Windows uppfattar.
include_once("/public_html/dia.php"); ?>
do_diagram(1154); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1155); ?>
Det är inget snack om saken, Presler blir varm, precis som Prescott. Det är dock värt att notera att det är dubbelt upp av allting i Presler. En mer rättvis jämförelse hade naturligtvis varit mot Preslers föregångare, 800-serien, men någon sådan processor har vi tyvärr inte tillgång till.
Först ut av prestandatesterna är Sisoft Sandra och WinRAR.
Sisoft Sandra är en programsvit med en rad olika program för analys, diagnostik och sist med inte minst en uppsättning prestandamätande program för datorsystem. Det är det sistnämnda vi kommer att fokusera på här.
include_once("/public_html/dia.php"); ?>
do_diagram(1156); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1170); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1171); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1172); ?>
Som vi ser klarar Sisoft Sandra att utnyttja processorns båda kärnor och följdaktligen kör 955XE ifrån de enkelkärninga processorerna.
Vi går vidare till filpackning och videokomprimering.
WinRAR Benchmark ger ett mått på hur bra processorn är på att packa ihop filer men beror också en hel del på minnesprestandan i systemet.
include_once("/public_html/dia.php"); ?>
do_diagram(1161); ?>
Filpackning innebär mycket oregelbundna beräkningar vilket vi redan innan testet misstänkte att Intel’s processorer skulle få det mindre lätt med på grund av dessa långa pipeline. 955XE-processorn lyckas besegra den enkelkärniga P4:an trots avsevärt lägre klockfrekvens, men ingen av dessa rår dock på FX-57:an som drar nytta av sin kortare pipeline och inbyggda minneskontroller.
include_once("/public_html/dia.php"); ?>
do_diagram(1162); ?>
Intel har gjort bra ifrån sig tidigare i videokomprimeringstester och detta var inget undantag. Virtual Dub verkar vara flertrådad i sig, men att dömma av Aktivitetshanteraren så belastas endast en kärna fullt ut medans en annan belastas till 33%. Detta gör att vi får en aning fördel till processorer med fler kärnor, vilket resultatet visar. 955XE-processorn plockar hem titeln och lämnar 660:n och FX-57:an att slåss en mycket jämn fight om andraplatsen.
Här näst lite 3D-tester.
3DMark är det första man förknippar med benchmarking av datorer och inget test är komplett utan dessa.
include_once("/public_html/dia.php"); ?>
do_diagram(1173); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1174); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1175); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1176); ?>
3DMark2001 har alltid varit ett starkt kort för AMD’s Athlon64 processorer och FX-57:an är inget undantag. Vi blev dessto mer förvånade när 955XE-processorn visade så pass mycket bättre prestanda jämfört med 660-processorn trots de lägre klockfrekvenserna. En stor del av detta har troligtvis att göra med att 955XE-processorn har 266MHZ FSB medans P4:an bara har 200FSB. 3DMark03 är den version som varit mest jämn mellan Intels och AMD’s processorer och med alla processorer inom en 300-poängsradie från 20000 är det minst sagt jämnt. 955XE-processorn går vinnande ur fighten tätt följt av FX-57:an med 660:n strax bakom.
Vi går vidare och tittar hur processorern beter sig i några spel
Som speltester valde vi tre olika FPS-spel av olika karaktär. UT2004 som är ett äldre spel med lägre systemkrav, Far Cry som ett nyare och mer avancerat spel samt Doom3 som liknar det föregående fast är av OpenGL-typ.
include_once("/public_html/dia.php"); ?>
do_diagram(1177); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1178); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1179); ?>
I Unreal Tournament 2004 ser vi prestandamässiga likheter med 3DMark2001 där AMD är väldigt stark, följt av 955XE och P4 660. I Far Cry är det genast lite närmare och vi ser att FSBn hjälper 955XE-processorn att sniffa på FX-processorns spelprestanda. I Doom3 vinner 955XE över de båda andra processorerna med ganska god marginal och eftersom spel till stor del är enkeltrådiga misstänker vi att FSBn har stor inverkan för resultatet, vilket vi ska titta närmare på under överklockningsdelen.
Innan vi ger oss på överklockning ska vi se hur processorerna beter sig vid multitasking.
Dual CPU-system har varit vanligare i serversystem men börjar nu som sagt även ta fart på desktop-marknaden, då vanligast i form av dual core. Den direkta fördelen är som vi pratade om förut att det går att göra mer saker parallellt. Att göra en sak går inte snabbare, som vi har sett i testerna hittills, men vad händer om vi kör några tester tillsammans med någon annan belastning på systemet? Vi valde att köra några av våra testprogram igen tillsammans med SuperPi körandes en 32M-beräkning i bakgrunden.
include_once("/public_html/dia.php"); ?>
do_diagram(1180); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1181); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1182); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1183); ?>
Här ser vi inte minst Intels 955XE-processor komma väl till hands där prestandaförlusten endast varierar från 6% i bästa fall till 27% i Aquamark. När vi jämför de enkelkärniga processorerna ser vi tydligt nyttan med HT. P4 660 tappar 25-30% överlag medans FX-57:an inte riktigt gillar läget och tappar mellan 30% och 50% i dessa tester.
Vi kollar hur multitasking påverkar verkliga spel.
include_once("/public_html/dia.php"); ?>
do_diagram(1184); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1185); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1186); ?>
Scenariot återupprepar sig och 955XE-processorn plockar utan problem hem vinsten i alla multitasking-fall.
Dags för lite överklockning.
När processortillverkare går till en finare tillverkningsprocess brukar överklockare vakna till med varm nyfikenhet. Anledningen är att dessa processorer oftast går att just överklockas högre än dess tidigare syskon. 955XE-processorn släpps med endast 266MHz högre klockfrekvens än sin föregångare, 840XE, så vi valde att skruva upp klockfrekvenserna för att visa vad den verkligen går för.
På grund av tidsbrist i samband med recensionen har vi valt att vänta med våra extrema utsvängningar till en senare artikel, och därför endast fokusera på överklockning med orginalkylflänsen. Den kylfläns som skickas med 955XE har fått en rejäl ökning i massa med en mycket tjockare kopparkärna tillsammans med tunnare och tätare aluminiumflänsar (till höger i mittenbilden). Vi valde att inte röra spänningen till processorn som till standard är 1.3v och tack vare de fria multiplarna att bara ändra dessa för att minimera skillnaden i FSB.
Det gick bra att öka från 13x till både 14x, 15x och 16x, men 16x-multipeln och en resulterande klockfrekvens på 4256MHz var inte tillräckligt stabilt för att klara våra rigorösa stabilitetskrav bestående av fyra instanser av Prime. Temperaturen gick en bra bit över 70C och processorn började throttla för att hålla temperaturerna i schack. 15x-multipeln tillsammans med 266MHz FSB ger oss bekväma 4GHz som klarade alla våra krav på stabilitet.
Hur är det då med prestandan i överklockat läge?
Vi valde av flera anledningar att inte ta med några överklockade resultat med FX-57 processorn. En av dessa är att vi inte hade någon orginalkylfläns till denna, vilket skulle göra att den troligen skulle gå att överklocka högre jämfört med P4-processorerna. Vi har istället valt att koncentrera oss på vad den högre processorbussen har för inverkan på prestandan hos 955XE-processorn genom att köra P4:an i exakt samma konfiguration, samt självklart den överlag högre klockfrekvensen för båda processorerna. De överklockade resultaten på är utförda med båda processorerna i 267×15, vilket ger klockfrekvensen 4006MHz.
include_once("/public_html/dia.php"); ?>
do_diagram(1163); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1164); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1165); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1166); ?>
Det visade sig att nyckeln till prestanda inte bara beror på processorbussen utan även det faktum att processorn har dubbla kärnor. Detta kan låta konstigt eftersom vi tidigare sa att dessa tester endast är enkeltrådiga. Vad som är värt att notera är att även om själva testprogramet i sig är enkeltrådat så körs det i en flertrådig miljö, det vill säga Windows. Vitala bakgrundsfunktioner avlastas av processorer med fler kärnor och även dagens grafikdrivrutiner är optimerade för dessa processorer.
Vi tar och summerar vad vi har kommit fram till i slutledningen.
Intel fortsätter att utveckla sin P4/Netburst arkitektur och även om det på pappret bara ser ut som två ihopfogade 2MB Prescott-kärnor i ny tappning visar prestandasiffrorna att man har gjort vissa avsevärda förändringar. För att sammanfatta våra erfarenheter med denna processor är det några särskilda punkter vi vill trycka på.
Vi har redan sätt resultat från runt om på nätet att denna processor överklockar minst sagt bra med ordentliga kylanordningar, vilket är något vi har för avsikt att gå till botten med inom en inte allt för avlägsen framtid.
Det är dock vissa saker som processorn dras med, inte minst från Prescott-tiden.
Det är vida känt att Intel redan har en ny arkitektur med många av dessa punkter åtgärdade som troligen kommer att lanseras framåt mitten på år 2006. Vi ser med spänning fram emot vad den nya performance/watt-inriktningen Intel har att erbjuda processormarknaden.
Positivt: + Mycket god multitasking-prestanda + Mer prestanda per klockcykel jämfört med 800-serien + Överklockningspotential Negativt: – Effektutveckling – Troligtvis mycket dyr |
Vi vill tacka Intel som har skickat processor och moderkort för utvärdering och Corsair för att ha skickat minnen till testsystemet.