Intel har nu lanserat sin första processor med fyra fysiska kärnor och det nya flaggskeppet Core 2 Extreme QX6700 har kommit på besök i vårt testlabb. Vi kikar närmare på Intels fyrkärniga arkitektur och hur den nya processorn presterar.
Frekvenshysterin har i flera avseenden lagt sig när det kommer till processorer avsedda för persondatorer och processortillverkarna har blivit tvungna att hitta på andra metoder för att öka prestandan. En del i detta består av att optimera systemet runt omkring, som i flera fall är allt annat än blixtrande snabbt, och en annan angreppspunkt är flera kärnor. System baserade på två kärnor utgör redan idag, drygt ett år efter dess introduktion, en betydande del av det totala antalet som säljs. Tendenser i övriga mikroprocessorindustrin antyder också att ökad parallell prestanda tillhör framtiden och kommer att komma mer och mer.
Idag presenterar Intel den logiska fortsättningen för processorer med fler än två kärnor baserade på x86-arkitekturen, och på milstolpen står namnet som florerat i IT-nyheter under de senaste månaderna – Kentsfield. Från utvecklingsnamnet till den färdiga konsumentprodukten har förståss namnet byts ut för att ansluta sig till dess syskon i Core 2-serien av processorer. I affärer kommer Kentsfield att uppträda i två olika utföranden, båda med 4st fysiska kärnor, med produktnamnen Core 2 Quad och Core 2 Extreme, vilka också är de vi ska sätta under luppen här på Nordichardware idag.
Vi börjar med att kika på vad Kentsfield verkligen är.
Inom servermarknaden har vi under en längre tid sett lösningar med 2 eller flera sockets per moderkort, för att på så vis skapa system med flera kärnor. Dual socket kom även på P3-tiden till persondatorer, om än i väldigt begränsad utsträckning. En betydligt mer attraktiv lösning på detta var att skapa processorer med fler kärnor, men i en och samma förpackning. Dessa dual core dök upp på marknaden för drygt ett år sedan och presenterades i helt olika lösningar från Intel och AMD. Intel valde att helt enkelt fysiskt sätta två processorkärnor bredvid varandra (kallat “dual die”), medans AMD valde att sätta de båda kärnorna i samma chip (“single die”). I och med lanseringen av dual core processorn Conroe gick även Intel över till en lösning med endast ett chip. Nu är vi alltså framme vid Kentsfield som återanvänder metoden från Intels första dual core-processorer, till att skapa en dual die, quad core-processor. För att få en tydligare överblick sammanfattar vi det i följande tabell.
Processor | Utvecklingsnamn | Kiselchip | Fysiska kärnor | Logiska kärnor | |
Celeron | Northwood/Prescott | 1st | 1st | 1st | |
Pentium4 400/533FSB | Willamette/Northwood | 1st | 1st | 1st | |
Pentium4 800FSB | Northwood/Prescott/Cedarmill | 1st | 1st | 2st (HT) | |
Pentium D | Smithfield/Presler | 2st | 2st | 2st | |
Pentium D Extreme Edition | Smithfield/Presler | 2st | 2st | 4st (HT) | |
Core 2 Duo | Conroe | 1st | 2st | 2st | |
Core 2 Quad | Kentsfield | 2st | 4st | 4st | |
Den uppmärksamme erinrar sig om att det finns några undantag, men det är endast ett fåtal processorer som vi inte kommer att utöka tabellen med. |
Som vi ser har Intel haft lite olika angreppssätt för att skapa flerkärniga processorer genom tiderna. Fördelen med att helt enkelt bara sätta två chip intill varandra är just det att man kan använda sig av redan existerande chip, och man behöver således inte skapa en helt ny krets vilket är extremt kostsamt. En nackdel med denna metod är att dessa kärnor kommunicerar med omvärlden över FSB-gränssnittet, vilket också blir det gränssnittet som kärnorna blir sammankopplade. FSBn är som vi vet till för att kommunicera med Nordbryggan på dagens moderkort, och i sin tur RAM-minnet, och är inte riktigt gjord för de extrema överföringshastigheter två kärnor skulle vilja kommunicera med varandra i.
Conroe däremot, designades från grunden till en dual core-processor i ett och samma kiselchip där även kärnorna delar en stor nivå-2-cache (L2-cache). Nu kan kärnorna kommunicera och utbyta data mellan varandra via den mångfalt gånger snabbare L2-cachen, vilket ökar prestandan avsevärt på detta området.
Men i väntan på en fyrkärnig processor i ett och samma chip, varför inte använda den tidigare beprövade tekniken? Svaret blev Kentsfield.
Kentsfield är alltså utvecklingsnamnet för Intels första processor med fyra fysiska kärnor för persondatorer. Vi skriver just fysiska kärnor med anledning av Intels tidigare dubbelkärniga processor Smithfield/Presler, som för varje kärna även hade HyperThreading, vilket på mjukvarunivå uppfattades som fyra stycken logiska processorkärnor. Trots fyra kärnor är det inget som vid första anblick skiljer processorn från andra Socket775-processorer, som vi kan se ovan.
På baksidan av processorn ser vi några minimala skillnader mot i detta fall en Core 2 Extreme X6800. Vissa kondensatorer och motstånd har möblerats om, vilket dock varken är begränsat till fyrkärniga processorer, eller enskilda processorer heller för den delen. Mellan olika steppinguppgraderingar har vi också sett förändringar bland dessa. På tredje bilden ser vi att man har varit tvungen att lägga till några lager ledningsbanor för kommunikation mellan de olika kärnorna. Den allra största skillnaden jämfört med dess syskon i Core 2-serien är vad som sitter under värmeplåten.
Bildkälla: www.thetechrepository.com |
Här ser vi tydligt skillnad mellan till vänster en processor med ett enkelt kiselchip och till höger en processor med dubbla kiselchip. För att förtydliga informationen från tidigare tabell så är alltså Smithfield, Presler och Kentsfield alla tillverkade enligt den högra principen och det som skiljer Kentsfield från de andra två är att vardera av de två chipen innehåller två kärnor.
Vi fortsätter vår studie av Kentsfield.
Eftersom Kentsfield helt enkelt är två Conroe-kärnor i samma förpackning skiljer det sig inget arkitekturiellt utöver det faktum att det nu är frågan om två sådana kretsar. Vi har tidigare gått igenom denna arkitektur och hänvisar intresserade läsare att besöka den för att få mer ingående förklaringar.
:: Klicka här för att läsa mer om Core-arkitekturen ::
Här ovan ser vi en enkel skiss över hur Kentsfield är uppbyggd jämfört med Conroe. De långstreckade linjerna visar schematiskt var gränsen mellan processor och övriga systemet går och de mindre streckade visar var gränsen för de fysiska kärnorna går. Vad vi försöker illustrera här är dels hur de båda separata paren av kärnor kommunicerar med varandra i Kentsfield, och att detta gränssnitt även står för kommunikationen med övriga systemet. Vi inser rätt snart att de två paren kommunicerar snabbt med varandra inbördes, men inte fullt lika snabbt mellan paren. Hur detta påverkar prestandan är något vi kommer att försöka undersöka i våra prestandatester längre fram i artikeln.
Modell | QX6700 | Q6600 | X6800 | E6700 | E6600 | E6400 | E6300 |
Utvecklingsnamn | Kentsfield | Kentsfield | Conroe | Conroe | Conroe | Conroe | Conroe |
Kärnor | 4 | 4 | 2 | 2 | 2 | 2 | 2 |
Frekvens | 2.67GHz | 2.40GHz | 2.93GHz | 2.67GHz | 2.40GHz | 2.13GHz | 1.86GHz |
Systembuss | 1066FSB | 1066FSB | 1066FSB | 1066FSB | 1066FSB | 1066FSB | 1066FSB |
Multipel | 10x | 9x | 11x | 10x | 9x | 8x | 7x |
L2-Cache | 2x4MB | 2x4MB | 4MB | 4MB | 4MB | 2MB | 2MB |
Effektutveckling | 120W | 100W | 80W | 65W | 65W | 65W | 65W |
Kentsfield lanseras nu den 2:a november och förväntas finnas att köpa den 14:e november, då i Extreme Edition-versionen XQ6700 och efter nyår i form av Q6600. Båda dessa använder sig av 266MHz/1066FSB och med 4MB L2-cache per kärn-par som ger en häpnadsväckande total mängd på 8MB. Värmeutvecklingen är av förståeliga skäl högre, vilket vi också ska undersöka närmare senare i artikeln.
Nu är det dags att sätta igång testandet.
Hårdvara | ||
Moderkort | Asus P5W64 WS Professional | |
Processor | Intel Core 2 Extreme QX6700 Intel Core 2 Extreme X6800 Intel Core 2 Duo E6300 | |
Minne | OCZ PC6400 ATI CrossFire Edition | |
Grafikkort | nVidia GeForce 7900GT | |
Nätaggregat | OCZ PowerStream 520W | |
Mjukvara | ||
Operativsystem | Windows XP (SP2) | |
Drivrutiner | Intel Chipset Driver 8.1.1.1001 | |
Grafikdrivrutiner | nVidia ForceWare 91.47 | |
Testprogram | SiSoft Sandra 2005 SR3 3DMark2001 3.3.0 3DMark03 3.6.0 3DMark05 1.2.0 3DMark06 1.0.2 PCMark05 1.1.0 AquaMark 3 WinRAR 3.60 cinebench 9.5 Lame 3.97 FarCry 1.33 Doom 3 Quake 4 |
På grund av den korta tiden vi haft med processorn är antalet referensprocessorer något begränsade, av samma anledning har vi inte lyckats ta fram testmiljöer som i större utsträckning drar nytta av flera trådar. Alla processorer är testade i samma moderkort med samma hårdvara och inställningar. Det enda vi har gjort är att byta processor och ändra multiplar i BIOS. Vi har med hjälp av QX6700-processorn simulerat Q6600-modellen genom att ställa ner multipeln med ett steg och det samma gäller för E6700 och E6600 som har simulerats med hjälp av X6800-processorn. Vi har även tagit med en E6300 som är den lägst modellen i Core 2-serien, och då med endast 2MB cache. Grafikinställningarna har lämnats till standard-inställningarna för drivrutinen och inte ändrats under testets gång.
Vi sätter igång och kör några syntetiska tester.
include_once("/public_html/dia.php"); ?>
do_diagram(1622); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1623); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1624); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1625); ?>
Sisoft sandra behöver inte säga mycket om den vardagliga prestandan i processorer, men det ger en indikation på vad för sorts prestanda som finns tillgänglig ifall alla applikationer vore kraftigt flertrådade. Den senaste versionen av Sisoft Sandra hade vissa tendenser till att inte riktigt känna av quad core-processorerna helt korrekt, och gav i vissa fall aningens irrationella resultat. När allt dock fungerade som det skulle såg vi en tydlig prestandaskillnad mellan 2 och 4 kärnor.
Vi går vidare till Everest.
include_once("/public_html/dia.php"); ?>
do_diagram(1631); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1632); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1633); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1634); ?>
Everest har ett antal test för att mäta prestandan i processorn. Som vi ser på resultaten kan vi helt klart konstatera att dessa är flertrådade och således en lätt match för Core 2 Quad-processorerna att plocka hem vinsterna här. Vi är väldigt nära en dubblering av resultaten vid samma klockfrekvenser när man jämför QX6700 mot E6700 och Q6600 mot E6600, vilket tyder på att vi har väldigt små dataset, och väldigt få beroenden mellan trådarna. Ju mer flertrådade program, dessto mer prestanda finns det helt klart att hämta.
Vi går vidare till några mer praktiska testprogram.
include_once("/public_html/dia.php"); ?>
do_diagram(1626); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1627); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1628); ?>
I WinRAR ser vi också en tydlig skillnad ner mot de tvåkärniga processorerna. Det positiva med de flertrådiga program som skapas idag är att de i de flesta fall inte bara går från att vara enkeltrådiga till dubbeltrådiga, utan till generellt flertrådiga. Detta leder till att fyrkärniga processorer, och ännu fler kärnor i framtiden, ger fortsatta prestandaökningar. I Cinebench ser vi också en god ökning av prestandan och från 1 tråd till flera ökar de dubbelkärniga processorerna renderingshastigheten med ungefär 87%, medan de fyrkärniga med cirka 210%. Från det ideala fallet på 100% respektive 300% ser vi att det inte går att ta vara på prestandan fullt ut, då kärnorna delar på resurser som cache, FSB och minne. Detta är ett generellt problem för flerprocessorsystem och återfinns mer eller mindre i alla sorters system med flera kärnor/processorer.
Vi tar och kikar lite på MP3-komprimering.
include_once("/public_html/dia.php"); ?>
do_diagram(1629); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1630); ?>
Här ser vi ett tydligt exempel på en applikation som inte är mer än två-trådad. Just media-komprimering är ett synnerligen svårt område att skapa flertrådade program på grund av komprimeringsalgoritmerna. Ljud och bild komprimeras oftast i förhållande till hur ljudet/bilden ser ut i övriga filen, vilket gör att det inte bara är att dela filen och låta varsin tråd komprimera varsin del. Vi ser därför ingen prestandavinst när vi går från två till fyra kärnor.
Härnäst testar vi 3DMark.
include_once("/public_html/dia.php"); ?>
do_diagram(1637); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1638); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1639); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1640); ?>
Ingen av dessa testprogram är i någon större utsträckning flertrådade, förutom ett undantag – 3DMark06s CPU-test, vilket vi tydligt ser i graferna. Rent teoretiskt borde vi får samma prestanda vid samma klockfrekvens i de övriga programet, men som vi ser så halkar quad core-processorerna efter dual core-varianterna i 3DMark2001 och 3DMark03, om än med små marginaler. Vi körde dessa tester ett par extra omgångar, med ofärändrad utgång. Vad detta beror på har vi inte lyckats fastställa, men vi kommer att fortsätta undersöka den saken.
Vi tar och tittar lite närmare på processorprestandan i 3DMark06 och även PCMark05.
include_once("/public_html/dia.php"); ?>
do_diagram(1641); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1642); ?>
Här ser vi tydligt hur CPU-testet i 3DMark06 är flertrådat och quad core-processorerna presterar långt bättre än de två-kärniga. PCMark05s CPU-test har flera olika moment där vissa är enkeltrådiga, vissa är dubbeltrådiga, samt några flertrådade. Vi ser således inte en lika stor prestandaökning när vi går från två kärnor till fyra jämfört med CPU-testet i 3DMark06.
Härnäst står några spel på tur.
include_once("/public_html/dia.php"); ?>
do_diagram(1643); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1644); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1645); ?>
Farcry är kraftigt begränsat av grafikkortet med det här systemet och det är bara E6300-processorn som inte gör 7900GT-kortet till flaskhals. Det samma gäller stort sett för Doom 3 också där det också bara är E6300-processorn som avviker från de högre resultaten. I Quake 4 har vi ett lite större spann, men vi ser att klockfrekvensen är den avgörande faktorn och inte tillgången på fler kärnor.
Slutligen tar vi och kikar på effektutvecklingen hos processorerna.
Vi mätte systemets totala effektutveckling med en amperemeter kopplad innan nätaggregatet. Således är det alltså hela systemets effekt som tas med. För att belasta processorn till load-testerna använde vi oss av flera instanser av Prime.
include_once("/public_html/dia.php"); ?>
do_diagram(1635); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1636); ?>
Effektutvecklingen är som vi kan se betydligt högre hos quad core-modellerna under full belastning. Här får vi dock vara tydliga att påpeka att det också vid full belastning är frågan om den dubbla prestandan. I normala system kommer man troligen aldrig att komma i närheten av dessa siffror. Vi ser att effektutvecklingen är högre än skillnaden mellan TDP hos processorerna vilket till viss del beror på att det övriga systemet, så som FSB och minne, belastas mer med quad core-processorerna. En annan aspekt är att vi får högre förluster i moderkortets spänningsdel vid högre belastning. Man ska alltså ta dessa siffror med en nypa salt.
Vi tar och sammanfattar våra upplevelser med Core 2 Quad i slutledningen.
Prestanda
Som vi har sett i de olika testerna glänser Core 2 Quad absolut mest i tunga multitasking-miljöer, vilket är föga förvånande. På grund av den lägre klockfrekvensen jämfört med X6800 så hänger inte riktigt QX6700 med när det kommer till program som endast använder sig av en eller två trådar. FSBn som dels används mellan kärnorna men också till nordbryggan, och i sin tur RAM-minnet gör att processorn inte riktigt har möjlighet att utnyttja sin fulla potential. När valet står mellan QX6700 och X6800 bör användaren fundera över vad processorn i huvudsak ska användas till. För riktigt tung multitasking är QX6700 ett givet val, medans applikationer och spel där klockfrekvens har en mer avgörande faktor ger fördel till X6800.
Effektutveckling
Ökad prestanda kommer logiskt sett inte gratis när det gäller energiförbrukning hos processorerna. Som vi ser i våra effektmätningar för hela systemet drar quad core-processorerna betydligt mer ström än dess dual core-syskon, med ökad värmeutveckling som följd. Vi har inte haft möjlighet att testa Intels nyutvecklade kylare för Quad-seriens processorer som är består av en heatpipe-lösning, för att hålla temperaturerna i schack. Vi körde alla tester med en Zalman CNPS-9500, som inte hade några problem att kyla någon av processorerna, vilket torde gälla övriga eftermarknadskylflänsar i prestandasegmentet.
Kompatibilitet
Core 2 Quad processorerna kräver inga nya moderkort, utan alla kort som i dagsläget stödjer Core 2 Duo ska även ha möjlighet att stödja Core 2 Quad. De moderkort som innefattas av detta är de baserade på i975X- och P965-chispeten, men i vissa fall kan det krävas en BIOS-uppdatering för fullt stöd. I dagsläget har vi hittills testat Intels BadAxe2, Asus P5W64 WS Proffesional, Abit AW9D-MAX, vilka alla fungerar med senaste BIOS-uppdateringarna. Intel anger också att första generationen BadAxe också stödjer processorn från och med revision 304, med uppdaterad BIOS.
Överklockning
En utförlig överklockningssammanfattning har vi tyvärr inte hunnita med till denna artikel, men undertecknad har tillsammans med Marcus ‘Kinc’ Hultin och Andreas ‘Delph1’ Galistel besökt Intels eget lab i Kista norr om Stockholm under den gångna helgen och minst sagt maserat QX6700. Håll ögonen öppnar efter en utförlig överklockningsartikel inom en snar framtid. Vi kan redan nu avslöja att processorn har mycket god marginal med flertalet tyngre kylanordningar.
Tillgänglighet/Pris
Intel har angett att Core 2 Extreme QX6700 processorn ska finnas i butiker den 14:e november i gott antal, men då det är frågan om en entusiastprocessor kommer den troligen inte att sälja i ett lika stort antal som de mindre modellerna. Vi har inte fått någon exakt prisuppgift, men Extreme-serien brukar landa på mellan 9000 och 10000kr, och denna lär inte vara undantagen från den regeln. Q6600-modellen kommer inte att dyka upp på marknaden förrän under första kvartalet 2007 med de specifikationer vi har presenterat tidigare. Det är också för tidigt att spekulera kring priset på den modellen.
Sammanfattning
Det är ingen tvekan om att Intel återigen har släppt en prestandaprocessor för persondatorer som ger nya möjligheter för användare med tunga krav på flertrådad prestanda. Vi ser att spel i dagsläget inte riktigt har förmågan att utnyttja denna processors utökade kraft, något vi är övertygade om kommer att förbättras i framtida spel, vilket är ytterligare ett argument för Core 2 Quad-processorerna.
Intel Core 2 Quad Q6600 | |
Positivt Negativt |
Vi vill tacka Intel, Asus och Overclockers.se för hårdvara till detta test.