Att reducera mängden L2-cache har länge varit ett sätt för tillverkarna att reducera tillverkningskostnaden för en CPU och det har länge diskuterats hur stor roll L2-cachen spelar. I denna artikel går vi till botten med en lång rad tester som visar svart på vitt var och när L2-cachen hos Core-arkitekturen spelar en signifikant roll.
Andra nivåns minne till en processor, kortare kallat L2-cache, har varierat kraftigt under de senaste åren. En stor mängd minne av denna typ förbättrar prestandan hos processorn då den slipper efterfråga information från RAM-minnet, som är mångfalt långsammare. På forn-dator-tiden satt detta minne på moderkort för att sedan, allt eftersom kravet på latenser och snabbhet ökade, flyttas närmare och närmare processorn. Nuförtiden är L2-cachen inte bara en del av kislet, utan den utgör en majoritet av det totala antalet transistorer som en processor är uppbyggd av. Detta är en anledning till att det inte är lönsamt att stoppa in hur mycket minne som helst i en processor – andelen processorer utan defekter minskar i takt med att mängden transistorer ökar. Men på samma gång förfinas hela tiden tillverkningsprocessen och därmed också antalet fullt fungerande processorer. Ett resultat av detta är när tillverkarna lanserar processorer med mer cache även i de lägre prissegmenten.
Om man leker med tanken går det förstås alldeles utmärkt att ta bort allt minne för att tillverka en väldigt billig processor. Inte nog med att den blir billig, den blir också extremt långsamt. Men hur stor inverkan har egentligen andra nivåns minne i dagens Core 2 Duo-processorer? Vi på NordicHardware har samlat ihop tre stycken processorer med 4MB, 2MB respektive 1MB för att undersöka saken grundligare.
Vi börjar med att redovisa testsystemet.
Hårdvara | ||
Moderkort | Abit IP35 Pro | |
Processorer | Intel Core 2 Duo E6320 (4MB) Intel Core 2 Duo E6300 (2MB) | |
Minne | Corsair Dominator 8500C5DF (2048MB) | |
Grafikkort | nvidia GeForce 8800GTX | |
Nätaggregat | Silverstone Zeus 850W | |
Mjukvara | ||
Operativsystem | Windows XP (SP2) | |
Drivrutiner | Intel Chipet Driver 8.3.0.1013 nvidia Forceware 158.22 | |
Testprogram | EVEREST Ultimate Edition 4.00.976 SuperPi 1.5 wPrime 1.52 Cinebench 9.5 Lame 3.97 WinRAR 3.70 3DMark2001 3.3.0 3DMark03 3.6.0 3DMark05 1.2.0 3DMark06 1.0.2 PCMark05 1.1.0 FarCry 1.33 Doom 3 Quake 4 |
Moderkortet vi har använt oss av för alla tester är ett Abit IP35 Pro,
baserat på P35-styrkretsen. För att göra testerna så exakta som möjligt
ställdes multipel och FSB till exakt samma värde, oavsett de olika
processorerna utgångshastigheter. Alla tester kördes i 7×333 som ger en
processorfrekvens på 2.33GHz, som i dagsläget motsvaras av en Core 2 Duo
E6550. Detta innebär att det enda som skiljer de olika testerna åt är mängden
L2-cache.
:: Intel Core 2 Duo E6320 Validering ::
:: Intel Core 2 Duo E6300 Validering ::
:: Intel Pentium E2140 Validering ::
Först ut, ett antal syntetiska tester.
include_once("/public_html/dia.php"); ?>
do_diagram(1846); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1847); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1848); ?>
Everests renodlade CPU-tester ger inte upphov till några överdrivna skillnader. I Queen och Zlib påverkas prestandan inte alls av mängden L2-cache, medan PhotoWorxx visar en förbättring på runt 8% tack vare den fyrdubbla cachen.
Vi går vidare till välkända SuperPi.
include_once("/public_html/dia.php"); ?>
do_diagram(1849); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1850); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1851); ?>
SuperPi skalar fint med mer tillgänglig cache och tydliga skillnader syns redan under 1M-beräkningen. 2MB-versionen gör jämförbart bra ifrån sig, medan 1MB-processorn halkar betydligt efter.
Vi går vidare till wPrime och Cinebench.
include_once("/public_html/dia.php"); ?>
do_diagram(1852); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1853); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1854); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1855); ?>
Idén bakom wPrime är lik SuperPi, men den skillnaden som gör programmet
intressant för oss är att den utnyttjar alla tillgängliga processorkärnor. Då
alla modeller delar den totala mängden minne mellan kärnorna hade vi
förhoppning att se stora skillnader mellan de olika processormodellerna. Som
vi kan se ovan så berörs slutresultatet högst nämnvärt, väl inom
felmarginalen för testet. Prestandaskillnaden i Cinebench är ytterst små men
ger ändå en liten fördel till processorerna med mer cache.
Vi går över till några mer praktiska tester.
include_once("/public_html/dia.php"); ?>
do_diagram(1856); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1857); ?>
Vi har tidigare konstaterat att det är svårt att skaka fram prestanda ur Lame utan att höja processorfrekvensen, vilket också visade sig vara fallet med mängden L2-cache. WinRAR å andra sidan hungrar allt som oftast efter bandbredd och kan påvisa extrema prestanda-ökningar från minimala skillnader i inställningar. Att gå från 1MB L2-cache till 4MB ökar prestandan med runt 14%.
Vi går vidare till 3DMark-serien av prestandatester.
include_once("/public_html/dia.php"); ?>
do_diagram(1858); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1859); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1860); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1861); ?>
3DMark2001 brakar in med en häpnadsväckande prestandaskillnad på 20% medan de övriga programmen fortfarande ger en hälsosam ökning på mellan 5 och 8%. Vi börjar se tendenser till att ju mer slumpartade testprogram vi kör, desto mer utmärker sig mer minne. Vi har några tester kvar för att se hur den tesen står sig.
3DMark06 CPU och PCMark05 står på tur.
include_once("/public_html/dia.php"); ?>
do_diagram(1862); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1863); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1864); ?>
Här ser Vi klart och tydligt att mängden minne inte bara hjälper i processorintensiva tester som 3DMarks CPU-test, utan även i de övriga deltesterna. Prestandaskillnaden i CPU-testet är endast runt 2% medans det totala resultatet för hela 3DMark06 gick upp 5%. Processortestet i PCMark05 påvisar minimala skillnader medan minnestestet ger en fördel till 4MB processorn med 3%.
Vi rundar av testsessionen med några spel.
include_once("/public_html/dia.php"); ?>
do_diagram(1865); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1866); ?>
include_once("/public_html/dia.php"); ?>
do_diagram(1867); ?>
Att tro att sådana till synes marginella skillnader som någon MB minne hit
eller dit i processorn skulle göra några markanta skillnader, i annat än
syntetiska tester, visar sig här vara helt falskt. Här ser vi
nämligen prestandaökningar på mellan 15% och 22%. 2MB-modellen ligger relativt stadigt mitt emellan de två andra modellerna, och prestandamarginalen varierar lite från spel till spel.
Vi sammanfattar våra upplevelser i slutledningen.
Prestanda
Den inverkan som L2-cachen har på systemets prestanda beror på vad för sorts program som körs. Det går inte att säga att en viss typ av program generellt presterar bättre med mer minne än andra, utan det beror på hur programmet är uppbyggt och vilken mängd data som krävs för dess beräkningar. Vad vi dock kan säga är att prestandaökningarna som erhålls när man går från 1MB till 4MB inte bara märks i vissa extrema fall, utan även i allt från alldagliga program till både nya och äldre spel.
Produktvärde
Något vi inte har tagit upp hittills i artikeln är prisläge på processorerna. En direkt jämförelse är inte möjlig då det inte finns någon gemensam hastighet i produktsortimentet. Den kanske bästa jämförelsen torde stå mellan E6320, E4300 och E2160. Bästa pris i dagsläget är 1430kr, 1026kr respektive 783kr. Pratar vi prestanda per krona vinner E2160 utan tvekan, som inte kostar mycket mer än halva priset av E6320-processorn. E6320-processorn ger mervärde på prestandafronten i form av högre initial busshastighet för den som inte överklockar. Börjar vi prata överklockning är vi återigen tillbaka för att rekommendera de mindre modellerna, på grund av dess högre multiplar.
Framtid
För tillfället ser vi ett ställningskrig på processormarknaden där både Intel och AMD gör sig färdiga att släppa nya processorer på marknaden. En intressant koppling till denna artikel är att Intel kommer att upprusta sin Core 2 Duo-serie processorer med ytterligare 2MB, till totalt 6MB. Även fast vi inte kan förvänta oss en linjär prestandaökning från dagens 4MB-modeller så är vi rätt säkra på vår sak när vi säger att en hel del 3DMark-rekord kommer att gå upp i rök. Preliminära testresultat från nätet förstärker också dessa antaganden.
Sammanfattning
Intel har konstant breddat sitt sortiment baserat på Core 2 Duo-kärnan sen lanseringen för ett år sedan. Utbudet runt 2GHz har aldrig varit större när det gäller arbetsfrekvenser, bus-frekvenser och L2-cache. När vi fixerar alla variabler utom just L2-cachen kan vi fortfarande påvisa prestandaskillnader på över 20% i flertalet fall. Är prestanda viktigt är det E6000-serien som gäller. Är pris viktigast är det E2000-serien. E4000-serien erbjuder en mix av dessa och är med sina höga multiplar lockande för prismedvetna överklockare.
Intel Core 2 Duo E6000-serien Intel Core 2 Duo E4000-serien Intel Pentium E2000-serien |
Vi vill tacka Intel Sverige och Overclockers.se för utlåning av processorer.