Tobias “Rauf” Bergström leder oss igenom processen och tankesättet som krävs för extrem överklockning när målet är att sätta världsrekord för hur långt datorhårdvara som Geforce RTX 5090 kan pressas.
Mitt namn är Tobias Bergström men går under alias Rauf i min semiprofessionella hobby att tävla i överklockning. I denna artikel tar jag er genom processen som ligger bakom att slå världsrekord med Nvidias senaste generations grafikkort RTX 5090.
Att tävla i överklockning, eller XOC (extreme overclocking), är inte precis en av de största sporter som finns men den har en stark tradition som kan spåras tillbaka till åtminstone 1980-talet.Men först och främst, vad är egentligen överklockning? Att tävla i överklockning handlar i de allra flesta fall egentligen om att tävla i datorprestanda. Överklockning är processen att få en datorkomponent att arbeta i en frekvens högre än den designades för, men slutmålet är såklart högre prestanda.
Som att trimma en bil
Jag brukar förklara tävlandet i överklockning genom att jämföra med bilar och rally. Man trimmar sina komponenter så långt man kan för att få dem att prestera bättre. Precis som med en motor så reagerar en datorkrets oftast bra på bättre kylning. Därför använder vi flytande kväve som kylmedel, eftersom det är prisvärt, lätt att hantera och förhållandevis säkert.
Utöver själva motorn i jämförelsen kopplar vi bort alla skyddsfunktioner som annars skulle kunna hämma prestandan. I rallyn försvinner airbags, hastighetsbegränsning, antisladd och autobroms. Inom XOC kopplar vi bort skydd som temperaturövervakning, spännings- och effektbegränsningar och liknande. Precis som rallyn där man studerar banan, lär sig de optimala hastigheterna och kurvtagningarna så lär vi oss inom överklockningen om de bästa operativsystemen och inställningarna för att hitta de snabbaste vägarna även här.
Själva tävlandet gör vi slutligen genom att mäta prestandan med olika benchmarks, där man får ett resultat som man sedan laddar upptill databasen hwbot.org. Där finns topplistorna och vi kan jämföra oss med personer från hela världen.
Hårdvaran
Jag har förmånen att efter många års tävlande ha sponsorkontakter för en del av hårdvaran som används. Ofta sker det i form av att hårdvara skickas hem till mig inför en lansering av en ny generation produkter. Ibland åker jag till deras R&D eller utvecklingslabb. Hårdvaran är ofta i form av “engineering samples” (ingenjörsexemplar), alltså inte helt färdig för marknaden och levereras utan kylare och kosmetiska tillbehör. I detta fall är det Galax som skickat exemplar av sina RTX 5090D Hall of Fame-grafikkort.
Innan överklockningen kan börja behöver komponenterna skyddas, och ibland modifieras något. Jag målar de delar som ska kylas för att skydda mot kondens och kortslutning p.g.a. vatten som frigörs vid de låga temperaturerna. I det här fallet har även grafikkortens effektmätning kortslutits, så att kortet inte ska kunna bli begränsat av att det slår i effekttaket.
Mjukvaran
Nästa steg är det mest tidskrävande, och en av de saker som det tar lång tid att bli riktigt bra på. Att optimera operativsystem och drivrutiner och få produkterna att prestera så bra som möjligt innan man ens börjar skruva upp frekvensen.
Vi kallar det effektivitet, även om det i vår mening inte har med prestanda per watt att göra, utan snarare prestanda per MHz. I vissa benchmarks kan det ha mycket stor betydelse och vissa finjusteringar är väldigt kreativa (och hemliga).
Första tester med flytande kväve
När jag känner mig nöjd med effektiviteten är dags för det första testet med flytande kväve. Ibland får vi lite guidning från en R&D-avdelning av vad vi kan vänta oss och vilka frekvenser, spänningar och temperaturer som bör fungera.
Ofta är det ändå relativt oprövad mark så det gäller att testa alla gränser och inte vara begränsad av information om hur någonting ”ska” fungera. Det kan skilja mycket mellan två exemplar av samma produkt.
I fallet med RTX 5090 så visar det sig att trots att i grunden och tillverkningsprocessen är mycket lik föregångaren RTX 4090 är det enorm skillnad på hur de fungerar med flytande kväve. RTX 4090 kunde kylas ner så långt som det var möjligt med flytande kväve (-196 °C), och fungerade bara bättre ju kallare det var.
För RTX 5090 stänger grafikkortet ner om kärnan blir under -40 °C (vi kallar det för ”cold bug”). RTX 5090 visar sig också ha en egenhet där frekvensen blir låst till maximalt 3 270 MHz om temperaturen på kärnan understiger 0 °C vid belastning. Det visar sig också att om temperaturen går under 0 °C så blir effektivitet mycket lidande.
För RTX 5090 handlar det alltså allt om att hitta rätt balans, rätt temperatur på kylaren som ger precis över 0 °C internt i kärnan. Rätt spänning som är tillräcklig för att hålla hög frekvens, men inte så hög att den dödar kortet eller så hög att det inte går att kyla det tillräckligt snabbt.
Vid överklockning med flytande kväve använder vi specialgjorda kopparbehållare som kylblock, som vi monterar på grafikkortet i detta fall. Sedan häller vi flytande kväve i behållaren för att kyla komponenten.
Ett stort problem med 5090-serien blir att flytande kväve inte är så reaktivt vid så pass höga temperaturer. Det kan låta ologiskt, men flytande kväve förångas långsamt vid förhållandevis höga temperaturer så som -40 °C, medan det börjar förångas väldigt fort när det möter en yta som är -150 °C eller kallare.
Vi vill att förångningen ska ske så snabbt som möjligt eftersom det ger bäst kyleffekt. Därav använder vi ett trick som motverkar Leidenfrost-effekten, genom att med hjälp av en gasbrännare se till att det bildas en isyta över kopparen i kylaren. Därmed minskas det värmeisolerande gaslagret som bildas när kvävet förångas och kylningen samt förångningen sker mer effektivt.
Trots detta är det ändå svårt att kyla kärnan tillräckligt fort, då effekten går från ca 150 W idle till över 1000 W omedelbart vid start av benchmark. För flera benchmarks finns även flera deltest, där GPUn går i idle mellan testerna. Då blir problemet omvänt, temperaturen tvärdyker när belastningen från första deltestet tar slut och jag måste tajma slutet av testet perfekt för att ha så lite flytande kväve som möjligt i kylaren och sedan snabbt bränna på med brännaren för att motverka att temperaturen är för låg när nästa test startat.
Val av kylare får stor påverkan för att kunna kyla kortet på ett bra sätt. Jag får prova mig fram mellan och hitta lämpligt förhållande mellan kylarens massa, interna struktur och kontaktyta.
En utmaning är också att belastningen under ett test inte är jämn, det kan skilja 300 – 400 W mellan olika sekvenser i testet. I bästa fall kan jag hålla temperaturen på kylaren jämn under testet, men när belastningen och effekten tidvis sjunker så minskar den interna temperaturen i kärnan, även om temperaturen i kylaren är konstant.
Här måste jag ha en liten marginal till den magiska gränsen på 0 °C, går temperaturen under, även om så bara någon sekund så är testet förstört. Dessutom så kommer kylaren vilja sjunka i temperatur när belastningen går ner eftersom den precis varit perfekt balanserad mot en högre effektutveckling.
Här gäller det att lära känna varje benchmark perfekt, så att effekttopparna och dalarna kan pareras. Effekttopparna är lika luriga, då temperaturen snabbt kan öka här och leda till att GPUn kraschar.
RTX 5090 – Få allt att klaffa
När jag lärt känna GPUn och vet vilken spänning, frekvens och temperatur som mitt exemplar gillar, hur jag ska parera de olika testerna och vilka operativsystem och inställningar som är de bästa, gäller det att få ihop helheten.
Här gäller det att para ihop GPUn med processor, moderkort och ramminnen som ger de bästa förutsättningarna för varje benchmark. Vissa test som t.ex. 3DMark Time Spy kräver mycket kraftfulla workstation-CPUer, medan andra tester kräver hög frekvens och snabba spelprocessorer och ramminnen. Då behöver även CPUerna kylas med flytande kväve och överklockas till bristningsgränsen.
Sammanfattningsvis är det såklart alltid kul att testa nya produkter och få chansen att pressa de till det yttersta som få andra kan. Även om RTX 5090 har ofördelaktig “cold bug” och sina andra egenheter vad gäller temperaturer, har det varit en lite mer intressant produkt att testa jämfört med de senaste generationerna.
Nvidias grafikkort har fungerat väldigt likt sedan 1080-serien kom, så lite omväxling förnöjer. Förhoppningsvis kan vissa av klurigheterna även försvinna med tiden med nya bios och drivrutiner.
Resultaten för min del har inneburit frekvenser på grafikkärnan på upp till 3 460 MHz och minnena på 2 250 MHz, att jämföra med standardfrekvenser på ca 2 700 MHz respektive 1 750 MHz. Vilket inte är så illa med tanke på den begränsade kylningsmöjligheten.
Jag har under de här första testerna slagit 7 världsrekord i olika benchmarks så som 3DMark, Superpositions och GPUPI. I skrivande stund innehar jag rekorden i 3 benchmarks, och hoppas på att kunna ta tillbaka några av de andra!