Nvidia Geforce GTX 780 Ti - GK110 i sin fulla prakt
GK110 har vuxit upp
Den krets som huserar i hjärtat av GTX 780 Ti bygger på den GK110-krets som introducerades med GTX Titan, men med vissa justeringar utöver det extra aktiverade SMX-klustret. Kretsen går under namnet GK110b, och på den här sidan kommer vi gå igenom grafikkortets tekniska nyheter och jämföra med de tidigare toppmodellerna.
Även om grafikkretsen är uppfräschad så rör det sig i grunden fortfarande om Kepler-arkitekturen. Ett av Nvidias paradnummer med Kepler är att den är väldigt skalbar, och kan implementeras i allt från Tegra-processorer upp till kraftfulla Quadro och Tesla för arbetsstationer, servrar och superdatorer.
I inkarnationen GK110 innehåller grafikkretsen upp till 5 processorkluster, vart och ett innehållande tre Streaming Multiprocessors, eller SMX-kluster. Det ger en total mängd på upp till 15 SMX-kluster, där varje kluster innehåller 192 CUDA-kärnor för singelprecision och 64 för dubbelprecision. I GTX Titan är ett av dessa kluster deaktiverat, och i GTX 780 är ytterligare två deaktiverade. I GTX 780 Ti är däremot samtliga aktiva.
GTX 780 | GTX 780 Ti | GTX Titan | |
Grafikkrets | GK110 | GK110b | GK110 |
Tillverkningsprocess | 28 nm | 28 nm | 28 nm |
Kretsyta | 551 mm2 | 533 mm2 | 551 mm2 |
Transistorer | 7,1 miljarder | 7,1 miljarder | 7,1 miljarder |
Kärnor | 2 304 SP 768 DP |
2 880 SP 960 DP |
2 688 SP 896 DP |
Grafikminne | 3 GB GDDR5 | 3 GB GDDR5 | 6 GB GDDR5 |
Minnesbuss | 384 bit | 384 bit | 384 bit |
Klockfrekvens | 863 MHz bas 900 MHz boost |
876 MHz bas 928 MHz boost |
837 MHz bas 876 MHz boost |
Minnesfrekvens | 1 502 MHz 6 008 MHz effektivt |
1 750 MHz 7 000 MHz effektivt |
1 502 MHz 6 008 MHz effektivt |
Texturenheter | 224 | 240 | 224 |
ROPs | 48 | 48 | 48 |
Bandbredd | 288 GBps | 336 GBps | 264 GBps |
Flyttalsprestanda | 3,9 TFLOPS | ~5,7 TFLOPS | 4,5 TFLOPS |
Anslutning | PCIe 3.0 | PCIe 3.0 | PCIe 3.0 |
Titan kvar som kung av dubbelprecision
Som tidigare nämnt så har GK110b samtliga 15 SMX-kluster aktiva, vilket innebär 2 880 CUDA-kärnor för singelprecision och 960 för dubbelprecision, fler än både GTX 780 och Titan med deras 12 respektive 14 aktiverade kluster. Det extra klustret medför dessutom ytterligare 16 texturenheter för totalt 240 stycken. Särskilt intressant är att Nvidia trots fler aktiva komponenter och bibehållen tillverkningsprocess på 28 nanometer lyckats minska kretsytan med 18 kvadratmillimeter.
Däremot innebär inte mängden kärnor för dubbelprecision att kortet kommer riktas mot den typen av beräkningar. Enligt Nvidia är kortets dubbelprecisionsprestanda begränsad trots mängden kärnor, och den som är ute efter att göra tunga GPGPU-beräkningar med dubbelprecision bör istället kika på GTX Titan eller Quadro-lösningar. Däremot ska den begränsade dubbelprecisionsprestandan inte påverka kortets prestationer i spel eller andra grafiska belastningar.
Kortet fortsätter använda sig av 384-bitars minnesbuss, men med hjälp av en knuff i klockfrekvenser har Nvidia lyckats få upp bandbredden avsevärt. GTX 780 Ti ska klara av upp till 336 gigabyte per sekund och därmed ta sig förbi konkurrenten Radeon R9 290X. Även flyttalsprestandan har dragit nytta av de högre frekvenserna och det extra SMX-klustret och ska nu ligga på omkring 5,7 TFLOPS.
GPU Boost 2.0 och Power Balancing
För att få upp kortets Boost-frekvenser har Nvidia implementerat version 2.0 av sin GPU Boost-teknik, som helt enkelt ska vara en bättre och effektivare variant av Boost-funktionaliteten hos de tidigare grafikkorten.
Kortet kring GK110-kärnan är fortfarande väldigt snarlikt det hos traditionella GTX 780. Dock har Nvidia passat på att uppdatera kortet med en ny strömförsörjningsdel för att bidra till effektiviseringen och ge mer utrymme för överklockning.
Det nya strömförsörjningssystemet kallas power balancing eller strömbalansering. Vid normal drift drar grafikkortet sin strömförsörjning från tre källor; de två PCIe-strömportarna samt PCIe-kanalerna. Vid överklockning ökar kortets strömförbrukning, men det sker inte nödvändigtvis med jämn fördelning mellan de olika strömkällorna.
Det är det Nvidia vill råda bot på med strömbalansering, som ser till att strömmen kan vägas dynamiskt mellan källorna och därmed minska risken att man slår i taket för en av dem. Det ska i sin tur leda till en högre överklockningspotential. Tekniken kommer finnas med på alla varianter av GTX 780 Ti, både referensmodellen och partnertillverkarnas egna inkarnationer.
Nvidia G-Sync – Grafikkortet tar spakarna för uppdateringsfrekvensen
Ett vanligt förekommande problem för datorspel idag är vad som kallas för screen tearing. Fenomenet beror, bland annat, på att en datorskärm har ett fast värde för sin uppdateringsfrekvens. Det värdet kan exempelvis vara 60 eller 120 hertz, och ger varje bildruta skickad från grafikkortet en viss tid på sig att ritas upp innan nästa uppdatering.
Men ett grafikkort håller sällan en perfekt stadig uppdateringsfrekvens. Olika sekvenser av ett spel kan variera stort prestandakrav, så hur lång tid det faktiskt tar att rendera en bildruta matchar inte alltid den tid som skärmen har med sin fasta uppdateringsfrekvens. Problemet kan minskas med V-sync, men då till bekostnad av prestanda.
Det vill Nvidia lösa med G-sync, en teknik som med hjälp av en aktiv komponent installerad i skärmen kan låta grafikkortet dynamiskt reglera skärmens uppdateringsfrekvens så att den mer matchar uppdateringsfrekvensen från grafikkretsen.
Chefredaktör Karmehed har varit på plats på Nvidias huvudkontor i London för att få se tekniken öga mot öga, och har även sammanfattat fler detaljer om hur den fungerar i vår separata artikel.
290 vs 780ti i BF4.
oh undrar vad man väljer.
personligen är 5fps hit eller dit lite betydelselöst.
30fps då kanske det börjar likna nåt.
[quote name=”flopper”]290 vs 780ti i BF4.
oh undrar vad man väljer.
personligen är 5fps hit eller dit lite betydelselöst.
30fps då kanske det börjar likna nåt.[/quote]
Tänk på att 780Ti kostar betydligt mer så det är ju inte bara att “välja”. Man kan nästan köpa två st R9 290 för samma pengar och få ganska mycket mer prestanda.
Hört att det kan va stora skillnader med frames mellan Win 7 och Win 8.1
Har ni möjlighet att se över detta då det blir mer vanligt med Win 8?
Jag förstår inte varför Nordichardwares resultat är så annorlunda jämfört med Sweclockers resultat i Battlefield 4.
Det är inte bara Sweclockers som uppvisar bättre resultat med GTX 780ti i samma test. Som någon tidigare nämnde så spelar det inte någon roll med några FPS hit och dit. Det är ändå ganska så intressant att se de andra testerna uppvisa bättre resultat för det gröna laget.
undara detta med, enda skillnad jag sett att SweC använder windows 8. Svårt att bilda sig en korrekt uppfattning..
[quote name=”McKinley”]Jag förstår inte varför Nordichardwares resultat är så annorlunda jämfört med Sweclockers resultat i Battlefield 4.Det är inte bara Sweclockers som uppvisar bättre resultat med GTX 780ti i samma test. Som någon tidigare nämnde så spelar det inte någon roll med några FPS hit och dit. Det är ändå ganska så intressant att se de andra testerna uppvisa bättre resultat för det gröna laget.[/quote] Jag tror det beror på flera olika saker. För det första så tester man inte samma slinga. Vissa delar ser ut att föredra 780 Ti medans andra ser ut at föredra 290X. Hardwareheaven gjorde en… Läs hela »
@tjalve
Ja, jag ser att korten beter sig på olika sätt och det är lite konstigt att det kan skilja sig så mycket.
Glömde för övrigt att påpeka att recensionen är välskriven som alltid nu på senare tid.
Tackar för välskriven recension, lade just in en order på en 780Ti. Som plus nu även med hårdvarubaserad inspelning från spel sessioner på nyare kort (ShadowPlay) 😛
Har någon testat att ta hem och prova de kinesiska varianterna av grafikkorten? Det vore intressant med ett test och en jämförelse med de som säljs i butik här. T ex på http://www.aliexpress.com kan du hitta GTX 770 för runt 500 kr och uppåt, med fri frakt till Sverige. Man brukar få vad man betalar för. Men kan detta vara något att ha eller är det bara skräp?
[quote name=”flopper”]290 vs 780ti i BF4.
oh undrar vad man väljer.
personligen är 5fps hit eller dit lite betydelselöst.
30fps då kanske det börjar likna nåt.[/quote]
Nvidia är det bättre kortet på alla sätt förutom just priset. 5fps kan vara skillnaden mellan att ett V-synkat kort hamnar på 30fps eller ligger kvar strax över 60, så vad menar du egentligen?