Nyheter

Nvidia GK110 och Tesla K20 – sämre än väntat

18 October, 2012

Nvidia håller på att förbereda sitt nya flaggskepp i Tesla-segmentet efter väldigt lång väntan från deras kunder. Nu visar det sig att Nvidia är långt ifrån att uppfylla vad som först utlovats. Beräkningskraften är mycket lägre än väntat och även mängden minne har halverats.

Servermarknaden har länge väntat på uppföljaren till den Fermi-baserade Tesla M2090 och har bakom stängda dörrar varit allt annat än nöjda på alla förseningar från Nvidia. Men nu verkar Tesla K20 vara på ingång som kommer baseras på företagets nya grafikprocessor GK110 med Kepler-arkitekturen. Med 7,1 miljarder transistorer är det en riktig gigant som beräknas lägga sig på cirka 600 kvadratmillimeter. Nvidia gick tidigare i år ut med många löften om vad K20 skulle leverera och då var det sannerligen någonting värt att imponeras över.

Det nya flaggskeppet skulle bli runt tre gånger kraftfullare än föregående Tesla M2090. Nvidia hade satt ett mål på 4 500 gigaflops i singelprecisionsprestanda och 1 500 gigaflops i dubbelprecisionsberäkningar – tillräckligt för att slå AMD Firepro S9000 och Intel Xeon Phi på fingrarna med råge. Nu när vi börjar närma oss lanseringen ser det inte riktigt lika positivt ut. Den rekordstora kretsen har inte helt oväntat fått dåliga yields (fungerande kretsar i procent) hos TSMC, någonting som tvingat Nvidia att ta ett steg tillbaka med Tesla K20.

På grund av tillverkningsproblemen har Nvidia tvingats skala tillbaka GK110 och stänga av två SMX-enheter med 192 CUDA-kärnor vardera. Resultatet blir att Tesla K20 kommer levereras med 2 496 kärnor istället för 2 880. Även klockfrekvensen som borde legat på 781 megahertz och uppåt för att nå Nvidias målsättning har fått ta ett steg tillbaka och lägger sig istället på 705 megahertz. Resultatet blir att det Tesla K20 som Nvidia faktiskt kommer klara av att leverera får singelprecisionsprestanda på 3 519 gigaflops och 1 173 gigaflops i dubbelprecisionsprestanda.

Modell	Tesla K20 (Vad som skeppas)	Tesla K20 (Planerad)	Tesla M2090
Arkitektur	Kepler	Kepler	Fermi
Krets	GK110	GK110	GF110
Transistorer	7,1 miljarder	7,1 miljarder	3 miljarder
Tillverkningsteknik	TSMC 28 nanometer	TSMC 28 nanometer	TSMC 40 nanometer
CUDA-kärnor	2 496	2 880	512
SMX-enheter	13	15	16 (SM)
Klockfrekvens	705 MHz	~781 MHz	650 MHz
Shaderfrekvens	–	–	1 300 MHz
Singelprecisonsprestanda (FP32)	3 519 GFLOPS	4 500 GFLOPS	1 311 GFLOPS
Dubbelprecisionsprestanda (FP64)	1 173 GFLOPS (1/3 singelprecision)	1 500 GFLOPS (1/3 singelprecision)	665 GFLOPS (1/2 singelprecision)
Texturenheter	208	240	64
ROP:s	48	48	48
Minnesbuss	384-bit	384-bit	384-bit
Minnesmängd	6 144 MB GDDR5	12 288 MB GDDR5	6 144 MB GDDR5
Minnesfrekvens	?	?	925 MHz (3 700 MHz effektivt)
Minnesbandbredd	~200 GB/s	?	177,6 GB/s
Max TDP	225W	?	225W
Kylning	Passiv för servrar och aktiv för arbetsstationer

Nvidia var tystlåtna med minnesmängden om Tesla K20 men det från början var planen att det skulle utrustas med hela tolv gigabyte GDDR5-minne. Samsung och Hynix ska vara de enda som är kapabla att tillverka tillräckligt höga kapaciteter för att möjliggöra ett sådant kort. Men på grund av den dåliga efterfrågan ska massproduktion aldrig ha inletts. En annan källa säger att båda aktörerna fråga om extra pengar från Nvidia för att ta detta högkapacitets GDDR5-minne till marknaden och att de samtidigt vägrade ge ett exklusivitetsavtal till Nvidia. Resultatet blir alltså att uppföljaren till Tesla M2090, Tesla K20, får exakt samma minnesmängd på sex gigabyte GDDR5 – varav fem gigabyte går att använda med ECC (Error-correcting code).

Med facit i hand ser det ut som att Nvidias nya flaggskepp inte kommer spela i en klass för sig som först väntat. Den teoretiska dubbelprecisionsprestandan är bara marginellt högre än både AMD Firepro S900 och Intel Xeon Phi. Det sistnämnda är ett stort bekymmer för Nvidia då många av deras potentiella kunder kan välja att gå över till Intels alternativ, där det är lättare att återanvända stora delar x86-kompatibel kod. Det är fortfarande en klar förbättring mot deras föregående generation men den stora frågan är om det är tillräckligt mot de konkurrerande alternativen?

Källa: Heise

Relaterade artiklar:

NVIDIA Kepler GK110 får 2 880 CUDA-kärnor

3 Comments

äldsta

senaste flest röster

Inline Feedbacks

View all comments

flopper

12 Årtal sedan

stor krets är problemfylld.
ej oväntat.

Kogster

[quote name=”flopper”]stor krets är problemfylld.
ej oväntat.[/quote]
Precis, inte heller första gången Nvidia gör den tabben heller. Tycker dom borde lärt sig nu.

McKinley

[quote name=”Kogster”][quote name=”flopper”]stor krets är problemfylld.
ej oväntat.[/quote]
Precis, inte heller första gången Nvidia gör den tabben heller. Tycker dom borde lärt sig nu.[/quote]

Man är knappast ensam om att lova mycket, för att sedan leverera mindre.
Förseningar drabbar företag titt som tätt men är det något företag som skall belysas extra så är det kanske just nVidia och även AMD för den delen.

Netflix och GSC Game World diskuterar Stalker-serie

Borderlands 4 blir utan så mycket ”toaletthumor”

Zotac bekräftar RTX 5090 med 32 GB VRAM

RTX 5060 stannar kvar på endast 8 GB minne

Killing Floor 3 får spikat lanseringsfönster

Test: Philips Evnia 49M2C8900 – tungdriven men imponerande välvd 32:9-skärm

Test: Logitech PRO X Superlight 2 – underväldigande uppgradering

Test: Samsung 990 Pro 4 TB – nya V-NAND ger nya…

Test: Lenovo Yoga Pro 9i – RTX 4070, för kreatörer!

TechBubbel 185 – Sista TechBubbel

TechBubbel 184 – Nya från Qualcomm: snabbare än M2

TechBubbel 183 – Intels löjliga lansering

TechBubbel 182 – Nya PlayStation 5 är ”Slim”

TechBubbel 181 – Ryssland-mobilen, i Sverige