Nvidia håller på att förbereda sitt nya flaggskepp i Tesla-segmentet efter väldigt lång väntan från deras kunder. Nu visar det sig att Nvidia är långt ifrån att uppfylla vad som först utlovats. Beräkningskraften är mycket lägre än väntat och även mängden minne har halverats.
Servermarknaden har länge väntat på uppföljaren till den Fermi-baserade Tesla M2090 och har bakom stängda dörrar varit allt annat än nöjda på alla förseningar från Nvidia. Men nu verkar Tesla K20 vara på ingång som kommer baseras på företagets nya grafikprocessor GK110 med Kepler-arkitekturen. Med 7,1 miljarder transistorer är det en riktig gigant som beräknas lägga sig på cirka 600 kvadratmillimeter. Nvidia gick tidigare i år ut med många löften om vad K20 skulle leverera och då var det sannerligen någonting värt att imponeras över.
Det nya flaggskeppet skulle bli runt tre gånger kraftfullare än föregående Tesla M2090. Nvidia hade satt ett mål på 4 500 gigaflops i singelprecisionsprestanda och 1 500 gigaflops i dubbelprecisionsberäkningar – tillräckligt för att slå AMD Firepro S9000 och Intel Xeon Phi på fingrarna med råge. Nu när vi börjar närma oss lanseringen ser det inte riktigt lika positivt ut. Den rekordstora kretsen har inte helt oväntat fått dåliga yields (fungerande kretsar i procent) hos TSMC, någonting som tvingat Nvidia att ta ett steg tillbaka med Tesla K20.
På grund av tillverkningsproblemen har Nvidia tvingats skala tillbaka GK110 och stänga av två SMX-enheter med 192 CUDA-kärnor vardera. Resultatet blir att Tesla K20 kommer levereras med 2 496 kärnor istället för 2 880. Även klockfrekvensen som borde legat på 781 megahertz och uppåt för att nå Nvidias målsättning har fått ta ett steg tillbaka och lägger sig istället på 705 megahertz. Resultatet blir att det Tesla K20 som Nvidia faktiskt kommer klara av att leverera får singelprecisionsprestanda på 3 519 gigaflops och 1 173 gigaflops i dubbelprecisionsprestanda.
Modell | Tesla K20 (Vad som skeppas) |
Tesla K20 (Planerad) |
Tesla M2090 |
Arkitektur | Kepler | Kepler | Fermi |
Krets | GK110 | GK110 | GF110 |
Transistorer | 7,1 miljarder | 7,1 miljarder | 3 miljarder |
Tillverkningsteknik | TSMC 28 nanometer | TSMC 28 nanometer | TSMC 40 nanometer |
CUDA-kärnor | 2 496 | 2 880 | 512 |
SMX-enheter | 13 | 15 | 16 (SM) |
Klockfrekvens | 705 MHz | ~781 MHz | 650 MHz |
Shaderfrekvens | – | – | 1 300 MHz |
Singelprecisonsprestanda (FP32) | 3 519 GFLOPS | 4 500 GFLOPS | 1 311 GFLOPS |
Dubbelprecisionsprestanda (FP64) | 1 173 GFLOPS (1/3 singelprecision) |
1 500 GFLOPS (1/3 singelprecision) |
665 GFLOPS (1/2 singelprecision) |
Texturenheter | 208 | 240 | 64 |
ROP:s | 48 | 48 | 48 |
Minnesbuss | 384-bit | 384-bit | 384-bit |
Minnesmängd | 6 144 MB GDDR5 | 12 288 MB GDDR5 | 6 144 MB GDDR5 |
Minnesfrekvens | ? | ? | 925 MHz (3 700 MHz effektivt) |
Minnesbandbredd | ~200 GB/s | ? | 177,6 GB/s |
Max TDP | 225W | ? | 225W |
Kylning | Passiv för servrar och aktiv för arbetsstationer |
Nvidia var tystlåtna med minnesmängden om Tesla K20 men det från början var planen att det skulle utrustas med hela tolv gigabyte GDDR5-minne. Samsung och Hynix ska vara de enda som är kapabla att tillverka tillräckligt höga kapaciteter för att möjliggöra ett sådant kort. Men på grund av den dåliga efterfrågan ska massproduktion aldrig ha inletts. En annan källa säger att båda aktörerna fråga om extra pengar från Nvidia för att ta detta högkapacitets GDDR5-minne till marknaden och att de samtidigt vägrade ge ett exklusivitetsavtal till Nvidia. Resultatet blir alltså att uppföljaren till Tesla M2090, Tesla K20, får exakt samma minnesmängd på sex gigabyte GDDR5 – varav fem gigabyte går att använda med ECC (Error-correcting code).
Med facit i hand ser det ut som att Nvidias nya flaggskepp inte kommer spela i en klass för sig som först väntat. Den teoretiska dubbelprecisionsprestandan är bara marginellt högre än både AMD Firepro S900 och Intel Xeon Phi. Det sistnämnda är ett stort bekymmer för Nvidia då många av deras potentiella kunder kan välja att gå över till Intels alternativ, där det är lättare att återanvända stora delar x86-kompatibel kod. Det är fortfarande en klar förbättring mot deras föregående generation men den stora frågan är om det är tillräckligt mot de konkurrerande alternativen?
Källa: Heise
stor krets är problemfylld.
ej oväntat.
[quote name=”flopper”]stor krets är problemfylld.
ej oväntat.[/quote]
Precis, inte heller första gången Nvidia gör den tabben heller. Tycker dom borde lärt sig nu.
[quote name=”Kogster”][quote name=”flopper”]stor krets är problemfylld.
ej oväntat.[/quote]
Precis, inte heller första gången Nvidia gör den tabben heller. Tycker dom borde lärt sig nu.[/quote]
Man är knappast ensam om att lova mycket, för att sedan leverera mindre.
Förseningar drabbar företag titt som tätt men är det något företag som skall belysas extra så är det kanske just nVidia och även AMD för den delen.