Under årets GPU Technology Conference visade Nvidia upp Tesla V100. Det kort som slår upp dörrarna till marknaden för grafikkortsarkitekturen Volta.
Nvidia har nu presenterat sin nästa generations grafikkortsarkitektur, Volta. Under årets GPU Technology Conference visade företagets vd Jen-Hsun Huang upp det första kortet som baseras på den nya arkitekturen – beräkningskortet Tesla V100.
Den nya arkitekturen tillverkares med 12-nanometers tillverkningsprocess och grafikacceleratorn V100 kommer utrustat med kretsen GV100 med 5 120 CUDA-kärnor, 16 gigabyte (GB) HBM2 VRAM och en 320 texturenheter. Likt Nvidia gjort tidigare vid lanseringar av nya arkitekturer så kommer Volta inte att dyka upp i grafikkort inriktade för datorspel vid lansering. Tesla V100 är snarare ett beräkningskort skapat för maskinlärning, AI-utveckling och andra GPGPU-krävande applikationer där parallell arbetskraft är av högsta vikt.
Tittar vi på grafikminne har Nvidia valt att satsa på andra generationens HBM-teknik. De 16 GB HBM2 minne som återfinns på V100 är uppdelade i 4 staplar med 4 GB minne styck. Klockfrekvensen på minnet är satt till 875 megahertz effektivt. Detta ger en teoretisk minnesbandbredd på upp till hissnande 900 GB/s. En fin ökning från de 720 GB/s som levereras av Pascal-baserade GP100.
“GV100 delivers considerably more compute performance, and adds many new features compared to its predecessor, the Pascal GP100 GPU and its architecture family. Further simplifying GPU programming and application porting, GV100 also improves GPU resource utilization. GV100 is an extremely power-efficient processor, delivering exceptional performance per watt.”
Nvidia Tesla V100 blir gigantisk
Utöver sina 5 376 cuda-kärnor är Nvidias GV100 GPU även utrustad med en ny typ av så kallade Tensor-kärnor. Dessa kärnor är ämnade för att hantera beräkningar för just maskinlärning. Dessa kärnor ger kortet en teoretisk beräkningskraft på upp till 120 TFLOPS för maskinlärning och datacenterberäkningar. V100 kommer utrustat med 640 Tensor-kärnor, 8 stycken per SM-kluster. Detta ska enligt Nvidia göra V100 upp till 2,4 gånger snabbare än föregångaren P100 som baseras på Pascal-arkitekturen. Voltas nya streamingprocessorer ska samtidigt vara upp till 50% effektivare än de som används i Pascal-arkitekturen och Nvidia hävdar att GV100 är en generellt väldigt effektiv krets.
Något som lär vara ett måste när man noterar hur enormt stor Nvidias nya GV100 GPU faktiskt är. Kretsen mäter 815 kvadratmillimeter. Det är 33 procent större än Nvidias redan komplexa och maffiga GP100 GPU och indikerar tydligt att Nvidia siktar hårdare på den professionella marknaden än konsumenter. GV100 kommer inte att bli billig att tillverka. Här nedan jämförs Nvidias senaste Volta-baserade Tesla-grafikkort med föregående modeller över de senaste fem åren och Volta-baserade GV100 är något av ett trendbrott storleksmässigt.
Tesla-produkt | Tesla V100 | Tesla P100 | Tesla M40 | Tesla K40 |
---|---|---|---|---|
GPU | GV100 (Volta) | GP100 (Pascal) | GM200 (Maxwell) | GK110 (Kepler) |
SMs | 80 | 56 | 24 | 15 |
TPCs | 40 | 28 | 24 | 15 |
FP32 Cores / SM | 64 | 64 | 128 | 192 |
FP32 Cores / GPU | 5120 | 3584 | 3072 | 2880 |
FP64 Cores / SM | 32 | 32 | 4 | 64 |
FP64 Cores / GPU | 2560 | 1792 | 96 | 960 |
Tensor Cores / SM | 8 | NA | NA | NA |
Tensor Cores / GPU | 640 | NA | NA | NA |
GPU Boost Clock | 1455 MHz | 1480 MHz | 1114 MHz | 810/875 MHz |
Peak FP32 TFLOP/s * | 15 | 10.6 | 6.8 | 5.04 |
Peak FP64 TFLOP/s * | 7.5 | 5.3 | 2.1 | 1.68 |
Peak Tensor Core TFLOP/s * | 120 | NA | NA | NA |
Texture Units | 320 | 224 | 192 | 240 |
Memory Interface | 4096-bit HBM2 | 4096-bit HBM2 | 384-bit GDDR5 | 384-bit GDDR5 |
Memory Size | 16 GB | 16 GB | Up to 24 GB | Up to 12 GB |
L2 Cache Size | 6144 KB | 4096 KB | 3072 KB | 1536 KB |
Shared Memory Size / SM | Configurable up to 96 KB | 64 KB | 96 KB | 16 KB/32 KB/48 KB |
Register File Size / SM | 256KB | 256 KB | 256 KB | 256 KB |
Register File Size / GPU | 20480 KB | 14336 KB | 6144 KB | 3840 KB |
TDP | 300 Watts | 300 Watts | 250 Watts | 235 Watts |
Transistors | 21.1 billion | 15.3 billion | 8 billion | 7.1 billion |
GPU Die Size | 815 mm² | 610 mm² | 601 mm² | 551 mm² |
Manufacturing Process | 12 nm FF | 16 nm FinFET+ | 28 nm | 28 nm |
Lanseringsår | 2017 | 2016 | 2015 | 2013 |
Nvidia visar med Volta att man idag är långt mycket mer än bara en grafikkortstillverkare utan växer allt mer in i rollen som en leverantör av kraftfulla beräkningslösningar. Medan spelmarknaden är en stor och vital del i Nvidias marknadsplaner är det maskininlärning, AI och datacentermarknaden som leder företagets GPU-utveckling för närvarande.
Exakt när Tesla V100 börjar levereras nämndes inte, dock blir det under årets tredje kvartal. När vi får se konsumentvaror baserade på Volta-arkitekturen lämnades osagt.