Nvidias presenterar Pascal P100 som världens mest avancerade GPU och levererar i form av grafikkortet Tesla P100 hissnande beräkningskraft med hjälp av 16 nanometer finfet-teknik och HBM2-minne.
Nvidia har under tisdagskvällen presenterat sitt nya flaggskepp från GPU-arkitekturen Pascal och med namnet Pascal GP100 är det inget annat än ett riktigt monster till grafikkrets. Byggd på 16 nanometer finfet-teknik huserar GP100 över 15 miljarder transistorer, närmast en fördubbling mot sin föregångare GM200, samt den nya minnestekniken HBM2. Enligt Nvidia bygger Pascal GP100 kring fyra grundstommar.
- NVLink™— NVIDIAs nya höghastighetsdatagränssnitt för ökad intern bandbredd och skalbarhet.
- HBM2— Ny generations minnesteknik för högre minnesbandbredd och stora minnesmängder på liten yta.
- Unified Memory och Compute Preemption—avsevärt förbättrad programmeringsmodell
- 16nm FinFET tillverkningsteknik för fler funktioner, högre prestanda och bättre energieffektiviet.
De 15 miljarder transistorerna ger en grafikkrets som trots sin effektiva tillverkningsteknik mäter hela 610 mm², att jämföra med redan mäktiga GM200 i Geforce GTX Titan X och dess 601 mm².
Tesla P100 troligtvis inte värst i Pascal-familjen
Transistorerna används för att bygga en grafikkrets med upp till 60 stycken SM (Streaming Multiprocessors) kluster där det är värt att notera de 56 stycken aktiverade beräkningsklustren i Pascal GP100 – det kan med andra ord komma ännu kraftfullare modeller av Pascal.
Tesla P100 får med denna konfiguration totalt 3 584 stycken cuda kärnor för hantering av FP32-beräkningar, drygt 500 fler än i GM200. Den största skillnaden i beräkningskapacitet kommer samtidigt vid hantering av FP64-beräkningar där Pascal GP100 har 1 792 cudakärnor mot måttliga 96 cudakärnor i GM200. Detta ger Pascal GP100 en jordskredsseger i tunga FP64-beräkningar där Nvidia ökar beräkningskapaciteten från nesliga 213 Gflops i GM200 till 5 304 Gflops i GP100 – välkomna nyheter för server och arbetsstationmarknaden. Något som samtidigt inte kommer att göra några större skillnader för traditionella konsumenter och spelare.
Nvidia Tesla P100-specifikationer
Specifikationer av Nvidias hittills enda bekräftade Pascal-grafikkort - i jämförelse med sina föregångare.Tesla Products | Tesla K40 | Tesla M40 | Tesla P100 |
---|---|---|---|
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) |
SMs | 15 | 24 | 56 |
TPCs | 15 | 24 | 28 |
FP32 CUDA-kärnor / SM | 192 | 128 | 64 |
FP32 CUDA-kärnor / GPU | 2880 | 3072 | 3584 |
FP64 CUDA-kärnor / SM | 64 | 4 | 32 |
FP64 CUDA-kärnor / GPU | 960 | 96 | 1792 |
Basfrekvens | 745 MHz | 948 MHz | 1328 MHz |
Boostfrekvens | 810/875 MHz | 1114 MHz | 1480 MHz |
FP32 GFLOPs (Enkel precision) | 4290 | 6800 | 10600 |
FP64 GFLOPs (Dubbel precision) | 1680 | 213 | 5304[1] |
Texturenheter | 240 | 192 | 224 |
Minnesgränssnitt | 384-bit GDDR5 | 384-bit GDDR5 | 4096-bit HBM2 |
Minnesstorlek | Up to 12 GB | Up to 24 GB | 16 GB |
L2-cache | 1536 KB | 3072 KB | 4096 KB |
Register filstorlek / SM | 256 KB | 256 KB | 256 KB |
Register filstorlek / GPU | 3840 KB | 6144 KB | 14336 KB |
TDP | 235 Watts | 250 Watts | 300 Watts |
Transistorer | 7.1 miljarder | 8 miljarder | 15.3 miljarder |
GPU kretsstorlek | 551 mm² | 601 mm² | 610 mm² |
Tillverkningstenik | 28-nm | 28-nm | 16-nm |
Boosfrekvens på hela 1 480 megahertz
Medan Nvidias Pascal GP100 GPU utan tvivel är en GPU skräddarsydd för servrar och avancerade arbetsstationer finns det flera spännande nyheter även för andra användare. Förutom fler cudakärnor ökar Nvidia antalet texturenheter från GM200 samtidigt som klockfrekvenserna är imponerande. Nvidia specificerar en basfrekvens på 1 328 megahertz och en boostfrekvens på hela 1 480 megahertz – smått galna standardfrekvenser möjligjorda av den nya effektivare tillverkningstekniken.
Som om inte de utökade beräkningsenheterna och texturenheterna vore nog har Nvidia kopplat sin GPU till en 4 096-bit minnesbuss och upp till 16 gigabyte HBM2-minne. En konfiguration som kommer att ge en minnesbandbredd på 720 gigabyte per sekund, en tredubbling från Tesla M40.
Nvidia NVLink tar över efter PCI Express 3.0
En nyckelkomponent är samtidigt Nvidias nya datagränssnitt NVLink som används både för att låta en Pascal GPU kommunicera snabbare med systemets CPU men även för att koppla samman flera grafikkretsar i ett och samma system. Nvidia menar att NVLink är 5 till 12 gånger snabbare än PCI Express 3.0 och kommer vara en mycket viktig ingridiens för större datorsystem med flera grafikkretsar sammankopplade. Tillsammans med Nvidias vidareutvecklade unified memory arkitektur låter NVLink systembyggare koppla samman CPU och GPU-kretsar på betydligt effektivare sätt.
Nvidia säger att masstillverkning av Tesla P100 redan är startad och att testexemplar börjat skeppas till partners. De första produkterna med Tesla P100 väntas samtidigt inte presenteras förrän under fjärde kvartalet för att levereras på marknaden under första kvartalet 2017.
Det är fortfarande oklart vilka modeller av Nvidias Pascal GPU som kommer att lanseras för konsumentmarknaden och när detta sker.
fap fap fap fap fap fap fap fap fap Flämt stön! Pust!
Synd att vi inte kommer få officiellt NVLink stöd på X86 plattformen under någon överskådlig framtid. Vet flera kunder som kunde haft nytta av det.