Hem Nyheter Nvidia Tesla P100 presenteras – Upp till 1,5 GHz boost och HBM2

Nyheter

Nvidia Tesla P100 presenteras – Upp till 1,5 GHz boost och HBM2

15 miljarder transistorer och HBM2-minne under huven

5 April, 2016

Nvidias presenterar Pascal P100 som världens mest avancerade GPU och levererar i form av grafikkortet Tesla P100 hissnande beräkningskraft med hjälp av 16 nanometer finfet-teknik och HBM2-minne.

Nvidia har under tisdagskvällen presenterat sitt nya flaggskepp från GPU-arkitekturen Pascal och med namnet Pascal GP100 är det inget annat än ett riktigt monster till grafikkrets. Byggd på 16 nanometer finfet-teknik huserar GP100 över 15 miljarder transistorer, närmast en fördubbling mot sin föregångare GM200, samt den nya minnestekniken HBM2. Enligt Nvidia bygger Pascal GP100 kring fyra grundstommar.

NVLink™— NVIDIAs nya höghastighetsdatagränssnitt för ökad intern bandbredd och skalbarhet.
HBM2— Ny generations minnesteknik för högre minnesbandbredd och stora minnesmängder på liten yta.
Unified Memory och Compute Preemption—avsevärt förbättrad programmeringsmodell
16nm FinFET tillverkningsteknik för fler funktioner, högre prestanda och bättre energieffektiviet.

De 15 miljarder transistorerna ger en grafikkrets som trots sin effektiva tillverkningsteknik mäter hela 610 mm², att jämföra med redan mäktiga GM200 i Geforce GTX Titan X och dess 601 mm².

Tesla P100 troligtvis inte värst i Pascal-familjen

Transistorerna används för att bygga en grafikkrets med upp till 60 stycken SM (Streaming Multiprocessors) kluster där det är värt att notera de 56 stycken aktiverade beräkningsklustren i Pascal GP100 – det kan med andra ord komma ännu kraftfullare modeller av Pascal.

Tesla P100 får med denna konfiguration totalt 3 584 stycken cuda kärnor för hantering av FP32-beräkningar, drygt 500 fler än i GM200. Den största skillnaden i beräkningskapacitet kommer samtidigt vid hantering av FP64-beräkningar där Pascal GP100 har 1 792 cudakärnor mot måttliga 96 cudakärnor i GM200. Detta ger Pascal GP100 en jordskredsseger i tunga FP64-beräkningar där Nvidia ökar beräkningskapaciteten från nesliga 213 Gflops i GM200 till 5 304 Gflops i GP100 – välkomna nyheter för server och arbetsstationmarknaden. Något som samtidigt inte kommer att göra några större skillnader för traditionella konsumenter och spelare.

Nvidia Tesla P100-specifikationer

Specifikationer av Nvidias hittills enda bekräftade Pascal-grafikkort - i jämförelse med sina föregångare.

Tesla Products	Tesla K40	Tesla M40	Tesla P100
GPU	GK110 (Kepler)	GM200 (Maxwell)	GP100 (Pascal)
SMs	15	24	56
TPCs	15	24	28
FP32 CUDA-kärnor / SM	192	128	64
FP32 CUDA-kärnor / GPU	2880	3072	3584
FP64 CUDA-kärnor / SM	64	4	32
FP64 CUDA-kärnor / GPU	960	96	1792
Basfrekvens	745 MHz	948 MHz	1328 MHz
Boostfrekvens	810/875 MHz	1114 MHz	1480 MHz
FP32 GFLOPs (Enkel precision)	4290	6800	10600
FP64 GFLOPs (Dubbel precision)	1680	213	5304[1]
Texturenheter	240	192	224
Minnesgränssnitt	384-bit GDDR5	384-bit GDDR5	4096-bit HBM2
Minnesstorlek	Up to 12 GB	Up to 24 GB	16 GB
L2-cache	1536 KB	3072 KB	4096 KB
Register filstorlek / SM	256 KB	256 KB	256 KB
Register filstorlek / GPU	3840 KB	6144 KB	14336 KB
TDP	235 Watts	250 Watts	300 Watts
Transistorer	7.1 miljarder	8 miljarder	15.3 miljarder
GPU kretsstorlek	551 mm²	601 mm²	610 mm²
Tillverkningstenik	28-nm	28-nm	16-nm

Boosfrekvens på hela 1 480 megahertz

Medan Nvidias Pascal GP100 GPU utan tvivel är en GPU skräddarsydd för servrar och avancerade arbetsstationer finns det flera spännande nyheter även för andra användare. Förutom fler cudakärnor ökar Nvidia antalet texturenheter från GM200 samtidigt som klockfrekvenserna är imponerande. Nvidia specificerar en basfrekvens på 1 328 megahertz och en boostfrekvens på hela 1 480 megahertz – smått galna standardfrekvenser möjligjorda av den nya effektivare tillverkningstekniken.

Nvidia Tesla P100

1 av 4

Som om inte de utökade beräkningsenheterna och texturenheterna vore nog har Nvidia kopplat sin GPU till en 4 096-bit minnesbuss och upp till 16 gigabyte HBM2-minne. En konfiguration som kommer att ge en minnesbandbredd på 720 gigabyte per sekund, en tredubbling från Tesla M40.

Nvidia NVLink tar över efter PCI Express 3.0

En nyckelkomponent är samtidigt Nvidias nya datagränssnitt NVLink som används både för att låta en Pascal GPU kommunicera snabbare med systemets CPU men även för att koppla samman flera grafikkretsar i ett och samma system. Nvidia menar att NVLink är 5 till 12 gånger snabbare än PCI Express 3.0 och kommer vara en mycket viktig ingridiens för större datorsystem med flera grafikkretsar sammankopplade. Tillsammans med Nvidias vidareutvecklade unified memory arkitektur låter NVLink systembyggare koppla samman CPU och GPU-kretsar på betydligt effektivare sätt.

Nvidia säger att masstillverkning av Tesla P100 redan är startad och att testexemplar börjat skeppas till partners. De första produkterna med Tesla P100 väntas samtidigt inte presenteras förrän under fjärde kvartalet för att levereras på marknaden under första kvartalet 2017.

Det är fortfarande oklart vilka modeller av Nvidias Pascal GPU som kommer att lanseras för konsumentmarknaden och när detta sker.

Lägsta pris på Prisjakt.nu

2 Comments

äldsta

senaste flest röster

Inline Feedbacks

View all comments

Janne Nilsson

9 Årtal sedan

fap fap fap fap fap fap fap fap fap Flämt stön! Pust!

Morkul

9 Årtal sedan

Synd att vi inte kommer få officiellt NVLink stöd på X86 plattformen under någon överskådlig framtid. Vet flera kunder som kunde haft nytta av det.

Mer information om Ryzen 7 9850X3D läcker ut

Crucial drar sig tillbaka från konsumentmarknaden

Skyblivion försenas till nästa år

Helldivers 2 krymper från 150 GB till endast 23 GB

Nvidia sägs sluta skicka videominne till partnertillverkare

Test: Philips Evnia 49M2C8900 – tungdriven men imponerande välvd 32:9-skärm

Test: Logitech PRO X Superlight 2 – underväldigande uppgradering

Test: Samsung 990 Pro 4 TB – nya V-NAND ger nya…

Test: Lenovo Yoga Pro 9i – RTX 4070, för kreatörer!