AMD har nu officiellt lanserat Radeon Instinct MI25 och Nvidia svarar med att presentera PCIe-modellen av Tesla V100 PCIe vi jämför kortens specifikationer.
AMD har nu officiellt lanserat sitt nya beräkningskort Radeon Instinct MI25 som baseras på den splitternya Vega-arkitekturen. Kortet är utrustat med 16 gigabyte (GB) HBM2 minne, 4 096 streamprocessorer och har ett TDP på hela 300 Watt.
Passande nog har Nvidia i samma veva presenterat sin PCI-expressvarianten av beräkningskortet Tesla V100. Grafikkortet baseras på Nvidias kommande Volta-arkitektur och utrustas med hela 5 120 CUDA-kärnor och 640 stycken av Nvidias nya Tensor-kärnor. Grafikminnet är även här av HBM2-modell med totalt 16 gigabyte spritt över kretskortet.
Vi passade på att ta en närmare titt på de båda grafikkorten och deras specificerade prestandasiffror.
Radeon Instinct MI25 vs. Tesla V100 PCIe
Radeon Instinct MI25 | Tesla V100 PCIe | |
---|---|---|
Arkitektur | Vega | Volta |
GPU | Vega 10 | GV100 |
Teknik | 14nm | 12nm |
Streamprocessorer / CUDA-kärnor | 4 096 streamprocessorer | 5 120 CUDA-kärnor |
Klockfrekvens | 1 502 MHz | - |
Turbofrekvens | - | 1 370 MHz |
FP16 | 24,6 TFLOPS | 28 TFLOPS |
FP32 | 12,3 TFLOPS | 14 TFLOPS |
Minnesmängd | 16 GB HBM2 | 16 GB HBM2 |
Minnesbandbredd | 484 GB/s | 900 GB/s |
Formfaktor | 2-slot PCIe | 2-slot PCIe |
TDP | 300 W | 250 W |
Lansering | Q3 2017 | Q4 2017 |
Båda grafikkorten kommer i PCIe-formfaktorn och installeras alltså som vanligt i en traditionell PCIe x16-plats. Medan grafikkorten med rätt mjukvara även kommer att kunna användas till spel och 3D-grafik är det primära fokuset GPU-beräkningar. Båda korten bygger på ännu ej lanserade GPU-arkitekturer, AMD Vega och Nvidia Volta.
Synar vi de båda grafikkorten på närmare håll ser det ut att bli ett förhållandevis jämt prestandarace, åtminstone när vi kikar på de teoretiska specifikationerna och ren beräkningskraft. Nvidias mastodont-krets GV100 har alltså 5 120 cudakärnor (beräkningsenheter) medan Vega 10 får nöja sig med 4 094 streamprocessorer. Det är första gången på länge som Nvidias GPU-arkitekturer levererar fler beräkningsenheter än AMD:s motsvarighet. Samtidigt verkar AMD stå för något högre klockfrekvenser med åtminstone den hybridkylda modellen av Radeon Instinct MI25.
Den teoretiska beräkningskraften är trots allt förhållandevis lik. AMD sägs leverera 12,3 teraflops i FP32-beräkningar medan Nvidia kan trycka ut 14 teraflops med Tesla V100. Det är lite oklart i vilka lägen som Nvidias Tensor-kärnor kommer att kunna ge en eventuell fördel för Tesla V100, men det är ett potentiellt ess i skjortärmen när det kommer till bland annat maskinlärning.
Stor skillnad i bandbredd
Den annars största och mest oklara differensen mellan AMD och Nvidias beräkningskort är minnesbandbredden. Båda tillverkarna laddar med 16GB HBM2-minne men minnesbandbredden spikas till i sammanhanget ganska återhållsamma 484 GB/s för Radeon MI25 medan Tesla V100 ska kunna leverera hela 900 GB/s. Varför skillnaderna är så stora och hur detta kommer att påverka prestandan i beräkningstunga applikationer är i dagsläget lite oklart.
AMD:s Vega-arkitektur har varit på tapeten länge och det kommer inte helt oväntat bli tufft för Radeon Instinct MI25 att hänga med i regelrätta GPU-beräkningar när Volta-baserade Tesla V100 sparkar igång sina cudakärnor. Med det sagt kommer AMD att börja skeppa sitt Radeon Instinct MI25 i början av tredje kvartalet medan Nvidia Tesla V100 troligtvis dröjer till slutet av året. Det är också oklart vad de båda grafikkorten kommer att kosta, men svettiga prislappar som får påkostade entusiastkort att se ut som rena reavaror.
Hur striden på GPGPU-marknaden slutar vid årsskiftet kommer inte att avgöras i en specifikationslista. Däremot är det spännande att se hur kraftfulla lösningar både AMD och Nvidia förbereder för den professionella marknaden. Nu återstår att se vad detta kommer att motsvara för vanliga spelare och konsumenter.
Grafikkort? Detta är väl beräkningskort utan utgång för display? :O Ser t.o.m ut så på bilderna!
Ah… Inkonsekvens i artikeln bara. Står beräkningskort längre ner. Jag måste lära mig läsa hela innan jag svarar/reagerar, men ändå… Kanske läge att konsekvens-korrigera artikeln 🙂