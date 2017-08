Podczas odbywającej się konferencji Hot Chips 2017, mogliśmy się dowiedzieć m.in. o planach PCI-SIG odnośnie przyszłości standardu PCI-Express. Przyszedł jednak czas na prawdziwą wisienkę na torcie (lub „truskawkę”, #pdk :-) ), czyli prezentację profesjonalnych układów graficznych w wykonaniu NVIDIA oraz AMD. Jest naprawdę interesująco, obydwie firmy przygotowują coś specjalnego.

NVIDIA Tesla V100

Zaczynamy od NVIDIA, która pochwaliła się układem Tesla V100. W środku znajdziemy rdzeń Volta GV100, składający się m.in. z 21 miliardów tranzystorów upakowanych w 815 m2 rdzeniu. Karta wykorzystuje 80 z 84 dostępnych jednostek SM (Streaming Multiprocessor), co przekłada się na 5120 rdzeni CUDA, 2560 jednostek DPC (Double Precision Core) oraz 640 jednostek TCU (Tensor Core Unit). Umieszczono także 16 GB pamięci HBM2 produkcji Samsunga, która poszczycić się może niesamowitą przepustowością sięgającą aż 900 GB/s. Dla porównania – pierwszy Pascal cechował się przepływem danych na poziomie 720 GB/s. Znaczący wzrost wydajności nastąpił jednak w układzie NVLink, którego przepustowość to 300 GB/s (w Tesli P100 – 160 GB/s).

Patrząc na poniższą tabelę, ciężko jest uwierzyć, że od premiery Tesli P100 minął rok – postęp, jaki widzimy jest naprawdę zaskakujący– nowa Tesla jest nawet kilkukrotnie szybsza od swojego poprzednika. NVIDIA dodatkowo przekonuje, iż udało się osiągnąć o połowę lepszą wydajność jednego bloku SM, poprawiono także architekturę SIMP (single instruction, multi thread), która w niektórych aplikacjach (przystosowanych do CUDA 9), dziewięciokrotnie przyspiesza wykonywanie operacji.

AMD Vega 10

AMD na początku tego miesiąca zaprezentowało high-endową kartę Radeon RX Vega 64 i dla wielu potencjalnych nabywców na prezentacji się skończyło – jest obecnie nie do kupienia. Po dwóch latach posuchy w profesjonalnych układach, ten stan zmienia się na rzecz Vega 10, niektórzy nazywają go „pełnym Vega 64”. Rdzeń zbudowany został w 14-nanometrowej litografii FinFET przez GlobalFoundries i zajmuje powierzchnię 486 m2, gdzie ilość tranzystorów to 12,5 miliarda.

Vega 10 dostępna będzie w kilku wariantach – różnice to przede wszystkim ilość zastosowanej pamięci HBM2. I tak, do użytku oddane zostaną modele z 4, 8 oraz 16 GB HBM2. Mówi się, że w wariancie z 2 GB VRAM, TDP całości ma oscylować w 200 W, a więc całkiem nieźle.

Rdzeń Vegi często porównywany jest do Fiji, czyli swojego poprzednika. Trzeba jednak mieć na uwadze, iż w budowie procesora zaszły istotne zmiany. Mamy tu bowiem dwa bloki ACE (Asynchronous Compute Engine), dwie jednostki SDMA (System DMA) i w pełni funkcjonalny Infinity Fabric. Poza tym, oddano tu do użytku takie technologie jak Flexible Geometry Engines, cztery bloki DSBR (Draw Stream Binning Rasterizers), 64 jednostki pikselujace (Pixel unit) oraz 256 jednostek teksturujących (Texture unit). 64 jednostkowa architektura NCU (Next Compute Units) posiada 4096 procesorów strumieniowych i 4 MB pamięci drugiego poziomu.

AMD projektując Vega 10 duży nacisk kładło na obsługę wirtualizacji, co przekłada się na możliwość pracy na szesnastu maszynach wirtualnych jednocześnie. Producent wspomina także o technologii Rapid Packed Math, która wykonuje 16-bitowe obliczenia matematyczne.

Patrząc na specyfikacje obydwu produktów, widać że zarówno AMD jak i NVIDIA „ofensywnie” podeszli do tematu prezentując swoje najmocniejsze działa - jestem szalenie ciekaw, jak to wyjdzie w „praniu". ;-)