Profesjonalne procesory graficzne AMD i NVIDIA

Podczas odbywajÄ…cej siÄ™ konferencji Hot Chips 2017, mogliÅ›my siÄ™ dowiedzieć m.in. o planach PCI-SIG odnoÅ›nie przyszÅ‚oÅ›ci standardu PCI-Express. PrzyszedÅ‚ jednak czas na prawdziwÄ… wisienkÄ™ na torcie (lub „truskawkÄ™”, #pdk :-) ), czyli prezentacjÄ™ profesjonalnych ukÅ‚adów graficznych w wykonaniu NVIDIA oraz AMD. Jest naprawdÄ™ interesujÄ…co, obydwie firmy przygotowujÄ… coÅ› specjalnego.

NVIDIA Tesla V100
Zaczynamy od NVIDIA, która pochwaliÅ‚a siÄ™ ukÅ‚adem Tesla V100. W Å›rodku znajdziemy rdzeÅ„ Volta GV100, skÅ‚adajÄ…cy siÄ™ m.in. z 21 miliardów tranzystorów upakowanych w 815 m2 rdzeniu. Karta wykorzystuje 80 z 84 dostÄ™pnych jednostek SM (Streaming Multiprocessor), co przekÅ‚ada siÄ™ na 5120 rdzeni CUDA, 2560 jednostek DPC (Double Precision Core) oraz 640 jednostek TCU (Tensor Core Unit). Umieszczono także 16 GB pamiÄ™ci HBM2 produkcji Samsunga, która poszczycić siÄ™ może niesamowitÄ… przepustowoÅ›ciÄ… siÄ™gajÄ…cÄ… aż 900 GB/s. Dla porównania – pierwszy Pascal cechowaÅ‚ siÄ™ przepÅ‚ywem danych na poziomie 720 GB/s. ZnaczÄ…cy wzrost wydajnoÅ›ci nastÄ…piÅ‚ jednak w ukÅ‚adzie NVLink, którego przepustowość to 300 GB/s (w Tesli P100 – 160 GB/s).
PatrzÄ…c na poniższÄ… tabelÄ™, ciężko jest uwierzyć, że od premiery Tesli P100 minÄ…Å‚ rok – postÄ™p, jaki widzimy jest naprawdÄ™ zaskakujÄ…cy– nowa Tesla jest nawet kilkukrotnie szybsza od swojego poprzednika. NVIDIA dodatkowo przekonuje, iż udaÅ‚o siÄ™ osiÄ…gnąć o poÅ‚owÄ™ lepszÄ… wydajność jednego bloku SM, poprawiono także architekturÄ™ SIMP (single instruction, multi thread), która w niektórych aplikacjach (przystosowanych do CUDA 9), dziewiÄ™ciokrotnie przyspiesza wykonywanie operacji.











AMD Vega 10
AMD na poczÄ…tku tego miesiÄ…ca zaprezentowaÅ‚o high-endowÄ… kartÄ™ Radeon RX Vega 64 i dla wielu potencjalnych nabywców na prezentacji siÄ™ skoÅ„czyÅ‚o – jest obecnie nie do kupienia. Po dwóch latach posuchy w profesjonalnych ukÅ‚adach, ten stan zmienia siÄ™ na rzecz Vega 10, niektórzy nazywajÄ… go „peÅ‚nym Vega 64”. RdzeÅ„ zbudowany zostaÅ‚ w 14-nanometrowej litografii FinFET przez GlobalFoundries i zajmuje powierzchniÄ™ 486 m2, gdzie ilość tranzystorów to 12,5 miliarda.
Vega 10 dostÄ™pna bÄ™dzie w kilku wariantach – różnice to przede wszystkim ilość zastosowanej pamiÄ™ci HBM2. I tak, do użytku oddane zostanÄ… modele z 4, 8 oraz 16 GB HBM2. Mówi siÄ™, że w wariancie z 2 GB VRAM, TDP caÅ‚oÅ›ci ma oscylować w 200 W, a wiÄ™c caÅ‚kiem nieźle.
RdzeÅ„ Vegi czÄ™sto porównywany jest do Fiji, czyli swojego poprzednika. Trzeba jednak mieć na uwadze, iż w budowie procesora zaszÅ‚y istotne zmiany. Mamy tu bowiem dwa bloki ACE (Asynchronous Compute Engine), dwie jednostki SDMA (System DMA) i w peÅ‚ni funkcjonalny Infinity Fabric. Poza tym, oddano tu do użytku takie technologie jak Flexible Geometry Engines, cztery bloki DSBR (Draw Stream Binning Rasterizers), 64 jednostki pikselujace (Pixel unit) oraz 256 jednostek teksturujÄ…cych (Texture unit). 64 jednostkowa architektura NCU (Next Compute Units) posiada 4096 procesorów strumieniowych i 4 MB pamiÄ™ci drugiego poziomu.
AMD projektujÄ…c Vega 10 duży nacisk kÅ‚adÅ‚o na obsÅ‚ugÄ™ wirtualizacji, co przekÅ‚ada siÄ™ na możliwość pracy na szesnastu maszynach wirtualnych jednoczeÅ›nie. Producent wspomina także o technologii Rapid Packed Math, która wykonuje 16-bitowe obliczenia matematyczne.
PatrzÄ…c na specyfikacje obydwu produktów, widać że zarówno AMD jak i NVIDIA „ofensywnie” podeszli do tematu prezentujÄ…c swoje najmocniejsze dziaÅ‚a - jestem szalenie ciekaw, jak to wyjdzie w „praniu". ;-)










3136
0
Poprzedni
0
Komentarze