Zielony tygrys bez sierści

Testy kart NVIDIA GeForce GTX 480 i GTX 470 (Fermi)

Autor: Mateusz Galon | Data: 2010-04-30 08:00:00

A A A | Wejść na stronę 135628 | Komentarzy 5

Testy kart NVIDIA GeForce GTX 480 i GTX 470 (Fermi) Premiera Fermi miaÅ‚a miejsce ponad miesiÄ…c temu, jednak dla polskiego rynku Nvidia przeznaczyÅ‚a mniej tych kart, niż Rzymian przeżyÅ‚o po wojnie z Galami – konkretnie dwie. Na pewno pamiÄ™tacie dziesiÄ…tki, jak nie setki newsów w których pokazywaliÅ›my Wam domniemany wyglÄ…d, osiÄ…gi i inne plotki zwiÄ…zane z kartami GTX 470 i GTX 480. Wszystko to sprawiÅ‚o, że produkty te sÄ… najbardziej oczekiwanymi kartami graficznymi chyba w historii. W dzisiejszej recenzji sprawdzimy jak nowe modele wypadajÄ… w stosunku do konkurencyjnych Radeonów HD 5850 i HD 5870 oraz na jakim poziomie jest ich pobór mocy, kultura pracy, a także stosunek cena/jakość. Mam nadziejÄ™, że po tej lekturze każdy gracz bÄ™dzie miaÅ‚ jasny obraz na obecny rynek akceleratorów grafiki. Zapraszam do artykuÅ‚u!

fermi
Różnic w stosunku do poprzednich konstrukcji nie ma wcale tak dużo jak oczekiwaliÅ›my. Wszystko zostaÅ‚o podporzÄ…dkowane zgodnoÅ›ci z DirectX 11. Nowy ukÅ‚ad zbudowany zostaÅ‚ z 3 miliardów tranzystorów.
fermi
GÅ‚ównÄ… częściÄ… rdzenia sÄ… bloki procesorów SM, w liczbie 16 sztuk, podzielone na cztery oddzielne klastry. Liczba równolegÅ‚ych rdzeni wynosi 512, natomiast dla przykÅ‚adu w konkurencyjnej serii HD 5000 jest ich 320. Kolejnym usprawnieniem jest nowy silnik GigaThead, który ma za zadanie rozdzielanie wÄ…tków, wprowadzenie szybkiej pamiÄ™ci L2 cache oraz rezygnacja z jednostek Texture Processing Clusters. Warto też wspomnieć o nowych, przebudowanych blokach ROP, których sześć sztuk posiada po osiem jednostek renderujÄ…cych.
fermi
W serii GF100 rdzenie CUDA podzielone sÄ… na cztery procesory po 128 sztuk. Poniżej macie schemat rasteryzatorów, które pozwalajÄ… na wydajniejsze przeksztaÅ‚cenia geometryczne, a co za tym idzie lepszy podziaÅ‚ wielokÄ…tów (teselacje). Bloki SM posiadajÄ… podporzÄ…dkowanÄ… jednostkÄ™ polimorficznÄ…, która ma za zadanie dokonywać przemian geometrycznych. PrzekÅ‚ada siÄ™ to aż na 8x szybsze zabiegi nowych ukÅ‚adów na elementach geometrycznych. Takie obliczenia pozwalajÄ… nam wiÄ…zać z Fermi duże nadzieje.
Poniższy wykres prezentuje wydajność teksturowania w stosunku do ukÅ‚adów GF200. Nowszy ukÅ‚ad nie posiada już niezależnych klastrów TPC. Mniejsza liczba jednostek adresujÄ…cych tekstury, które pracujÄ… jednak z wiÄ™kszÄ… efektywnoÅ›ciÄ… gwarantuje nam szybszÄ… komunikacjÄ™.
fermi
fermi
fermi

KolejnÄ… znaczÄ…cÄ… zmianÄ… jest budowa jednostek obliczeniowych w bloku SM, które zbudowane zostaÅ‚y z dwóch części: zmienno- i staÅ‚oprzecinkowej. MajÄ… dziÄ™ki temu możliwość jednoczesnego wykonywania dziaÅ‚ania sumy i iloczynu, a zarazem braku utraty dokÅ‚adnoÅ›ci. Każdy pojedynczy blok SM posiada 16 jednostek Å‚adowania i przechowywania, które pozwalajÄ… na adresacjÄ™ nawet 16 wÄ…tków podczas jednego cyklu zegarowego. Kolejnym elementem SM sÄ… 4 jednostki SFU, które zajmujÄ… siÄ™ podczas obliczeÅ„ funkcjami sinus, cosinus czy dziaÅ‚aniem pierwiastkowania.
fermi
fermi
PiszÄ…c o architekturze nowego ukÅ‚adu nie sposób pominąć podwojony harmonogram (Schedule), który zbudowany zostaÅ‚ z dwóch jednostek dispatch instruction i warp. Pozwala on efektywniej rozdzielać wÄ…tki, które sÄ… pogrupowane po 32. Najlepiej prezentuje to poniższy schemat:
fermi
Komunikacja odbywa się niesamowicie sprawnie dzięki wspomnianej już wcześniej pamięci dedykowanej oraz L2 cache. Cały układ pamięciowy został nazwany Parallel DataCache. Pozwalają one jeszcze skuteczniej wykonywać działania z aplikacjami CUDA oraz PhysX. Fermi pozwala nie tylko na odczyt, ale także na zapis do pamięci drugiego poziomu.
fermi

Wprowadzenie operacji atomowych zapewnia nam ciÄ…gÅ‚y przepÅ‚yw wÄ…tków, bez możliwoÅ›ci wzajemnego blokowania. Kontroler pamiÄ™ci GDDR5 posiada system korekcji EDC oraz obsÅ‚ugÄ™ Error Correction Code.
Instrukcje w architekturze Parallel Thread eXEcution, która jest tutaj innowacjÄ… pozwala na pracÄ™ caÅ‚ego ukÅ‚adu, jako procesora wÄ…tkowego. SÄ… one tÅ‚umaczone przez specjalny sterownik, tak żeby mogÅ‚y być realizowane przez warstwÄ™ sprzÄ™towÄ…. Pozwala to osiÄ…gnąć bardzo wysokÄ… wydajność karty w najróżniejszych obliczeniach. Nie sposób zapomnieć o chyba najważniejszej różnicy jakÄ… wprowadza 40-bitowa przestrzeÅ„ adresowa, czyli obsÅ‚udze interpretatora C++. Możemy wykonywać krótkie części kodu, bez zbÄ™dnych rozgałęzieÅ„.

fermi
fermi
Nowe ukÅ‚ady dziÄ™ki ulepszonym jednostkÄ… ROP majÄ… też wiÄ™ksze możliwoÅ›ci w wygÅ‚adzaniu krawÄ™dzi. Wzrost szybkoÅ›ci nawet o 2,5 razy w stosunku do poprzedniej serii GeForców. Wprowadzony zostaÅ‚ nowy tryb 32x CSAA, który powoduje nieznacznie wiÄ™ksze obciążenie od MSAA x8, dajÄ…c zdecydowanie lepsze rezultaty.
Najlepszym przykÅ‚adem dziaÅ‚ania tej technologii jest wygÅ‚adzenie krawÄ™dzi na poniższym obrazku, gdzie mamy scenÄ™ z liśćmi i porównanie do MSAA. W Å›rodowisku DirectX9 bÄ™dziemy mogli wykorzystać przeźroczystość, na co pozwalajÄ… 24 dodatkowe próbki ATC.
fermi
fermi
fermi
fermi
Warto przeczytać: Do góry

Komentarze

  • 2010-04-30 20:13:53

    Kultura pracy - chyba raczej wandalizm :P Jeśli chodzi o wydajność to w DX11 nie mają sobie równych, ale w pod 9/10 nie mają zdecydowanej przewagi nad Radeonami. Mam nadzieję, że udziały w na rynku dzięki tej generacji się odwrócą (z korzyścią dla Czerwonych) :)
  • 2010-05-01 09:45:29

    Artykuł wyglądał imponująco dopóki nie dotarłem do "konfiguracji testowej", a tam takich kwiatków, jak:
    Catalyst 8.11 - ASUS HD 4870 X2
    Catalyst 9.10 - Radeon HD 5850 i 5870
    Catalyst 9.12 - Radeon HD 5970.

    I robi taki test osoba, która pracuje w tym temacie długi czas, a nie wie, że przy tak głośnych premierach kart, ważnych kart, porównaniach, nie dokonuje testów przy jednakowych warunkach. Nie mówię, aby powtarzać wszystkie testy od nowa, ale można było chociaż konkurencyjne układy dla NV, jak HD 5870 i HD 5970 przetestować jeszcze raz na Catalystach 10.3. Swoją drogą, ciekawe czemu autor testował na tak starych driverach karty w Metro 2033 czy w Dircie2? Pewnie chciał, aby Fermi miało lepsze wyniki. Kpina.

    Na koniec, przyznajecie nagrody kartom, zaś w tekście piszecie, że Fermi was zawiodło. Narzekacie, ze ceny są za wysokie. Czy w ogóle ktoś czytał ten tekst przed jego publikacją, chyba nie?

    Dlaczego wasze testy mają tak wiele błędów, przez co są nierzetelne?

    @morticore
    Chyba czytaliśmy zupełnie inny artykuł, bo ja tu nie widzę, aby Fermi w DX11 nie miało sobie równych. Wręcz przeciwnie, wypadają tak samo, jak konkurencyjne Radeony.


    Pozdrawiam,
  • 2010-05-01 10:53:27

    @morticore, Fermi w moich testach wyprzedziło Radeony dopiero po OC, wcześniej były to wyniki porównywalne (DX11).
    @KamilM, dzięki za konstruktywną krytykę. Trudno się z Tobą nie zgodzić, rzeczywiście bardziej trafne byłoby ograniczenie porównania do kilku Radeonów z serii 5000, bo w końcu z nimi mają rywalizować nowości od NV. W tej kwestii obiecuję poprawę. Również pozdrawiam.
  • 2010-05-01 20:03:48

    Trochę nie precyzyjnie się wyraziłem, chodziło mi o wynik walki z HD 5870, z dwurdzeniówką (5970)najmniejszych szans nie miała :)
  • 2010-05-04 14:10:23

    Co i tak nie zmienia faktu, że HD 5870 w ogólnym rozrachunku wychodzi na tą chwilę znacznie lepiej (patrz: cena/wydajność) ;-)

Komentarz 5