2006-11-08 19:58
Autor: Sebastian Wiśniewski (NetCop)
129

NVIDIA GeForce 8800 - nowa era w kartach graficznych

Strona 2 - G80

Architektura G80



G80 zbudowany jest zgodnie z wymogami DirectX 10. W swoim wnętrzu kryje 128 procesorów pracujących z zegarem 1.35GHz. Każdy z nich jest zdolny pracować jako pixel, vertex, geometry shader lub obliczać fizykę. Jest to architektura zunifikowanych shaderów.

Dlaczego zunifikowane shadery ?
Generalnie zapotrzebowanie na moc obliczeniową pixel shaderów jest większe od vertex shaderów dlatego w kartach generacji DX9 mamy ich więcej. Ale różne sceny graficzne mają różne wymagania. Diagram poniżej przedstawia przykład rozłożenia obliczeń na oba typy shaderów.

Wyobraźmy sobie teraz kartę graficzną w której mamy 4 jednostki Vertex Shader i 8 Pixel Shader oraz drugą, posiadającą 12 jednostek zunifikowanych shaderów.

Scena pierwsza wykorzystuje maksymalnie 4 jednostki vertex shader i 1 pixel shader, pozostałem 7 pixel shaderów nie pracuje, czekając aż kod "przebije się" przez obliczenia vertexów.
W scenie drugiej sytuacja jest inna, 3 jednostki vertex shader nie mają co robić, podczas gdy jednostki pixel shader wykorzystywane są na maksimum.

Teraz wyobraźmy sobie kartę graficzna posiadającą tą samą liczbę shaderów co poprzednia – 12, z tym, że są one zunifikowane.

W scenie pierwszej wystarczał tylko 1 pixel shader, pozostałem 11 jednostek oblicza kod vertex i podobnie w scenie drugiej. W obu przypadkach, wszystkie 12 jednostek zunifikowanych shaderów pracuje, dzięki temu rendering odbywa się szybciej.

Budowa G80
Przyjrzyjmy się teraz z bliska budowie układu G80:


Liczba tranzystorów: 681 mln
Proces technologiczny: 0.09µ
Liczba zunifikowanych shaderów: 128
Liczba jednostek ROP: 24
Technologie: HDTV+HDCP, PureVideo HD, SLI

Układ G80 można podzielić na dwie części:
- zunifikowane shadery
- Lumenex Engine
Kluczowe miejsce w chipie zajmują procesory strumieni będące zunifikowanymi shaderami. A oto wycinek tych układów:

Na każde 8 procesorów przypadają dwa adresy tekstur i cztery jednostki filtrujące oraz pamięć cache pierwszego i drugiego poziomu. Pojedynczy TMU zbudowany jest z jeden adresu i dwóch jednostek filtrujących. Łącznie w G80 jest 32 TMU, jednak ich wydajność jest tak dobra jak 64 TMU w G71 dzięki zastosowaniu dwóch jednostek filtrujących (TF) w każdym TMU (TF+TA).

Nad całością czuwa technologia GigaThreads odpowiedzialna za utrzymanie wszystkich procesorów w pełnym obciążeniu przydzielając im tysiące zadań natury pixel, vertex, geometrii lub fizyki.
Wszystkie procesory strumieniowe taktowane są zegarem 1.35GHz, podczas gdy reszta układu pracuje z częstotliwością 575MHz.

Lumenex Engine:
Technologia ta odpowiada za:
- pełnoekranowe wygładzanie krawędzi (FSAA).
- filtrowanie anizotropowe
- HDR FP16 i FP32
Każdy z tych elementów został ulepszony. I tak pojawiła się nowa metoda wygładzania: CSAA (Coverage Sampling Antialiasing) używająca dodatkowo próbek koloru i wektora Z. CSAA oferuje wyższe tryby wygładzania niż multisampling. Te nowe tryby to 8x, 16x i 16xQ. Doszedł jeszcze tryb 8xQ będący standardowym wygładzaniem 8x metodą multisamplingu.
Nowe tryby działają na zasadzie polepszenia trybów starych i teoretycznie powinny działać we wszystkich grach które oferują jakikolwiek tryb AA. W sterownikach wybieramy opcję "polepszenie ustawień aplikacji" oraz nową metodę wygładzania np. x16. Spowoduje to, że włączając w grze dowolny poziom AA np. x4 w efekcie uzyskamy ten, który wybraliśmy ze sterowników.


Od lewej: brak FSAA, FSAAx4, FSAAx16


Istnieje też możliwość wymuszonego AA, tak jak w obecnych kartach graficznych i można to stosować tam, gdzie gra nie pozwala w ogóle włączyć wygładzania. Jednak taka metoda nie zawsze jest skuteczna i może po prostu nie zadziałać.

Poprawiono filtrowanie anizotropowe. Standardowo dostajemy je w wysokiej jakości bliskiej perfekcji czyli idealne pod każdym kątem.


Po lewej seria GeForce 7, po prawej seria GeForce 8800


Po lewej Radeon X1950XTX w trybie HQ, po prawej GeForce 8800


HDR pracuje zarówno w trybie FP16 (64-bitowy kolor) jak i FP32 (128-bitowy kolor) oraz co ważne można wreszcie używać go w połączeniu z pełnoekranowym wygładzaniem krawędzi.


Crysis - DX10, HDR + FSAA


Bufor Z
Warto wspomnieć jeszcze o technologii Early-Z, czyli ulepszonym buforze Z.

Bufor Z odpowiedzialny jest za usuwanie pikseli, które nie będą wyświetlane na ekranie z racji tego, że zakrywa je inny obiekt znajdujący się bliżej. Taka operacja dokonuje się pod koniec renderingu w jednostkach rastrujcych (ROP). Problem w tym, że pixel przebywa prawie cały proces aby w końcu zostać odrzuconym przez bufor Z dlatego, że będzie niewidoczny w scenie końcowej. Technologia Early Z zaimplementowana w G80 odrzuca niewidoczne pixele zanim trafią one do obróbki w shaderach, redukując ich liczbę konieczną do obrobienia i przyspieszając tym samym cały proces.

Kontroler pamięci:
Jak widać na schemacie, G80 posiada 6 partycji pamięci. Każda z nich ma 64-bitowy interface, co łącznie daje 384-bitową szynę. GeForce 8800GTX używa 768MB pamięci GDDR3 taktowanych zegarem 900MHz (DDR 1800MHz) oferując przepustowość 86,4GB/s. Sam kontroler potrafi współpracować z pamięciami DDR, DDR2, GDDR3 oraz GDDR4.

Quantum Effects
NVIDIA Quantum Effects to technologia, która pozwala na obliczanie i renderowanie efektów fizycznych przez GPU. 128 procesorów strumieniowych jest do dyspozycji twórców gier. Dzięki temu możemy liczyć na bardziej realistyczne efekty ognia, wody, dymu, eksplozji, włosów itp. Jednocześnie odciążany jest procesor i może się on zając innymi aspektami gry np. AI przeciwników komputerowych.


Nadchodząca gra World in Conflict i efekt uzyskany dzięki NVIDIA Quantum Effects


PureVideo i PureVideo HD
Każdy GeForce z serii 8800 wspiera odtwarzanie materiału HD z płyt Blu-ray i HD DVD oraz pozwala dekodować i ulepszać wyświetlany obraz w formatach H.264, VC-1, WMV/WMV-HD i MPEG2-HD. Pracuje w rozdzielczościach 720p, 1080i i 1080p, wspiera także zabezpieczenia HDCP.
Seria GeForce 8800 w HQV Benchmark uzyskuje 128 punktów na 130 możliwych.

Strona 2 z 13 <<<123456...13>>>