2007-06-01 11:19
Autor: Sebastian Wiśniewski (NetCop)
72

AMD w DX10 czyli Radeon HD 2900XT

Strona 3 - TMU, RBE, CFAA

Jednostki TMU


Jednostki TMU zbudowane są z czterech bloków. Każdy z bloków obsługuje grupę 16 procesorów shaderowych (czyli 16*5 = 80 procesorów strumieniowych) i w każdym z nich znajdziemy 4 jednostki filtrujące oraz 4 adresy tekstur. R600 potrafi przetworzyć 16 tekstur filtrowanych na cykl zegara (FP16, filtrowanie dwuliniowe) lub 32 tekstury nie filtrowane (np. tekstury vertexów lub mapy normalne) albo 16 filtrowanych i 16 nie filtrowanych. G80 potrafi przetworzyć 32 tekstury filtrowane na cykl (FP16, filtrowanie dwuliniowe), a do tego taktowanie TMU jest takie samo jak procesorów strumieniowych czyli 1,35GHz versus 740MHz w R600.
Tekstury nie filtrowane korzystają z 32kB vertex cache’a, a filtrowane z 32kB cache L1. Obie pamięci podręczne są połączone jeszcze z cachem drugiego poziomu o niebagatelnym rozmiarze 256kB.

Render-Back Ends


Są to jednostki renderujące, odpowiednik ROP u NVIDII. R600 posiada cztery, każdy operujący na 4 pikselach równocześnie co daje nam 16 pikseli na cykl zegara. Podwojono liczbę możliwych do przetworzenia operacji Z/Stencil i teraz w jednym cyklu można ich wykonać 32. Bufor Z zwiększył swoją precyzję z 24 do 32 bitów. DirectX 10 wymusił też na jednostce renderującej aby potrafiła ona renderować do 8 obiektów równocześnie (MRTs – Multiple Render Targets). RBE obsługuje też formaty 11:11:10 i FP128, również wymagane przez DX10.
W przypadku G80 mamy do czynienia z 6 ROPami po 4 piksele na każdy czyli z 24 pikselami na cykl zegara. Operacji Z/Stencil możemy wykonać 48. Mimo, że R600 potrafi przetworzyć mniej pikseli na cykl to trzeba zauważyć, że w tym przypadku taktowanie rdzenia 740MHz jest zdecydowanie wyższe od 575MHz dla jednostek ROP w G80.

CFAA (Custom Filter Anti Aliasing)


A co z wygładzaniem krawędzie ? RBE, w przeciwieństwie do ROP nie ma zaimplementowanych sprzętowych filtrów. Zajmuje się on tylko kompresją i szacowaniem subpixeli, a obliczenia wykonują procesory shaderowe.
AMD oferuje nam wygładzanie krawędzie nazwane CFAA (Custom Filter AntiAliasing). Metoda ta polega na dobieraniu próbkowania znaną metodą MSAA (x2, x4 lub x8) w połączeniu z filtrami Narrow Tent, Wide Tent oraz Edge Detection. Wszystko wybierane jest z poziomu sterowników i może być w przyszłości poszerzone o nowe filtry. Tabelka poniżej przedstawia sposób uzyskania odpowiedniego poziomu CFAA.



Strona 3 z 19 <<<1234567...19>>>