2007-06-01 11:19
Autor: Sebastian Wiśniewski (NetCop)
72

AMD w DX10 czyli Radeon HD 2900XT

Strona 2 - Procesory strumieniowe

Procesory strumieniowe w R600


W układzie NVIDII G80 mamy 128 procesorów strumieniowych (SP), które są w stanie wykonać instrukcje pixel, vertex lub geometry shadera w 128 wątkach na takt zegara.
W R600 sprawa jest dużo bardziej skomplikowana. Popatrzmy na obrazek:

Wprowadzamy nowe pojęcie, 5 wątkowy, superskalarny procesor shaderowy. Układ AMD/ATI posiada 64 takie procesory. W każdym z nich znajdziemy 5 procesorów strumieniowych (SP), przy czym 4 wykonują operacje proste, a jeden specjalne. Problem w tym, że każdy SP wchodzący w skład procesora shaderowego może wykonywać tylko jeden wątek rozbity równolegle na 5 procesorów strumieniowych. Oznacza to, że R600 w jednym takcie zegara może wykonywać maksymalnie 64 wątki. To jeszcze nie koniec skomplikowanej architektury. Procesor Shaderowy u AMD pracuje w trybie VLIW (Very Long Instruction Word), pozwalającym rozbić jedną instrukcję na 5 równoległych operacji pod warunkiem, że operacje te nie są od siebie zależne.
Nie wgłębiając się dalej w temat i nie komplikując już i tak skomplikowanej architektury, możemy porównać czysto teoretycznie wydajność G80 z R600.

G80 wykonuje 128 wątków na cykl zegara, a każdy z nich to jedna operacja. R600 wykonuje 64 wątki na cykl lecz aż 320 operacji (każdy wątek może być rozbity na 5 równoległych operacji). Oznacza to, że w najlepszym przypadku R600 jest 2.5x szybszy od G80. Może się jednak zdarzyć, że jeden wątek będzie wykonywany tylko przez jeden procesor strumieniowy. W najgorszym przypadku R600 jest więc 2x wolniejszy od G80. Jak widać kluczowym elementem będzie kompliator AMD, który musi się postarać aby podzielić każdy wątek na maksymalnie 5 operacji.
Zaprezentowana tu wydajność odnosi się do jednego cyklu zegara. Należy jednak uwzględnić, że w G80 procesory strumieniowe pracują standardowo z zegarem 1.35GHz, podczas gdy w R600 z 740MHz. Okazuje się więc, że teoretyczna maksymalna przewaga R600 nad G80 maleje z 2,5x do około 1,37x . Natomiast największa teoretyczna przewaga G80 względem R600 zwiększa się z 2x do 3,64x.

Są to oczywiście tylko teoretyczne rozważania na temat wydajności procesorów strumieniowych w obu układach mające uświadomić nam jak bardzo różnią się one między sobą i jak różna może być ich wydajność względem siebie. Należy pamiętać, że moc procesorów strumieniowych jest ważna ale nie jest jedynym elementem wydajności całego układu. Przejdźmy zatem do opisu jednostek teksturujących i renderujących.

Strona 2 z 19 <<<123456...19>>>