2007-06-01 11:19
Autor: Sebastian Wiśniewski (NetCop)
72
AMD w DX10 czyli Radeon HD 2900XT
Strona 2 - Procesory strumieniowe
Procesory strumieniowe w R600
W układzie NVIDII G80 mamy 128 procesorów strumieniowych (SP), które są w stanie wykonać instrukcje pixel, vertex lub geometry shadera w 128 wątkach na takt zegara.
W R600 sprawa jest dużo bardziej skomplikowana. Popatrzmy na obrazek:
Nie wgłębiając się dalej w temat i nie komplikując już i tak skomplikowanej architektury, możemy porównać czysto teoretycznie wydajność G80 z R600.
G80 wykonuje 128 wątków na cykl zegara, a każdy z nich to jedna operacja. R600 wykonuje 64 wątki na cykl lecz aż 320 operacji (każdy wątek może być rozbity na 5 równoległych operacji). Oznacza to, że w najlepszym przypadku R600 jest 2.5x szybszy od G80. Może się jednak zdarzyć, że jeden wątek będzie wykonywany tylko przez jeden procesor strumieniowy. W najgorszym przypadku R600 jest więc 2x wolniejszy od G80. Jak widać kluczowym elementem będzie kompliator AMD, który musi się postarać aby podzielić każdy wątek na maksymalnie 5 operacji.
Zaprezentowana tu wydajność odnosi się do jednego cyklu zegara. Należy jednak uwzględnić, że w G80 procesory strumieniowe pracują standardowo z zegarem 1.35GHz, podczas gdy w R600 z 740MHz. Okazuje się więc, że teoretyczna maksymalna przewaga R600 nad G80 maleje z 2,5x do około 1,37x . Natomiast największa teoretyczna przewaga G80 względem R600 zwiększa się z 2x do 3,64x.
Są to oczywiście tylko teoretyczne rozważania na temat wydajności procesorów strumieniowych w obu układach mające uświadomić nam jak bardzo różnią się one między sobą i jak różna może być ich wydajność względem siebie. Należy pamiętać, że moc procesorów strumieniowych jest ważna ale nie jest jedynym elementem wydajności całego układu. Przejdźmy zatem do opisu jednostek teksturujących i renderujących.