2012-03-21 21:20
Autor: Sebastian Wiśniewski (NetCop)
76

GeForce GTX 680 - NVIDIA kontratakuje

Strona 2 - Architektura GK104

Architektura układu GK104



GPC
Podobnie jak w układzie GF100/110 mamy cztery klastry przetwarzania grafiki GPC jednak w przeciwieństwie do wspomnianych układów wewnątrz znajdują się dwa bloki SMX, a nie 4 SM. Każdy klaster GPC ma dostęp do własnych jednostek ROP.


Tak wygląda schemat GPC

SMX
Blok SMX jest sercem całego układu. To tu znajdują się zunifikowane shadery pixel/vertex/geometry, a także tu wykonywane są wszelkie obliczenia GPGPU, obróbka wielokątów, teselacja i teksturowanie.

Wewnątrz takiego bloku znajduje się aż 192 procesory strumieniowe (CUDA), 16 jednostek teksturujących TMU, 4 shedulery rozdzielające pracę dla procesorów CUDA oraz usprawniony Polymorph Engine odpowiedzialny między innymi za teselację.

Polymorph Engine został usprawniony i ma 2x większą wydajność niż ten w Fermi. Usprawnienia pozwoliły na redukcję ich ilości z 16 do 8. Jeśli dodamy do tego wyższe taktowanie to okaże się, że nowy silnik pracuje o 30% szybciej niż ten w Fermi.


Zmiany w ilości poszczególnych elementów SM jakie zaszły między Fermi i Keplerem

Cache L2
Pomiędzy blokami GPC znajduje się wspólna pamięć cache drugiego poziomu. W stosunku do Fermiego zmniejszono jej ilość z 768KB do 512KB ale jednocześnie zwiększono jej przepustowość aż o 73%.


Szczegóły cache L2

Bindless Textures
Zgodnie z DirectX 11 procesory strumieniowe mogą mieć dostęp jednocześnie do 128 tekstur. Kepler znosi to ograniczenie i jego shadery mogą mieć dostęp do nieograniczonej ilości tekstur. Funkcję tą NVIDIA nazwała Bindless Textrures.

Strona 2 z 20 <<<123456...20>>>