2010-07-12 06:00
Autor: Sebastian Wiśniewski (NetCop)
60

GeForce GTX 460 - Fermi jakiego nie znacie

Strona 1 - Wstęp

Wstęp


Dziś premiera nowej karty graficznej NVIDII - GeForce GTX 460. Jest to już czwarta karta oparta o architekturę FERMI z obsługą DirectX 11 jednak różni się ona od pozostałych trzech tym, że zastosowano w niej po raz pierwszy układ graficzny GF 104, który ma za zadanie poprawić błędy swojego starszego brata (GF100), a jednocześnie zaoferować bardziej konkurencyjne cenowo produkty marki GeForce. GF104 jest mniejszy od GF100, a co za tym idzie tańszy w produkcji. Dziś debiutujący model GTX 460 nie będzie jedynym bazującym na tym GPU ale to od niego będzie zależało jaką opinię będzie miało nowe Fermi. Zobaczmy co nam przygotowała NVIDIA.

Układ GF104 - nowy Fermi


Na pierwszy rzut oka GF104 wygląda jak połówka GF100. Nie jest to jednak prawda gdyż składa się on z 1.95 miliarda tranzystorów podczas gdy GF100 ma ich nieco ponad 3 miliardy. GF104 został nieco przekonstruowany w stosunku do GF100, a zmianie uległa budowa bloku SM (Streaming Multiprocessors). Układ GF104 składa się z dwóch klastrów GPC, w każdym z nich są 4 bloki SM. Oto jak teraz wygląda taki blok SM:

Wewnątrz znajdziemy 48 rdzeni CUDA, 8 jednostek teksturujących TMU oraz PolyMorph Engine odpowiedzialny między innymi za teselację. W układzie GF100 blok SM ma 32 procesory CUDA i 4 jednostki TMU.
Większe upakowanie procesorów CUDA i jednostek teksturujących dało oszczędności w krzemie, a jednocześnie pozwoliło zachować dobrą wydajność. Podsumowując, wewnątrz mamy:
- 384 procesory CUDA
- 64 jednostki teksturujące
- 8 teselatorów
- 32 jednostki renderujące ROP
- 256 bitowy kontroler pamięci
Samą architekturę FERMI opisywałem już wcześniej.

GeForce GTX 460



Model referencyjny

Na początek ciekawostka. GeForce GTX 460 nie wykorzystuje pełnej mocy układu GF104. Jeden blok SM jest w nim zablokowany, a więc ma 336 procesorów CUDA, 56 jednostek TMU oraz 7 teselatorów. NVIDIA zaplanowała dwie wersje karty. Ta z 1GB RAM ma szynę pamięć 256 bit oraz 32 jednostki ROP natomiast ta z 768MB ma szynę 192 bitową i 24 jednostki ROP.
Taktowanie referencyjne dla obu wersji to 675MHz dla rdzenia, 1350MHz dla procesorów CUDA oraz 900MHz (DDR 3600) dla pamięci GDDR5. TDP modelu 1GB wynosi 160W natomiast modelu 768MB 150W.

Strona 1 z 21 12345...21>>>