2011-10-12 06:01
Autor: Dominik Kujawski
122

AMD Zabezi – Bulldożer nadchodzi

Strona 2 - Budowa

Budowa


Wszystkie procesory oparte na nowej architekturze są zbudowane tak samo niezależnie czy są przeznaczone do użytku domowego, do profesjonalnych stacji roboczych czy serwerów. AMD chwali się pierwszym 8 rdzeniowym procesorem, jednak stwierdzenie to nie do końca jest zgodne z prawdą. Zależnie od wersji Zambezi będzie składał się z dwóch trzech albo i czterech modułów buldożer. W każdym takim bloku znajdują się po 2 rdzenie, jednak one zostaną omówione trochę później.

Podstawowe dane prezentuje nam poniższy schemat. Widzimy że każdy moduł został wyposażony w 2MB pamięć cache L2 oraz mamy do dyspozycji 8 MB współdzielonej pamięci poziomu 3. Podobnie jak w przypadku poprzedniej generacji, czyli Phenom’ów mamy do dyspozycji 16 bitową linię Hyper Transport. Kolejnym podobieństwem do poprzednika jest zintegrowany w procesorze mostek Nortbrige oraz kontroler Pamięci DDR3, różnicą natomiast jest brak kontrolera pamięci DDR2.

Przejdźmy zatem do budowy pojedynczego bloku - jak wspomnieliśmy wcześniej w każdym bloku znajdują się po dwa rdzenie. Jednak patrząc na schemat widzimy powielone jednostki ALU (jednostka arytmetyczno-logiczna) i tylko pojedynczą jednostkę FPU (jednostka obliczeń zmiennoprzecinkowych). Konstrukcja taka ma znacząco przyspieszyć aplikacje wielowątkowe jak i poprawić skalowanie w tego typu aplikacjach Ważne jest wyeliminowanie opóźnienia spowodowane obliczeniami dzielonymi na kilka osobnych rdzeni. Można by powiedzieć, że technologia opracowana przez inżynierów AMD jest podobna do Hyper-Threading Intela, jednak jest to mylne założenie - tutaj mamy realne jednostki obliczeniowe, a nie układ powielający procesory logiczne i podtrzymujący tylko stan procesów wykonywanych. Przy aplikacji wykorzystującej tylko pojedynczy wątek mamy pełny dostęp do współdzielonych zasobów. Jednak czy pojedynczy moduł jest dwu-rdzeniowy i czy związku z tym cały procesor można określić mianem prawdziwego ośmiordzeniowca pozostawiamy ocenie czytelników.

Dzięki modułowej budowie rdzenie procesora mają wspólny obszar instrukcji początkowych, w którym następuje rozdzielenie zadań dla nich. Poza tym wspólna jest także cała pamięć cache L2 oraz jednostka FPU, która ma ujednolicony harmonogram dla obu rdzeni.

Jednostki ALU nazwane przez AMD dedykowanymi rdzeniami cechują się ujednoliconym harmonogramem. To właśnie ta funkcja znacząca obniża opóźnienia , jak i odpowiada za lepsze rozdzielenie zadań dla wątków.

Podstawą działania tak ujednoliconego modułu jest system przewidywania, jego zadaniem jest tworzenie ciągów oraz wypełnienie kolejki rozkazów tak, żeby osiągnąć jak największą wydajność. Każdy dedykowany rdzeń jest wyposażony w osobą linię przewidywania.

Strona 2 z 3 <<<123>>>