A GCN architektúra első képviselőit, azaz az AMD Radeon HD 7970-et és HD 7950-et már bemutattuk. A Tahiti bizonyított, de most itt a Pitcairn amely kimondottan a nagy teljesítményre éhes játékosokat célozza meg, némileg elérhetőbb áron. Ők a Radeon HD 7870 és a HD 7850. E két típus a GIGABYTE-től és az ASUS-tól egyaránt érkezett, így a különféle mérések és a tuning mellett a CrossFireX-et megnéztük. Kezdjük!
AMD Radeon HD 7800 – a gamerek álma?
Ha a legrövidebben szeretnénk jellemezni a Pitcairn chipet, akkor csak annyit mondanánk, hogy a Graphics Core Next (GCN) architektúra a csúcsra tört. A lapka műszaki és felhasználói szemmel is kimagasló paramétereket mutat, úgyhogy mindenképp megérdemel pár sort, de előtte kezdjünk egy kis múltidézéssel.
2009 végén, 2010 elején indult hódító útjára az AMD Evergreen sorozat. A termékcsalád fél év alatt teljesedett ki, és négy grafikus processzorra épült. Akkor úgy tűnt, ez egy nehezen felülmúlható tempó lesz. Ma már tudjuk, hogy sétagalopp volt a Southern Islands családhoz képest. A vállalat mindössze 3 hónap alatt három GPU-val állt elő, minek köszönhetően sikerült letámadni a középkategóriát és felső szegmenst is. Most pedig ismerkedjünk meg a kirakós utolsó darabjával.
Lényegretörő megközelítés szerint vegyünk két Cape Verde GPU-t majd gyúrjuk össze őket. Az így kapott elegyet nevezzük el Pitcairnnek. Ettől kicsit azért összetettebb a dolog, valamint egy régebbi adósságunkat is most kívánjuk törleszteni.
A Pitcairn a TSMC 28 nm-es gyártástechnológiájának köszönhetően brutális tranzisztorsűrűséget ért el, hiszen 212 négyzetmilliméteren 2,8 milliárd tranzisztort tartalmaz. A Radeon HD 7800-as sorozat legerősebb tagja 20 GCN tömböt rejt magában, ami összesen 1280 stream processzornak felel meg. Ez a Tahiti és a Cape Verde lapkákhoz mérten nagyjából félúton mozog, de látni fogjuk, hogy a Pitcairn inkább a nagytesóhoz hasonlít – ezt a frontend és a backend is jól példázza. A chip két raszter és szintén kettő geometriai motort kapott.
Utóbbi nem sokkal különbözik a korábbi megoldásoktól, azonban a mérnökök számos optimalizációt hajtottak végre, minek köszönhetően javult a teljesítmény és a hatékonyság. A két darab kilencedik generációs tesszellátor egység természetesen képes a párhuzamos munkavégzésre. A munkájukat egyébként egy külön puffer segíti, gyorsítja. Ennek, és a számos kisebb fejlesztésnek köszönhetően a Radeon HD 7800 brutálisan meg tudja alázni a HD 6900 szériát a tesszelláció során. Ezzel lényegében sikerült egy szintre kerülni az NVIDIA GeForce GTX 500 sorozattal, ami elég nagy dolog, hiszen a rivális ezen a téren nagyon nem spórolt a tranzisztorokkal. A frontend kapcsán még meg kell említenünk a Command processzort, mely a terheléselosztásért és az ütemezésért felel.
Minden egyes CU (Compute Unit) négy darab textúrázóval rendelkezik, ebből következően a teljes értékű Pitcairn GPU összesen 80 textúrázó, illetőleg 320 Load-Store egységgel gazdálkodhat. Ezek annak ellenére tűnnek optimális értékeknek, hogy a Tahiti grafikus processzorokhoz mérten jelentős visszavágás történt. A komponens hierarchia mellőzi a radikális újításokat, változtatásokat, de erre igazából nem is volt szükség.
Mivel az AMD a Radeon HD 7800 sorozattal főleg a gamer társadalom igényeit kívánta kielégíteni, ezért a Pitcairn grafikus processzorban nagytakarításba kezdett, hiszen itt már nem olyan jelentős tényező a GPGPU alkalmazások alatt elért teljesítmény. A másodszintű gyorsítótár mérete 2 MB-ról 512 Kbyte-ra, a számítási csúcsteljesítménye dupla pontosság esetén pedig 947 GFLOP/s-ról 160 GFLOP/s-ra esett. A nagytesóhoz mérten jelentős a visszalépés, de az NVIDIA GK104 processzorral szemben már nem, hiszen az is hasonló technikai mutatókkal bír. Ettől függetlenül a GPU jó ismeretséget ápol a DirectCompute 11.1, OpenCL 1.2 C + + AMP API-kkal, tehát aggodalomra semmi ok. A szokásosnál is furcsább információkat látni a hivatalos marketing anyagban. A vállalat szerint elérkezett az idő arra, hogy az ATi Radeon HD 5800 sorozatú vezérlőket az AMD Radeon HD 7800 valamelyik tagjára cseréljük. Való igaz, előbbi széria már nem nevezhető a videokártyák királyának, ám akárhogy csűrjük-csavarjuk, attól még ez a váltás furcsa lépés lenne. Papíron jelentős a különbség az üresjárati fogyasztást illetően, de a marketingesek mind a két végletnél kicsit csúsztattak, így éles körülmények között más kép fogadna minket. A Cypress chipek fő gyengéje a tesszellátor egység, viszont ez jelenleg kevés játékban ütközik ki. A PCI Express 3.0 csatolóból származó előnyöket érthető okokból nem kommentálnánk. A végére maradt a 3D Mark 11. Nyilvánvalóan azért eshetett erre a választás, mert itt jelentősebb lehet a differencia. Ebben a szintetikus mérőprogramban nagyjából 30 százalékos különbségről beszélhetünk. A valamivel több mint 100 ezer forintos árcédulára pillantva ez minden, csak nem meggyőző. A teljesítmény szempontjából semmiképp nem ajánljuk a váltást, akárhogy is szeretné ezt az AMD.
Visszakanyarodva az architekturális boncolgatáshoz. A legnagyobb meglepetés a backend területen esett meg. A Pitcairn ugyanúgy 8 ROP klasztert tartalmaz, mint a Tahiti. Egy-egy ilyen „tömb” négy ROP egységet és 16 Z mintavételezőt tartalmaz, ennek megfelelően a HD 7870 1 GHz-es üzemi frekvenciája mellett az egy másodperc alatt kiszámolt pixelek száma roppant kedvezően alakult. A memória interfésznél már bejött a papírforma. A négy darab 64 bites memória vezérlő összkapacitása 256 bit. A videomemória alapértelmezett mérete 2048 MB. Elméletileg megvalósítható a 4 GB-os kiszerelés is, de nem sok értelme lenne. Az erősnek mondható backend kapacitás meglehetősen érdekes helyzeteket tud teremteni.
Természetesen a Pitcairn DirectX 11.1, PCI Express 3.0, Eyefinity 2.0 és Zero-Core támogatással bír. Utóbbi eljárást nem implementálta az NVIDIA, pedig a ZeroCore technológiának köszönhetően kikapcsolt kijelző mellett a teljes grafikus vezérlőt áramtalanítani lehet, és ebben a formában még aktív hűtésre sincs szükség. Az előnyök meggyőzőek: zéró zajszint, 3 wattos fogyasztás. A szinte tökéletes kiegyensúlyozás hozadékaként jól alakultak a fogyasztási mutatók. A Radeon HD 7870 esetén a PowerTune limit 190, míg a tipikus fogyasztás 175 watton áll. A kártya üresjáratban 10W alatt van, a ZeroCore révén pedig a 3W is elérhető. A GHz Edition jelzést itt is megtaláljuk, mely azt hivatott jelezni, hogy a termék elérte az 1 GHz-es üzemi frekvenciát. A Radeon HD 7850-nél sincs ok a szégyenkezésre. A vezérlő maximális energiaigénye 150 watt, de általában 130 wattal is beéri. A hasonló paraméterek okán az üresjárati fogyasztás nagyjából megegyező lehet.
Egy fontos terület részletezése időhiány miatt kimaradt a Radeon HD 7970 és a HD 7950 cikkünk kapcsán, ez pedig a PRT (Partially Resonant Textures), azaz a hardveres virtuális textúrázás. A mai grafikus processzoroknak komoly fejtörést okoz a nagy mennyiségű textúrák kezelése. Amikor a játékos áthalad az egyik pályarészről a másikra, akkor a CPU, a grafikus kártya és az adattároló folyamatos munkára van fogva. Mivel nagy mennyiségű információkkal kell dolgozni, így könnyen előfordulhat, hogy a betöltés nem lesz zökkenőmentes – a Rage játéknál szerintem nem kell részletezni ezt. Az AMD egy huszárvágással kívánja áthidalni ezt a problémát. A megoldás valóban egyszerű, de nagyszerű. A lényeg annyi, hogy tekintsük a grafikus kártya VRAM-ját egy textúra cache rendszernek.
A hamarosan felhasználásra kerülő textúrákat még azok alkalmazása előtt töltsük be a videomemóriába, amivel máris megoldottuk a problémát. Amikor a GPU fel kívánja használni az adatokat, akkor azokat (érthető okokból) már villámgyorsan el tudja érni. Bizonyos értelemben ez egyfajta textúra “streaming” eljárásnak is felfogható. A PRT tehát dinamikusan betölti a kiválasztott textúrákat, így a nagyméretű fájloknál is elkerülhető a bandwidth-hog, vagyis a sávszélesség bedugulása. Sajnos az adott játék grafikai motorját erre külön fel kell készíteni. Annyit biztosra vehetünk, hogy a Doom 4 támogatni fogja a Partially Resident Textures (PRT) megvalósítást. John Carmack valószínűleg már pezsgőbontással várta ezt a pillanatot, és a Rage furcsa grafikai anomáliáira gondolva mi is hasonló lelkesedéssel fogadtuk a dolgot.
Az UVD 3.0 hardveres gyorsítást kínál az DivX/Xvid, MPEG-4 Part 2 MVC tartalmakhoz is, a Video Code Engine (VCE) pedig az Intel Quick Sync Video AMD-s megfelelője. A VCE egy önálló hardver és csak a H.264-es videók transzkódolásának felgyorsítására hivatott. A motor lassabb, mint a shader feldolgozók a grafikus processzorban, ellenben sokkal energiahatékonyabb. Kétféle üzemmód áll a felhasználók rendelkezésére. Az elsőben csak a VCE dolgozik, ami önmagában is gyorsabb, mint a legtöbb CPU. Ebben az esetben nem fogunk lassulást tapasztalni, gond nélkül terhelhetjük a videokártyát vagy a központi egységet. A második opció a hibrid mód. A VCE és a GPU aritmetikai-logikai egységei közösen ugranak a feladatnak. Ez a „házasság” nyilván jó hatással van a kódolás sebességére, de ilyenkor ne lepődjünk meg, ha kedvenc játékunk „diavetítés” üzemmódba kapcsol át. Most már igazán jó lenne éles körülmények között látni, hogy pontosan mire képes a rendszer, de a megfelelő támogatás hiányában ez még odébb van.
Az Eyefinity 2.0 egyik érdekessége, hogy lehetőséget nyújt több monitoros konferencia beszélgetések többsávos hanggal történő lebonyolítására. Az eljárás hivatalos neve Discrete Digital Multi-Point (DDM) Audio.
Az architektúra rövid bemutatása után most más vizekre evezünk. Az AMD a Southern Islands család bevezetése óta folyamatosan próbálja javítani a játékokban elért képminőséget. Az első nagyobb frissítés a Radeon HD 7900-as sorozatú vezérlőket érintette. Az SSAA (Super-sampling Anti-Aliasing) élsimítás megjelenése a DirectX 10 és DirectX 11-es programok alatt mindenképpen örömteli jelenség volt. A későbbi Catalyst meghajtókban az AutoLOD algoritmus révén tovább javulhat a grafikai színvonal, de ez még nem minden, mert közben a programozók már javában dolgoznak az MLAA 2.0 eljáráson is. Az új megoldás jelentősen gyorsabb, mint elődje – ezt a Tom’s Hardware és az Anandtech mérései is megerősítik. További jó hír, hogy (papíron) már a Radeon HD 4000 szériától alkalmazható. A képminőség megítélése szubjektív, de összességében úgy fest, itt is sikerült továbblépni. A történet második epizódja a továbbfejlesztett anizotropikus szűrő algoritmus. Ez elméletileg teljesen megszünteti a korábban tapasztalt villogást, remegést és egyéb anomáliákat, ami elég jól hangzik – mi azért erre nem vennénk mérget. Az új algoritmus egyébként nem igényel további pufferelést, így nem terheli jobban a rendszer erőforrásait.
Második és harmadik pillantásra is azt kell mondjuk, a Pitcairn chip roppant kiegyensúlyozott lett. Az optimalizálásoknak hála a lapka mérete, fogyasztása kedvezően alakult, ami gyakorlatilag azt eredményezte a Radeon HD 7950 házon belül kapta meg a legerősebb konkurenciát. Az AMD igen komolyan alávágott a kisebbik Tahiti alapú kártyának, mely így valószínűleg teljesen elvesztette korábbi népszerűségét. Ez mindenképpen érdekes lépésnek tűnik, de utólag már logikus, ugyanis vitathatatlan, hogy a GK104 is egy igazán jól sikerült gamer chip lett. A mérnökök mind két oldalán tudásuk legjavát adták. A Pitcairn révén megmarad a mozgástér, hiszen a rá épülő kártyák egészen jó teljesítményszintet produkálnak, miközben a gyártási költségek kedvező szinten mozognak. A GK104 különböző variánsai magasabb sebességet produkálnak, de drágább előállítás mellett. Egyszerűen kellett egy ilyen chip az AMD-nek, mert a Tahiti annyira elmozdult a GPGPU irányába, hogy gamer vonalon már verhető lett.
A vállalat termékszámozása most kissé furcsán alakult. A Radeon HD 7800 sorozat határozott előrelépésnek tűnik a HD 6800-hoz mérten, minek köszönhetően a HD 7870 és a HD 7950 gyakorlatilag egy ligában mozog. A Radeon HD 7700 viszont a teljesítményt tekintve nem nagy durranás a HD 6700 szériához viszonyítva, pedig utóbbi csak egy átnevezés eredménye. Gyakorlatilag a közel két és féléves Juniper GPU-t alig 20%-kal múlja felül a Cape Verde, ami valljuk be, egyáltalán nem meggyőző előrelépés.