Itt az idő! Sokáig vártunk rá, sok helyről sokfélét hallottunk róla, de végre megérkezett az NVIDIA új Kepler névre keresztelt architektúrája, mely a Fermi utódjának tekinthető. Vagy mégsem? Cikkünkben nem csak a technológiával kapcsolatban tesszük helyre a dolgokat, hanem a GK104 kódnevű GeForce GTX 680 kártya lelki világának ismertetésének természetesen annak minden jellemzőjét sorra vesszük, a fogyasztás és a melegedés mellett sok szempontból történő teljesítménybeli vizsgálatot is végeztünk. Vágjunk bele!
Technológia
Eddig a konszenzus az volt, hogy hosszú távon a GPU általános számítási teljesítménye nagyobb értéket képvisel, mint a háromdimenziós játékokban felmutatott sebesség. Ez az irányvonal jelentős mértékben kihatott az NVIDIA Fermi grafikus kártyákra, azonban az első Kepler chip megtörte ezt az elvet. Néhány oldal múlva kiderül, hogy érdemes volt-e ezt meglépni.
Ismerkedés a GK104 GPU-val
A GeForce GTX 680 videokártya a korábban már annyit emlegetett GK104 grafikus processzorra alapoz. A TSMC 28 nm-es gyártástechnológiájával készülő lapka mérete 294 négyzetmilliméter és 3,54 milliárd tranzisztorból épül fel. Az AMD Tahiti kódnevű megoldásához mérten ez egészen kedvező érték – ez elsősorban az előállítási költségekben mutatkozhat meg. A GPU legütősebb paramétere az 1536 CUDA mag, mely háromszor több, mint a GeForce GTX 580 esetében. Maga a chip 4 GPC-vel (Graphics Processing Cluster) rendelkezik, ahol két SMX (Shader Multiprocessor) kapott helyet. Az SMX egy PolyMorph 2.0 motort, egy utasítás-gyorsítótárat, 192 CUDA magot, 16 textúrázót és természetesen elsőszintű átmeneti tárolót rejt magában. Itt jegyeznénk meg, hogy az eddig alkalmazott Shader órajel már a múlté, így most a lapka minden komponense azonos frekvenciát követ, ami az ütemezés szempontjából tulajdonképpen jó dolognak mondható.
[+]
Spórolj NVIDIA módra
A korábbi tapasztalatok alapján láthatjuk, hogy az új nagyágyú alapját adó chip most meglepően kedvező fizikai paraméterekkel bír. A GeForce GTX 280, 480 és 580 kártyákhoz mérten az újonc teljesen más kategóriában mozog. Most röviden bemutatjuk azokat a fejlesztéseket, újításokat, melyek révén a mérnököknek sikerült kordában tartaniuk a tranzisztorszámot és a chip méretét.
[+]
Minden Shader Multiprocessor egy tesszellátor egységgel büszkélkedhet, azaz összesen 8 feldolgozóról beszélhetünk. Ha csak a számokat nézzük, akkor azt hihetnénk, hogy az előző generációhoz mérten ezen a ponton visszalépés történt, de mivel a tesszellátorok teljesítménye megduplázódott, ezért összességében mindenképpen előrelépés könyvelhető el. A legnagyobb változás a backend kapcsán esett meg. A GK104 GPU 256-bites memóriabuszon keresztül éri el a 2 GB-nyi GDDR5-ös fedélzeti memóriát, a memórialapkák effektív 6,0 GHz-en ketyegnek. Mit jelent ez a gyakorlatban? A GeForce GTX 580-hoz mérten a memóriabusz szélessége a felére csökkent, de ezt a vérlázítóan magas memória órajellel teljes mértékben sikerült kompenzálni. Ez egyúttal hatalmas fricska, hiszen az AMD korábban ezen a ponton mindig más dimenzióban járt, most viszont a Radeon HD 7970-et is sikerült fél GHz-cel beelőzni. Nem elhanyagolható mértékű megtakarítást jelent a ROP egységek számának optimalizálása sem. Eddig a házi feladat csillagos ötös, de most jön a fekete leves.
Annak ellenére, hogy a GeForce GTX 680 rendkívül széleskörű API támogatással rendelkezik (CUDA C, CUDA C++, CUDA Fortran, OpenCL, DirectCompute és Microsoft C++ AMP), melyek ugyan az általános célú programozhatóságban valóban kulcsfontossággal bírnak, mégis pár dolog nagyon hiányzik. A teljesítményigényes, lebegőpontos számításokban gazdag feladatokban, de úgy általában is a GPGPU piacon fontos tényező a dupla pontosságú számítási teljesítmény. Ezen a ponton igen komolyan támadható az új Kepler lapka. A chip elméleti viszonylatban a szimpla pontosságú számítási teljesítmény huszonnegyedére képes dupla pontosság mellett, ami rögtön kiütközik a SiSoftware Sandra 2012 mérőprogramban. A GeForce GTX 680 még elődjét sem képes elverni, az AMD Radeon HD 7900 sorozat pedig teljesen más kategóriában mozog. A további optimalizáció jegyében a mérnökök nem implementálták az ECC és a virtuális memória támogatást, a különböző gyorsítótárak méretét pedig a még épp elfogadható szintre korlátozták, így esett meg az, hogy a GeForce GTX 580 másfélszer több másodszintű tárolót tartalmaz, mint az új jövevény. Főleg a hardveres virtuális textúrázás hiánya miatt fáj a szívünk, mert így komoly fejtörést okozhat a grafikus processzornak a nagy mennyiségű textúrák kezelése. Kíváncsian várjuk, hogy a Doom 4 alatt lesz-e még ennek böjtje. A GPGPU teljesítményt a következő oldalon foglaljuk taglalni. Elöljáróban annyit, hogy a pezsgőt érdemes lehet visszatenni a hűtőbe.
Innovációban (még így) sincs hiány
Természetesen a GeForce GTX 680 megfelel a PCI Expressz 3.0 szabványnak, támogatja a DirectX 11.1 és egyben az NVIDIA GPU Boost technológiát is. A GPU Boost eljárás lehetővé teszi a mag órajelének automatikus beállítását. Annak érdekében, hogy a teljesítmény mindig ideális szinten mozogjon, a Kepler chipek a grafikus processzor terhelését, a fogyasztást és az aktuális hőmérsékletet is figyelembe veszik, és ennek függvényében emelik a tempót. A hivatalos dokumentáció alapján az órajel emelés 100 ms alatt lezajlik, így a felhasználók ebből semmit nem vesznek észre. A gyakorlatban ez azt jelenti, hogy a GK104 alapból 1006 MHz-es sebességen üzemel (core base), de az előbbi tényezők kiértékelése után a chip ezt akár 1110 MHz-ig is feltornázhatja (core boost). Az NVIDIA úgy számol, hogy a GPU Boost által elért átlagos eredmény 1056 MHz-re tehető, de kedvező esetben valóban fogható az 1,10 GHz is. Erre a külföldi számítástechnikai oldalaknál már a rajt napján láttunk példát. Egészen félelmetes a tempó, így már egyáltalán nem csoda, hogy sikerült megközelíteni a korábbi kétfejű nagyágyút, a GeForce GTX 590-et. Az MSI Afterburner és az EVGA Precision X tuning segédprogramban a maximális teljesítmény, valamint az órajel ellensúlyozás is állítható.
A vállalat a csúszás miatt további exkluzív szolgáltatásokkal kívánja kárpótolni a rajongókat, így született meg a Frame Rate Target, az Adaptive Vertical Sync és az NVENC. Az első gyakorlatilag nem más, mint egy módosítható FPS korlát. Ez akkor lehet szerencsés, ha kedvenc játékunk feleslegesen magas sebességen pörög. Érdemes elgondolkozni a Frame Rate Target alkalmazásán, amennyiben csökkenteni szeretnénk a zajkibocsájtást és a fogyasztást.
Az Adaptive Vertical Sync, azaz a függőleges szinkronizálás dinamikus engedélyezése az egyenletes sebességet hivatott fenntartani. Amikor az adott alkalmazás sebessége a monitor képfrissítési rátája alá csökken, akkor a jobb teljesítmény érdekében érdemes kikapcsolni a szinkronizálást. Az eljárás lényegében ezt valósítja meg – természetesen felhasználói beavatkozás nélkül.
Az NVENC egy fix funkciós egység, mely a H.264-es videók kódolását hivatott felgyorsítani. Itt elsősorban nem kiugró teljesítménynövekedésre kell számítani, hanem inkább arra, hogy a munkafolyamat sokkal kevesebb energiafelhasználással lezajlik, mint korábban. A CyberLink MediaEspresso alkalmazást már felkészítették az NVENC által nyújtott lehetőségek kiaknázására. Az előző generációhoz mérten egészen megdöbbentő a fejlődés. A német ComputerBase mérései alapján a GeForce GTX 680 több mint 100 wattal kevesebb energiaigény mellett is hamarabb végzett, mint elődje.
Akinek még ez sem elég, az tekintse meg az FXAA élsimító eljárást. Az algoritmus a GK104 magas shader teljesítményére alapoz. Az FXAA olyan képminőséget ér el, mint a 4x-es MSAA (Multi-Sample AntiAliasing), ám 60 százalékkal magasabb tempó mellett. Sajnálatos, de az AMD ZeroCore fogyasztás csökkentő eljárását semmilyen formában nem sikerült beépíteni, de összességében egyáltalán nem lehet okunk panaszra.
[+]
A GeForce GTX 680 támogatja az NVIDIA 3D Vision Surround technológiát. A szerencsés tulajdonosok akár négy monitort is felhasználhatnak a jobb vizuális élmény érdekében.
A rövid áttekintés után kijelenthetjük, hogy az NVIDIA GeForce GTX 680 nem véletlenül a legerősebb egy GPU-s kártya a piacon, de a 2 GB VRAM extrém magas felbontásban szűkössé válhat. A pletykák alapján a zöldek később még előállhatnak egy 4 GB fedélzeti memóriával felvértezett modellel is, de akkor sincs baj, ha ez végül is nem valósul meg. A partnerek már számos felturbózott variánssal elkészültek.
A felhasznált lapka számozása azt erősíti meg, hogy a GK104 a gamer vonalat képviseli, amit már a GF104 és a GF114 elég jól kitaposott. Ennek megfelelőn az első Kepler alapú lapka nem a GPGPU alkalmazások alatt brillírozik, ám a játékokban verhetetlen, a chipméret és a fogyasztás pedig kifejezetten tetszetősen alakult. Ez egyúttal azt is tükrözi, hogy a GCN chippel az AMD nagyon erősen célkeresztbe vette a professzionális igények kielégítését, a GPU szélesebb körű alkalmazását. Ennek köszönhető, hogy a Tahiti alapú kártyák nagyobb lapkaméret mellett a legtöbb játékban kisebb teljesítményt nyújtanak, mint a GK104-et bevető GeForce GTX 680.