GPGPU

General-purpose computing on graphics processing units (zkratka GPGPU) je způsob využití paralelizace na grafické kartě k výpočtu obecných algoritmů. Grafické karty dříve obsahovaly pouze fixní vykreslovací řetězec, který sloužil výhradně ke zpracování grafických primitiv a prezentaci na obrazovce. S příchodem programovatelných shaderů se však vyskytla možnost získat výstup operací prováděných grafickou kartou. Výpočty na grafické kartě jsou vhodné u algoritmů, které mají podobný formát jako grafická primitiva a obsahují mezi sebou minimální nebo žádné vazby (taková operace může být například převod pixelů barevného obrazu do šedotónového).

Historie a významná data

Listopad 2000: Direct3D 8.0 představil programovatelné shadery (vertex a pixel)[1]
Červenec 2002: OpenGL představila GLSL jako rozšíření v OpenGL 1.4
Září 2004: OpenGL 2.0 přidala jazyk GLSL do svého jádra
Červen 2007: Firma NVIDIA představila svůj framework CUDA, sloužící výhradně k paralelním výpočtům na grafických kartách
Červenec 2008: Direct3D 11.0 přidalo podporu compute shaderů[2]
Říjen 2009 – Apple představuje OpenCL, které později nahrazuje Close To Metal od AMD
Srpen 2012: OpenGL 4.3 přidává do své specifikace compute shadery
Září 2014: Apple představuje API Metal pro mobilní zařízení, které umožňuje využívat výkon grafické karty k obecným výpočtům
Listopad 2014: AMD představuje Carizzo a Carizzo-L, první čipy podporující HSA (Heterogeneous System Architecture).[3]

Princip

Grafický procesor (GPU) má značně rozdílnou architekturu na rozdíl od klasického procesoru. CPU má rozsáhlou instrukční sadu uzpůsobenou k realizaci obecných výpočtů. Architektura grafického čipu byla na druhou stranu vyvíjena s myšlenkou realizace malého množství specifických instrukcí (operací nad grafickými primitivy) paralelně nad velkou homogenní datovou sadou. V kombinaci s dostupností programovatelného řetězce, jmenovitě vertex, fragment, geometry a compute shaderů, mohou být grafické karty použity k urychlení obecných, avšak ze své podstaty masivně paralelních algoritmů.

Pro programování algoritmů se používá konceptu takzvaného kernelu, který aplikuje operaci paralelně na každé primitivum vstupních dat (např. pixel obrazu) zvlášť. Ukázka jednoduchého kernelu (v jazyce GLSL), který převádí pixely barevného obrazu do šedotónové hloubky může vypadat například takto:

#version 430

// Vstupy a vystupy
uniform readonly image2D vstup;
uniform writeonly image2D vystup;

void main() {
    // Ziskame koordinaty pixelu, ktery zpracovavame
    ivec2 koordinaty = ivec2(gl_GlobalInvocationID.xy);

    // Nacteme pixel ze vstupu
    vec4 pixel = imageLoad(vstup, koordinaty);

    // Prevedeme pixel do stupni sedi
    pixel.rgb = 0.144 * pixel.r + 0.587 * pixel.g + 0.299 * pixel.b;

    // A zapiseme pixel na vystup
    imageStore(vystup, koordinaty, pixel);
}

Použití

Na GPU lze při dostupnosti programovatelného řetězce implementovat jakýkoliv algoritmus, ovšem ne u každého takového algoritmu lze dosáhnout urychlení. Příklady vhodných aplikací pro urychlování na GPU mohou být algoritmy:

Počítačového vidění (předzpracování, segmentace, počítačové učení)
Fyzikální simulace (částicové simulace)
Kryptografické (výpočty kontrolních součtů)

Softwarové knihovny

Pro desktopové aplikace existují implementace otevřeného standardu OpenCL (spravován Khronos Group) a z používanějších také proprietární framework CUDA firmy NVIDIA. Pro vývoj na převažujících mobilních operačních systémech jsou dostupné knihovny Renderscript (pro OS Android) a Metal (pro iOS).

Související články

OpenGL – průmyslový standard specifikující multiplatformní rozhraní (API) pro tvorbu aplikací počítačové grafiky,
WebGL – jako OpenGL, pro JavaScript,
OpenAL – je audio standard,
OpenCL – průmyslový standard specifikující multiplatformní rozhraní (API) pro tvorbu výpočetně náročných aplikací,
GLUT – OpenGL Utility Toolkit,
ALUT – OpenAL Utility Toolkit,
DirectX – grafické API pro Microsoft Windows,
Direct3D – součást DirectX.

Reference

http://news.microsoft.com/2000/11/09/microsoft-announces-release-of-directx-8-0/
http://msdn.microsoft.com/en-us/library/windows/desktop/ff476342(v=vs.85).aspx#Full
HACHMAN, Mark. AMD reveals high-end 'Carrizo' APU, the first chip to fully embrace audacious HSA tech. PCWorld.com [online]. 2014-11-21 [cit. 2015-11-17]. Dostupné online. (anglicky)

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[1] ttp://news.microsoft.com/2000/11/09/microsoft-announces-release-of-directx-8-0/

[2] ttp://msdn.microsoft.com/en-us/library/windows/desktop/ff476342(v=vs.85).aspx#Full

[3] HACHMAN, Mark. AMD reveals high-end 'Carrizo' APU, the first chip to fully embrace audacious HSA tech. PCWorld.com [online]. 2014-11-21 [cit. 2015-11-17]. Dostupné online. (anglicky)