Hello world CUDA

HELLO CUDA! Martin Pernica Martin Pernica Hello CUDA!

KDO JSEM? Hello CUDA! Martin Pernica • Již 10 let
programuji ! • Miluji technologie ! • Výzvy jsou pro mě v životě nutností • Aktuálně “vývojář her”

O NÁS - SOULBOUND GAMES Hello CUDA! I have a
dream ... Martin Pernica

CO POUŽÍVÁME? Hello CUDA! • Unity3D Pro • Unreal Engine
3/4 • CryENGINE • Vlastní low-level kód - C++/Objective-C/ASM • Vlastní shadery • Procedurální materiály Substance ! • Oculus Rift • Xbox One, PS4 • NVIDIA APEX, PhysX, CUDA Martin Pernica

Hello CUDA! Martin Pernica ZAČÍNÁME • Ještě než se podíváme
na CUDA je nutné si něco říct o GPU …

GRAPHIC PROCESSING UNIT Hello CUDA! Martin Pernica • Masivně multivláknové
! • Mnohojádrové čipy • NVIDIA TESLA • 128 scalar processors • ~12 000 concurrent threads • 500+ GFLOPS

GPU VS CPU Hello CUDA! Martin Pernica • CPU •
Komplexní instrukční sada • Optimalizované pro rychlost provedení 1 instrukce • GPU • Hodně jednoduchá instrukční sada • Optimalizované pro provádění stovek až tisíců instrukcí paralelně

GPU = HRY? Hello CUDA! Martin Pernica • Ano i
ne • Hry primárně používají “shadery” pro práci s GPU • Shadery obsahují specifické funkce pro práci s 3D grafikou • GPU má optimalizované procesory/paměti pro 3D grafiku

GPU = VÝPOČTY? Hello CUDA! Martin Pernica • Chceme využít
sílu GPU na “běžné” výpočty (často řešené přes CPU) • Pomocí “shaderů” by to bylo komplikované • Potřebujeme “hezčí” jazyk pro tyto výpočty

CO JE TO CUDA? Hello CUDA! Martin Pernica • “Hezký
jazyk pro paralelní výpočty na GPU” ! • CUDA C • Kernely ! • Ideálně používat na Fermi a vyšší • Pouze nVidia karty :( • Možno počítat i na CPU

PROČ CUDA A NE OPENCL? Hello CUDA! Martin Pernica •
Lepší API • Aktivnější vývoj ze strany nVidie • NVIDIA se také podílí na vývoji OpenCL (Khronos group) ! • Lepší nástroje a ovladače • profiler, cuda-gdb, cuda-memcheck, nsight • Občas “rychlejší” ! • Statická kompilace kernelu (také “JIT”, ale s omezeními) • Může být i nevýhoda (optimalizace pro dané GPU)

HOST, DEVICE Hello CUDA! Martin Pernica • Host = CPU
a jeho pamět • Device = GPU a jeho pamět

KERNEL Hello CUDA! Martin Pernica • Kernel slouží k uložení
GPU kódu • CUDA C • Většinou externí soubor • Podobný shaderům

WORKFLOW Hello CUDA! Martin Pernica • Provedení host kódu •
Alokace GPU paměti • Přesun dat z RAM do VRAM • PCI sběrnice • Provedení kernelu (device code) • Ukládání (mezi)výsledků do VRAM • Přesun dat z VRAM do RAM • Provedení host kódu

STRUKTURA Hello CUDA! Martin Pernica • Grid • 1D, 2D,
3D • Bloky jsou uspořádany do mřížky, bloky musí být nezávislé, každý blok v mřížce má identifikátor - blockIdx ! • Block • 1D, 2D, 3D • Vlákna v bloku sdílí pamět, mohou být synchronizována, každé vlákno v bloku má svůj identifikátor - threadIdx ! • Threads

PAMĚTOVÝ MODEL Hello CUDA! Martin Pernica • GPU obsahuje ~6
programovatelných pamětí ! • Registry • Lokální • exkluzivní přístup pro 1 vlákno • může být “pomalá” • Sdílená • přímo na čipu • každý blok má svou • přístup přes banky • Globální • Pamět pro konstanty • Pamět pro textury

CUDA 6 Hello CUDA! Martin Pernica • Zjednodušené API •
Lepší podpora konstrukcí v CUDA C • Lepší “automatická” škálovatelnost na více GPU • Unifikovaná pamět!!!!

CUDA 6 - UNIFIKOVANÁ PAMĚT Hello CUDA! Martin Pernica •
Killer feature!

HELLO WORLD CUDA Hello CUDA! Martin Pernica • CUDA používá
vlastní compiler • host, device kód • nvcc • LLVM, clang, gcc, g++, MS C++ compiler

HELLO WORLD CUDA Hello CUDA! Martin Pernica • __global__ říká,
že funkce bude prováděna na device a volána z host • nvcc rozdělí host a device kód • device kód zkompiluje pomocí NVIDA compileru • host kód systémovým compilerem

HELLO WORLD CUDA Hello CUDA! Martin Pernica • <<<1, 1>>>
říká, že má být volání provedeno z hostu na zařízení • “kernel launch” • <<<N, V>> • N počet bloků pro výpočet • V počet vláken v bloku

PRÁCE S PAMĚTÍ (CUDA 5) Hello CUDA! Martin Pernica •
cudaMalloc() • cudaFree() • cudaMemcpy() • Podobně jako malloc(), free(), memcpy()

ROZŠÍŘÍME KERNEL Hello CUDA! Martin Pernica • Vytvoříme kernel add
• Tři argumenty • Ukazatele do device paměti • Třetí na uložení výsledku • Pozn.: Toto není ideální kód, protože každé vlákno dělá stejnou práci!

Hello CUDA! Martin Pernica

ASYNCHRONNÍ Hello CUDA! Martin Pernica • Veškerý CUDA kód běží
asynchronně ! • To znamená, že CPU nečeká na dokončení kernelu! • cudaMemcpy() blokuje, cudaMemcpyAsync() neblokuje CPU ! • Můžeme také synchronizovat pomocí cudaDeviceSynchronize() či cudaStreamSynchronize()

VYUŽITÍ CUDA Hello CUDA! Martin Pernica • Hry • simulace
vody, simulace vlasů, ray tracing • Video aplikace • Filmový průmysl • Výzkum • Umělá inteligence • Urychlení běžné aplikace • …

LEARN CUDA Hello CUDA! Martin Pernica • Kurz na Udacity
- Intro to Parallel Programming • Kurz Pluralsight - Parallel Computing with CUDA • NVIDIA - CUDA Education & Training • …

OTÁZKY? Hello CUDA! Martin Pernica [email protected] | @martindeveloper

JE PROGRAMOVÁNÍ TVŮJ ŽIVOT? Hello CUDA! Martin Pernica

OTEVŘENÉ PRACOVNÍ POZICE Hello CUDA! Martin Pernica • iOS samuraj
• Cocoa Touch, Objective-C ! • Android bukanýr • Java, Android SDK/NDK ! • Windows Phone ninja • .NET, C#, XAML ! • PHP gladiátor • OOP, Symfony Napiš na [email protected]

DĚKUJI ZA POZORNOST! Hello CUDA! Martin Pernica [email protected] | @martindeveloper

Hello world CUDA

Hello world CUDA

Martin Pernica

More Decks by Martin Pernica

Other Decks in Programming

Featured

Transcript

HELLO CUDA! Martin Pernica Martin Pernica Hello CUDA!

KDO JSEM? Hello CUDA! Martin Pernica • Již 10 let

O NÁS - SOULBOUND GAMES Hello CUDA! I have a

CO POUŽÍVÁME? Hello CUDA! • Unity3D Pro • Unreal Engine

Hello CUDA! Martin Pernica ZAČÍNÁME • Ještě než se podíváme

GRAPHIC PROCESSING UNIT Hello CUDA! Martin Pernica • Masivně multivláknové

GPU VS CPU Hello CUDA! Martin Pernica • CPU •

GPU = HRY? Hello CUDA! Martin Pernica • Ano i

GPU = VÝPOČTY? Hello CUDA! Martin Pernica • Chceme využít

CO JE TO CUDA? Hello CUDA! Martin Pernica • “Hezký

PROČ CUDA A NE OPENCL? Hello CUDA! Martin Pernica •

HOST, DEVICE Hello CUDA! Martin Pernica • Host = CPU

KERNEL Hello CUDA! Martin Pernica • Kernel slouží k uložení

WORKFLOW Hello CUDA! Martin Pernica • Provedení host kódu •

STRUKTURA Hello CUDA! Martin Pernica • Grid • 1D, 2D,

PAMĚTOVÝ MODEL Hello CUDA! Martin Pernica • GPU obsahuje ~6

CUDA 6 Hello CUDA! Martin Pernica • Zjednodušené API •

CUDA 6 - UNIFIKOVANÁ PAMĚT Hello CUDA! Martin Pernica •

HELLO WORLD CUDA Hello CUDA! Martin Pernica • CUDA používá

HELLO WORLD CUDA Hello CUDA! Martin Pernica • global říká,

HELLO WORLD CUDA Hello CUDA! Martin Pernica • <<<1, 1>>>

PRÁCE S PAMĚTÍ (CUDA 5) Hello CUDA! Martin Pernica •

ROZŠÍŘÍME KERNEL Hello CUDA! Martin Pernica • Vytvoříme kernel add

Hello CUDA! Martin Pernica

ASYNCHRONNÍ Hello CUDA! Martin Pernica • Veškerý CUDA kód běží

VYUŽITÍ CUDA Hello CUDA! Martin Pernica • Hry • simulace

LEARN CUDA Hello CUDA! Martin Pernica • Kurz na Udacity

OTÁZKY? Hello CUDA! Martin Pernica [email protected] | @martindeveloper

JE PROGRAMOVÁNÍ TVŮJ ŽIVOT? Hello CUDA! Martin Pernica

OTEVŘENÉ PRACOVNÍ POZICE Hello CUDA! Martin Pernica • iOS samuraj

DĚKUJI ZA POZORNOST! Hello CUDA! Martin Pernica [email protected] | @martindeveloper