Realizace na paltformě CUDA s velkou řadou optimalizací (masivní many-core paralelismus).
Překlad pomocí
nvcc main.cu --gpu-architecture=sm_50 --use_fast_math --optimize 3
Poznámka: --gpu-architecture=sm_50
změnit dle možností cílové GPU karty.
Součástí semestrální práce je rovněž vypracování podrobného reportu o práci algoritmu, implementaci a naměřených výsledcích. Report je rovněž součástí tohoto repozitáře (report.pdf).