5.8.10 : Conclusion

Si l'on prend en compte toutes les performances obtenues précédemment, on constate que l'implémentation qui utilise nvc++ est globalement deux fois plus rapide que l'implémentation CUDA noteDes fois plus des fois moins, mais globalement c'est ça.. Toutefois, on remarque que le temps de calcul réel est certes réduit mais de seulement quelques pourcents. La vraie optimisation de nvc++ réside dans la quantité d'appels système qui est réduite d'un facteur deux à pratiquement trois sur cetrains GPU.

Pour conclure, on peut dire que l'utilisation de langages standards comme C++17 et même Fortran 2018 permet une très forte démocratisation de l'utilisation des GPU qui restait jusque là cantonée aux seuls experts du domaine qui devaient, en plus de maitriser l'architecture matérielle, utiliser des langages tiers (comme CUDA), ou des bibliothèques tierses (comme Sycl, Kokkos, OpenCL, OpenACC, etc).

Donc, ça ouvre des portes, et en plus ça créé un précédent pour que la communauté Open-Source ouvre encore plus de portes.

J'espère que tout coeur que vous vous êtes amusés en lisant ce cours comme je me suis moi-même amusé à l'écrire.