4.3.3.4 : Résultats des tests de performances

La figure 7 montre les résultats des tests de performances obtenus avec GCC 9.3.0 sur un Intel® Core™ i7-7820HQ CPU @ 2.90GHz × 8 avec notre implémentation naïve.

nothing nothing

Figure 7 : À gauche : temps total d'éxécution en fonction du nombre d'éléments à traiter. À droite : temps moyen pour traiter un élément en nano-seconde an fonction du nombre total d'éléments à traiter.



Le résultat est sans appel, l'implémentation en fonction intrinsèques est prèt de 10 fois plus rapide que l'implémentation vectorisée que l'on avait jusque là.

Fort de ce constat, allons voir ce que cela donne avec une implémentation complète.