3.4.6 : Comparaison de performances
La figure 11 compare les performances obtenues sur un CPU avec 8 coeurs (4 coeurs hyperthreadés) avec G++ et NVC++. Les performances sont très prochent.
Figure 11 : Comparaison de performances de notre produit de hadamard avec G++ et NVC++. À gauche : le temps total. À droite : le temps par élément.
La figure 12 compare les performances obtenues sur un CPU avec 8 coeurs (4 coeurs hyperthreadés) avec la vectorisation par G++ et NVC++. Les performances -O3 -O4 sont identiques.
Figure 12 : Comparaison de notre produit de hadamard vectorisé avec G++ et NVC++. À gauche : le temps total. À droite : le temps par élément.