3.4.6 : Comparaison de performances



La figure 11 compare les performances obtenues sur un CPU avec 8 coeurs (4 coeurs hyperthreadés) avec G++ et NVC++. Les performances sont très prochent.

nothing nothing

Figure 11 : Comparaison de performances de notre produit de hadamard avec G++ et NVC++. À gauche : le temps total. À droite : le temps par élément.



La figure 12 compare les performances obtenues sur un CPU avec 8 coeurs (4 coeurs hyperthreadés) avec la vectorisation par G++ et NVC++. Les performances -O3 -O4 sont identiques.

nothing nothing

Figure 12 : Comparaison de notre produit de hadamard vectorisé avec G++ et NVC++. À gauche : le temps total. À droite : le temps par élément.