5.3.1.4.2 : Cas avec le flag denorm to zero


La figure 46 montre les performance obtenues avec un sinus lorsqu'il traite des tableaux initialisés ou non avec des nombres dénormalisés. On constate que l'arrondi des nombres dénormalisés à zéro permet de régler globalement le problème de performance.

nothing nothing

Figure 46 : Performances obtenues avec l'optimisation -Ofast entre un sinus de référence (+ violet) et la même fonction mais sur des tableaux initialisés aléatoirement avec des nombres dénormalisés, entre 1 (001) et 100\% (1). À gauche, le temps total en nanosecondes en fonctions du nombre d'éléments. À droite, le temps par élément en nanosecondes en fonctions du nombre d'éléments.



La figure 47 montre les performance avec un sinus vectorisé lorsqu'il traite des tableaux initialisés ou non avec des nombres dénormalisés. On constate que l'arrondi des nombres dénormalisés à zéro permet de régler le problème de performance.

nothing nothing

Figure 47 : Performances obtenues avec l'optimisation -Ofast entre un sinus vectorisé (+ violet) et la même fonction mais sur des tableaux initialisés aléatoirement avec des nombres dénormalisés, entre 1 (001) et 100\% (1). À gauche, le temps total en nanosecondes en fonctions du nombre d'éléments. À droite, le temps par élément en nanosecondes en fonctions du nombre d'éléments.