12.3.8 : Les performances masquées unseq avec deux std::transform

La figure 12 montre les performances de nos implémentations masquées et non-séquentielles et vectorisées avec deux std::transform imbriquées. Ça commence à se rapporcher, les meilleures performances sont en dessous de 0.1 ns/el ce qui est encourageant.

nothing nothing

Figure 12 : En haut : le temps de calcul total de nos implémentations non-sequentielles et vectorisées avec deux std::transform imbriquées. En bas : le temps de calcul par élément de ces implémentations.



L'utilisation de deux std::transform à la suite permet d'exprimer notre calcul de calibration en deux triadiques. Afin d'éviter d'allouer un temporaire pour cela, nous avons utilisé le tableaux de valeurs à calibrer en entrée-sortie.