Tengo un bucle que ha sido paralelizado por OpenMP, pero debido a la naturaleza de la tarea, hay 4 critical
cláusulas.Cómo crear un perfil de cuellos de botella OpenMP
¿Cuál sería la mejor manera de perfilar la velocidad y averiguar cuáles de las cláusulas críticas (o quizás no críticas (!)) Ocupan la mayor parte del tiempo dentro del ciclo?
I uso Ubuntu 10.04 con g ++ 4.4.3
Modifiqué la publicación original con información adicional – Mikhail
Realicé dicha tarea modificando las fuentes de la biblioteca omp y añadiéndoles un rdtsc's – osgx