2010-08-02 9 views

Respuesta

1

Eche un vistazo a gprof y al VTune de Intel. Valgrind con la herramienta cachegrind podría ser útil también.

+1

En cuanto gprof: http://stackoverflow.com/questions/1777556/alternatives-to-gprof/1779343#1779343 –

2

Para Linux, recomiendo Zoom para este tipo de perfiles. Puede obtener una evaluación gratuita de 30 días para probarla.

+1

Zoom es bastante bueno, y no suelen decir eso. –

1

Allinea MAP es ideal para esto. Resaltará el pobre rendimiento de la memoria caché, el uso de la memoria y el tiempo de ejecución hasta las líneas de origen de su código. No es necesario volver a compilar o instrumentar la aplicación para perfilarla con Allinea MAP, lo que hace que sea inusualmente fácil de usar. En la mayoría de los sistemas HPC y con la mayoría de los MPI, toma su archivo binario, lo ejecuta y carga el código fuente automáticamente para mostrar los datos de rendimiento grabados.

Cuestiones relacionadas