Estoy usando los recursos de Google (http://google-perftools.googlecode.com/svn/trunk/doc/cpuprofile.html) para el perfil de CPU --- es una herramienta maravillosa que me ha ayudado a realizar una gran cantidad de mejoras de tiempo de CPU en mi aplicación.perfil/optimización de C++: cómo obtener una mejor granularidad de perfiles en una función optimizada
Desafortunadamente, he llegado al punto de que el código es aún un poco lento, y cuando se compila utilizando el nivel de optimización de -O3 de g ++, todo lo que sé es que una función específica es lenta, pero no qué aspectos son lentos .
Si elimino el distintivo -O3, las partes no optimizadas del programa sobrepasan esta función y no obtengo mucha claridad en las partes reales de la función que son lentas. Si dejo el indicador -O3, entonces las partes lentas de la función están en línea, y no puedo determinar qué partes de la función son lentas.
¿Alguna sugerencia? ¡Gracias por tu ayuda!
No puedo hablar por CodeAnalyst, pero oprofile es increíble! el comando opannotate me dio una anotación de línea de origen tal como lo describió. ¡Gracias! – Adam
CodeAnalyst es una GUI sobre una versión especializada de oprofile. También puede usar CodeAnalyst en Linux. – Carlos