Estoy tratando de optimizar algunas operaciones aritméticas mediante el uso de los conjuntos de instrucciones MMX y SSE con ensamblaje en línea. Sin embargo, no he podido encontrar buenas referencias para los tiempos y usos de estos conjuntos de instrucciones mejoradas. ¿Podría ayudarme a encontrar referencias que contengan información sobre el rendimiento, la latencia, los operandos y quizás una breve descripción de las instrucciones?Conciso instrucciones de instrucción SSE y MMX con latencias y rendimiento
Hasta ahora, he encontrado:
Intel Instrucción Referencias Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2A y Intel 64 and IA-32 Architectures Developer's Manual: Vol. 2B
Intel Guía de optimización http://www.intel.com/Assets/PDF/manual/248966.pdf
Tiempos de enteros Operaciones http://gmplib.org/~tege/x86-timing.pdf
La guía de Agner es excelente. Exactamente lo que necesito – Joe