He estado leyendo sobre las extensiones del conjunto de instrucciones x86, y solo parecen útiles en algunas circunstancias bastante específicas (por ejemplo, HADDPD - (Horizontal-Completo-Envasado-Doble) en SSE3). Estos requieren un cierto diseño de registro que debe configurarse deliberadamente u ocurrir a partir de la serie de instrucciones anteriores. ¿Con qué frecuencia los compiladores de uso general como gcc realmente usan estas instrucciones (o un subconjunto de las mismas), o son principalmente para ser usadas en un ensamblador codificado a mano? ¿Cómo detecta el compilador dónde es apropiado usar las instrucciones SIMD?¿Cómo usan los compiladores modernos las instrucciones de mmx/3dnow/sse?
Respuesta
Generalmente, pocos compiladores los usan. GCC y Visual Studio generalmente no pueden usar las instrucciones SIMD. Si habilita SSE como un indicador de compilación, utilizará las instrucciones escalares de SSE para las operaciones de punto flotante normales, pero en general, no espere que las vectorizadas se utilicen automáticamente. Las versiones recientes de GCC podrían usarlas en algunos casos, pero no funcionó la última vez que lo intenté. El compilador C++ de Intel es el único gran compilador que conozco capaz de auto-vectorizar algunos bucles.
En general, sin embargo, tendrá que usarlos usted mismo. Ya sea en ensamblador sin formato o mediante el uso de compiladores intrínsecos. En general, diría que los intrínsecos son el mejor enfoque, ya que permiten que el compilador entienda el código, y así programar y optimizar, pero en la práctica, sé que MSVC al menos no siempre genera código muy eficiente desde intrínsecos, tan simple asm puede ser la mejor solución allí. Experimenta, mira lo que funciona. Pero no espere que el compilador use estas instrucciones para usted, a menos que 1) utilice el compilador correcto, y 2) escriba bucles bastante simples que puedan vectorizarse trivialmente.
Actualización 2012
Ok, por lo que han pasado tres años desde que escribí esta respuesta. GCC ha podido autovectar el código (simple) por un par de años, y en VS2012, MSVC finalmente gana la misma capacidad. Por supuesto, la parte principal de mi respuesta aún se aplica: los compiladores solo pueden vectorizar un código bastante trivial. Para algo más complejo, estás atascado jugando con intrinsics o asm en línea.
Probablemente no los usaría si pudiera. Tenga cuidado con las incompatibilidades Intel/AMD. Esto puede ser un consejo obsoleto ahora, o puede que no. No tengo forma de saberlo.
EDIT: obsoleto, probablemente por un tiempo muy largo.
Esa es una razón bastante débil para evitar tales instrucciones. No existirían si no cumplieran un propósito. –
¿Tiene un compilador que hace ambos juegos TURBO? Seguro que no. – Joshua
Esto es simplemente incorrecto, todos los procesadores modernos Intel y AMD, y todos los compiladores modernos (GCC, VS) admiten SSE y MMX. – Zifre
Mono puede usar extensiones SIMD siempre que use sus clases para vectores. Puede leer sobre esto aquí: http://tirania.org/blog/archive/2008/Nov-03.html
GCC debe hacer una vectorización automática siempre que use -O3
o una bandera específica. Tienen una página de información aquí: http://gcc.gnu.org/projects/tree-ssa/vectorization.html
La pregunta de cómo explotar ESS y otras unidades de pequeña vector automáticamente (sin dirección desde el programador en forma de construcciones de lenguaje especiales o "intrínsecos" especialmente benditos compilador) ha sido un tema de investigación del compilador por algún tiempo. La mayoría de los resultados parecen estar especializados para un dominio de problema en particular, como digital signal processing. No me he mantenido al día con la literatura sobre este tema, pero lo que tiene leído sugiere que la explotación de la unidad vectorial (SSE) sigue siendo un tema de investigación, y que uno debe tener pocas expectativas de compiladores de uso general utilizados comúnmente en el campo.
sugerido término de búsqueda: vectorización compilador
Si se utiliza el compilador de Pascal vector obtendrá código SIMD eficiente para este tipo SIMD para los que da una ventaja. Básicamente esto es cualquier cosa de longitud inferior a 64 bits. (para reales de 64 bit, en realidad es más lento hacer SIMD). Las últimas versiones del compilador también se paralelizarán automáticamente a través de los núcleos
real de 64 bits, también conocido como "doble", se beneficia de SIMD en cualquier CPU con SSE2, excepto tal vez Pentium-M/Core Solo donde las operaciones vectoriales 128b se dividieron en dos mitades de 64 bits y las instrucciones multi-uop causan cuellos de botella de decodificación. En cualquier cosa después de Core2 o AMD K10, SIMD es una clara victoria para 'doble' también. –
- 1. ¿Pueden los compiladores de C++ optimizar las instrucciones "if" dentro de los bucles "for"?
- 2. ¿Los compiladores de producción usan generadores de analizadores?
- 3. ¿Cómo determinan los optimizadores de compilación modernos cuándo optimizar?
- 4. Rendimiento de las instrucciones x86 rep en procesadores modernos (pipeline/superscalar)
- 5. ¿Los compiladores modernos optimizan la operación x * 2 a x << 1?
- 6. ¿Cómo se implementan las clases en los compiladores
- 7. Pregunta sobre los compiladores y cómo funcionan
- 8. ¿Qué instrucciones de CPU usan la mayor potencia?
- 9. ¿Los navegadores modernos aún limitan las descargas paralelas?
- 10. Donde las instrucciones SSE superan las instrucciones normales
- 11. ¿Cómo optimizan los compiladores nuestro código?
- 12. ¿Por qué algunas instrucciones ARM no usan barril de cambio?
- 13. ¿Cómo se usan las clases de los archivos .jar?
- 14. compiladores + referencias entre clases: ¿cómo hace javac rápidamente lo que los compiladores C++ hacen lentamente?
- 15. Conectando a los compiladores de Java
- 16. ¿Cómo se usan los marcos de CSS?
- 17. ¿Cuántas páginas de memoria usan los compiladores de C en sistemas operativos de escritorio para detectar desbordamientos de pila?
- 18. ¿Cómo trata SQL Server las instrucciones dentro de los procedimientos almacenados con respecto a las transacciones?
- 19. ¿Los preprocesadores están obsoletos en los idiomas modernos?
- 20. unscope solo las instrucciones de orden
- 21. ¿Cómo implementan los navegadores modernos JS Array, específicamente agregando elementos?
- 22. ¿Los rastreadores web modernos usan el evento click o navegan directamente a href en etiquetas de anclaje?
- 23. Haskell a los compiladores de Javascript?
- 24. Uso de las instrucciones de SSE
- 25. Las variantes se usan recursivamente?
- 26. ¿Cómo se usan las condiciones en las funciones de WiX?
- 27. ¿Las fábricas abstractas usan "nuevo"?
- 28. ¿Cómo se usan las matrices débiles?
- 29. ¿Los compiladores usan automáticamente la semántica de movimiento cuando un objeto movible se usa por última vez?
- 30. modernos C++ juego Ejemplos de programación
¿Se han mejorado los intrínsecos (mucho) en los últimos años? La última vez que revisé, tanto MSVC como ICC tenían una asignación de registro bastante pésima, e incluso yo era capaz de superar fácilmente la versión intrínseca del compilador con un ensamblaje codificado a mano. – snemarch
Creo que las versiones recientes de MSVC han realizado * algunas * mejoras en el código generado por intrínsecos. Pero no sé cuánta diferencia ha hecho. – jalf
La salida de MSVC para SSE escalar es aún terrible, especialmente si usa un intrínseco en cualquier lugar. – Crashworks