Estoy usando matemáticas 3D en mi aplicación de manera extensiva. ¿Cuánta aceleración puedo lograr al convertir mi biblioteca vectorial/matriz a SSE, AltiVec o un código SIMD similar?
Escribo un código y trato de acelerarlo utilizando SIMD intrinsics SSE2/3. Mi código es de tal naturaleza que necesito cargar algunos datos en un registro XMM y actuar sobre él muchas veces. Cuando mi
Quiero aprender más sobre cómo usar el SSE. ¿De qué maneras hay para aprender, además de la lectura obvia de Intel® 64 and IA-32 Architectures Software Developer's Manuals? Principalmente estoy intere