Voy a intentar optimizar algún código escrito en MATLAB, usando CUDA. Recientemente comencé a programar CUDA, pero tengo una idea general de cómo funciona.CUDA y MATLAB para la optimización de bucle
Entonces, supongo que quiero agregar dos matrices juntas. En CUDA, podría escribir un algoritmo que utilizaría un hilo para calcular la respuesta para cada elemento en la matriz de resultados. Sin embargo, ¿no es esta técnica probablemente similar a lo que MATLAB ya hace? En ese caso, ¿no sería la eficiencia independiente de la técnica y atribuible solo al nivel de hardware?
Puede ser interesante comparar la solución de The MathWorks con herramientas de terceros y CUDA hechos a mano. http://developer.nvidia.com/object/matlab_cuda.html – zellus