Estoy haciendo algunos cálculos y haciendo algunos análisis sobre las fuerzas y la debilidad de las diferentes implementaciones de BLAS. sin embargo, he encontrado un problema. Estoy probando cuBlas,
Después de implementar la multiplicación de matrices con CUDA. Intenté implementarlo con CUBLAS (gracias al consejo de algunas personas aquí en el foro). Puedo multiplicar matrices cuadradas pero (sí,
Me pregunto acerca de la biblioteca cuBLAS de NVIDIA. ¿Alguien tiene experiencia con eso? Por ejemplo, si escribo un programa C usando BLAS ¿podré reemplazar las llamadas a BLAS con llamadas a cuBLAS?