Estoy tratando de acelerar algunos cálculos usando OpenCL y parte del algoritmo consiste en invertir una matriz. ¿Existe alguna biblioteca de código abierto o código disponible libremente para calcular la factorización de lu (lapack dgetrf y dgetri) de matriz o inversión general escrita en OpenCL o CUDA? La matriz es real y cuadrada, pero no tiene otras propiedades especiales además de eso. Hasta ahora, he logrado encontrar solo implementaciones básicas de operaciones blas matrix-vector en gpu.Inversión de matriz en OpenCL
La matriz es bastante pequeña, solo alrededor de 60-100 filas y cols, por lo que podría calcularse más rápido en la CPU, pero se usa un poco en el medio del algoritmo, por lo que tendría que transferirlo al host, calcular el inverso, y luego transfiere el resultado nuevamente al dispositivo donde luego se usa en cálculos mucho más grandes.
También debe tener en cuenta que invertir una matriz puede ser una operación costosa, especialmente para matrices grandes, y muy a menudo existe una forma alternativa de resolver el problema. La descomposición de LU es un "bloque de construcción" que se puede usar para evitar hacer una verdadera inversión. – Tom