El tamaño de la memoria compartida ("memoria local" en términos de OpenCL) es de solo 16 KiB en la mayoría de las GPU nVIDIA actuales.
Tengo una aplicación en la que necesito crear una matriz que tiene 10.000 enteros. entonces la cantidad de memoria que necesitaré para encajar 10,000 enteros = 10,000 * 4b = 40kb.El tamaño de la memoria compartida de la GPU es muy pequeño. ¿Qué puedo hacer al respecto?
- ¿Cómo puedo evitar esto?
- ¿Hay alguna GPU que tenga más de 16 KiB de memoria compartida?
+1 A menudo es más fácil usar la memoria global y sólo cuenta con optimizaciones de rendimiento de memoria compartida después de que su código funciona. –