Soy nuevo en la programación de GPGPU y estoy trabajando con la implementación de NVIDIA de OpenCL.¿Cuántos hilos (o elementos de trabajo) se pueden ejecutar al mismo tiempo?
Mi pregunta era cómo calcular el límite de un dispositivo GPU (en número de subprocesos).
Por lo que entendí, hay una cantidad de grupos de trabajo (el equivalente de bloques en CUDA) que contienen una cantidad de elementos de trabajo (~ hilo cuda).
¿Cómo consigo el número de grupo de trabajo presente en mi tarjeta (y que se pueden ejecutar al mismo tiempo) y el número de trabajos ítems presentes en un grupo de trabajo?
¿A qué corresponde CL_DEVICE_MAX_COMPUTE_UNITS?
La especificación khronos speeks de núcleos ("El número de núcleos informáticos paralelos en el dispositivo OpenCL.") Cuál es la diferencia con el núcleo CUDA que figura en la especificación de mi tarjeta gráfica. En mi caso, openCL da 14 y mi GeForce 8800 GT tiene 112 núcleos basados en el sitio web de NVIDIA.¿CL_DEVICE_MAX_WORK_GROUP_SIZE (512 en mi caso) corresponde al total de elementos de trabajo asignados a un grupo de trabajo específico o al número de elementos de trabajo que se pueden ejecutar al mismo tiempo en un grupo de trabajo?
Cualquier sugerencia sería muy apreciada.